Содержание
-
Тема 2. Парная линейная регрессионная модель
ПЛРМ
-
Две переменные X и Y
могут быть связаны функциональной зависимостью (т.е. существует функция f что , значения переменной Y полностью определяются значениями переменной X) статистической зависимостью независимы.
-
могут быть связаны функциональной зависимостью (т.е. существует функция f что , значения переменной Y полностью определяются значениями переменной X) статистической зависимостью независимы.
-
могут быть связаны функциональной зависимостью (т.е. существует функция f что , значения переменной Y полностью определяются значениями переменной X) статистической зависимостью независимы.
-
Статистическая зависимость
Если при изменении X меняется закон распределения случайной величины Y, то говорят, что величины (X,Y) связаны статистической зависимостью.
-
Здесь будет красивый рисунок (когда-нибудь)
-
Статистическая зависимость называется корреляционной, если при изменении X меняется математическое ожидание случайной величины Y. Если при изменении переменной Xменяется дисперсия переменной Y, такую зависимость называют гетероскедастичностью. Корреляция и гетерокедастичность могут наблюдаться одновременно
-
Статистическая зависимость называется корреляционной, если при изменении X меняется математическое ожидание случайной величины Y. Если при изменении переменной Xменяется дисперсия переменной Y, такую зависимость называют гетероскедастичностью. Корреляция и гетерокедастичность могут наблюдаться одновременно
-
Статистическая зависимость называется корреляционной, если при изменении X меняется математическое ожидание случайной величины Y. Если при изменении переменной Xменяется дисперсия переменной Y, такую зависимость называют гетероскедастичностью. Корреляция и гетерокедастичность могут наблюдаться одновременно
-
Статистическая зависимость называется корреляционной, если при изменении X меняется математическое ожидание случайной величины Y. Если при изменении переменной Xменяется дисперсия переменной Y, такую зависимость называют гетероскедастичностью. Корреляция и гетерокедастичность могут наблюдаться одновременно
-
Статистическая зависимость называется корреляционной, если при изменении X меняется математическое ожидание случайной величины Y. Если при изменении переменной Xменяется дисперсия переменной Y, такую зависимость называют гетероскедастичностью. Корреляция и гетерокедастичность могут наблюдаться одновременно
-
Статистическая зависимость называется корреляционной, если при изменении X меняется математическое ожидание случайной величины Y. Если при изменении переменной Xменяется дисперсия переменной Y, такую зависимость называют гетероскедастичностью. Корреляция и гетерокедастичность могут наблюдаться одновременно
-
Статистическая зависимость называется корреляционной, если при изменении X меняется математическое ожидание случайной величины Y. Если при изменении переменной Xменяется дисперсия переменной Y, такую зависимость называют гетероскедастичностью. Корреляция и гетерокедастичность могут наблюдаться одновременно
-
Корреляционная зависимость
Если каждому значению величины X соответствует свое значение то говорят, что существует регрессионная функция Линию, которую описывает регрессионная функция, называется линия регрессии
-
Случайная составляющая
Отклонение переменной Y от математического ожидания для соответствующего значения переменной X называется ошибкой и обозначается
-
Регрессионное уравнение
Уравнение называется уравнением регрессии переменной Y на переменную X
-
Компоненты Y
-
Экономический смысл
невключение объясняющих переменных в уравнение. На самом деле на переменную Yвлияет не только переменная X, но и ряд других переменных, которые не учтены в нашей модели по следующим причинам: мы знаем, что другая переменная влияет, но не модем ее учесть, потому как не знаем, как измерить (психологический фактор, например); существуют факторы, которые мы знаем, как измерить, но влияние их на Y так слабо, что их не стоит учитывать; существенные переменные, но из-за отсутствия опыта или знаний мы их таковыми не считаем.
-
Экономический смысл (продолжение)
Неправильная функциональная спецификация. Функциональное соотношение между Yи Х может быть определено неправильно. Например, мы предположили линейную зависимость, а она может быть более сложной. Ошибки наблюдений (занижение реального уровня доходов). В этом случае наблюдаемые значения не будут соответствовать точному соотношению, и существующее расхождение будет вносить свой вклад в остаточный член.
-
Способы определения регрессионной функции f(X)
параметрический – предполагаем, что вид регрессионной функции известен, неизвестны параметры функции непараметрический – предполагаем, что вид регрессионной функции неизвестен и мы составляем алгоритм расчета значений функции в каждой точке
-
Выбор видаf(X)
экономическая теория опыт, интуиция исследователя эмпирический анализ данных
-
Эмпирический анализ данных
В парном случае материал наблюдений представляет собой набор пар чисел: .
-
На плоскости каждому такому наблюдению соответствует точка: Полученный график называют облако наблюдений, поле корреляции или диаграмма рассеяния. По виду облака наблюдений можно определить вид регрессионной функции.
-
Линейная Y=+X+.
-
Квадратичная
-
Показательная
-
Степенная
-
Гиперболическая
-
X и Yнезависимы
-
Парная линейная регрессионная модель Y=+X+.
-
Выбор коэффициентов регрессионной прямой
Из всех возможных прямых мы хотим выбрать ту, чтобы она «наилучшим образом» подходила к нашим данным, т. е. отражала бы линейную зависимость Y от X. Иными словами, чтобы каждое Yi лежало бы как можно ближе к прямой. Можно сказать, мы хотим, чтобы желаемая прямая была бы в центре скопления наших данных.
-
Из всех возможных прямых мы хотим выбрать ту, чтобы она «наилучшим образом» подходила к нашим данным, т. е. отражала бы линейную зависимость Y от X. Иными словами, чтобы каждое Yi лежало бы как можно ближе к прямой. Можно сказать, мы хотим, чтобы желаемая прямая была бы в центре скопления наших данных.
-
Из всех возможных прямых мы хотим выбрать ту, чтобы она «наилучшим образом» подходила к нашим данным, т. е. отражала бы линейную зависимость Y от X. Иными словами, чтобы каждое Yi лежало бы как можно ближе к прямой. Можно сказать, мы хотим, чтобы желаемая прямая была бы в центре скопления наших данных.
-
Из всех возможных прямых мы хотим выбрать ту, чтобы она «наилучшим образом» подходила к нашим данным, т. е. отражала бы линейную зависимость Y от X. Иными словами, чтобы каждое Yi лежало бы как можно ближе к прямой. Можно сказать, мы хотим, чтобы желаемая прямая была бы в центре скопления наших данных.
-
Из всех возможных прямых мы хотим выбрать ту, чтобы она «наилучшим образом» подходила к нашим данным, т. е. отражала бы линейную зависимость Y от X. Иными словами, чтобы каждое Yi лежало бы как можно ближе к прямой. Можно сказать, мы хотим, чтобы желаемая прямая была бы в центре скопления наших данных.
-
Из всех возможных прямых мы хотим выбрать ту, чтобы она «наилучшим образом» подходила к нашим данным, т. е. отражала бы линейную зависимость Y от X. Иными словами, чтобы каждое Yi лежало бы как можно ближе к прямой. Можно сказать, мы хотим, чтобы желаемая прямая была бы в центре скопления наших данных.
-
Из всех возможных прямых мы хотим выбрать ту, чтобы она «наилучшим образом» подходила к нашим данным, т. е. отражала бы линейную зависимость Y от X. Иными словами, чтобы каждое Yi лежало бы как можно ближе к прямой. Можно сказать, мы хотим, чтобы желаемая прямая была бы в центре скопления наших данных.
-
Из всех возможных прямых мы хотим выбрать ту, чтобы она «наилучшим образом» подходила к нашим данным, т. е. отражала бы линейную зависимость Y от X. Иными словами, чтобы каждое Yi лежало бы как можно ближе к прямой. Можно сказать, мы хотим, чтобы желаемая прямая была бы в центре скопления наших данных.
-
Из всех возможных прямых мы хотим выбрать ту, чтобы она «наилучшим образом» подходила к нашим данным, т. е. отражала бы линейную зависимость Y от X. Иными словами, чтобы каждое Yi лежало бы как можно ближе к прямой. Можно сказать, мы хотим, чтобы желаемая прямая была бы в центре скопления наших данных.
-
Из всех возможных прямых мы хотим выбрать ту, чтобы она «наилучшим образом» подходила к нашим данным, т. е. отражала бы линейную зависимость Y от X. Иными словами, чтобы каждое Yi лежало бы как можно ближе к прямой. Можно сказать, мы хотим, чтобы желаемая прямая была бы в центре скопления наших данных.
-
Из всех возможных прямых мы хотим выбрать ту, чтобы она «наилучшим образом» подходила к нашим данным, т. е. отражала бы линейную зависимость Y от X. Иными словами, чтобы каждое Yi лежало бы как можно ближе к прямой. Можно сказать, мы хотим, чтобы желаемая прямая была бы в центре скопления наших данных.
-
Рассмотрение остатков на графике
-
-
Грусть печаль
Метод наименьших квадратов не всегда состоятельный
-
Как найти «наилучшую» прямую аналитически?
Выберем меру близости одной точки к прямой. Построим интегральную меру близости всех точек к прямой, учитывающую меру близости отдельных точек и выберем ту прямую, для которой эта мера близости минимальна.
-
Мера близости одной точки к прямой – остаток.
-
Интегральная мера близости
-
почему бы не минимизировать просто сумму остатков?
-
почему бы не минимизировать просто сумму остатков?
-
почему бы не минимизировать просто сумму остатков?
-
почему бы не минимизировать просто сумму остатков?
-
Метод наименьших квадратов
Среди всех возможных прямых выбираем ту, для которой сумма квадратов остатков минимальна
-
Минимизация
или
-
Система нормальных уравнений
-
МНК-коэффициенты ПЛРМ
- коэффициент наклона - свободный коэффициент
-
Другие формы записи коэффициента наклона
-
Замечания
Линия регрессии проходит через точку Мы предполагаем, что среди Xiесть разные, тогда dX 0. В противном случае, оценок по методу наименьших квадратов не существует.
-
Теснота линейной корреляционной связи
В качестве меры близости данных наблюдений к линии регрессии служит выборочный коэффициент парной линейной корреляции (парный линейный коэффициент корреляции):
-
Вспомним теоретический коэффициент корреляции
-
Связь между коэффициентом корреляции и коэффициентом наклона
Знак коэффициента наклона линии регрессии и коэффициента корреляции совпадают
-
Знак коэффициента наклона линии регрессии и коэффициента корреляции совпадают
-
Знак коэффициента наклона линии регрессии и коэффициента корреляции совпадают
-
Свойства коэффициента корреляции
- необходимое и достаточное условием того, что все наблюдаемые значения (Xi,Yi) лежат на прямой регрессии
-
Свойства коэффициента корреляции (продолжение)
переменные не связаны линейной корреляционной связью. Линия регрессии проходит горизонтально. между переменными существует линейная корреляционная связь, которая тем лучше (ближе к линейной функциональной), чем ближе коэффициент корреляции по модулю к 1
-
Уравнение одно, коэффициенты корреляции разные
Y Y X X Y = 3.0 + 0.8X
-
Вопросы для самопроверки
Что такое функциональная зависимость между переменными. Что такое статистическая зависимость. Что такое корреляционная зависимость. Дайте определение независимых переменных. Что такое линия регрессии. Какова основная идея метода наименьших квадратов. Какие меры близости точек к линии регрессии вы знаете. Почему мы называем расчетные коэффициенты линии регрессии «статистическими оценками». Как выбрать функциональную форму линии регрессии. Форы записи МНК коэффициента наклона регрессионной прямой. В чем заключается экономический смысл случайной составляющей регрессионного уравнения. Для чего нужен коэффициент корреляции. Как связан коэффициент корреляции и коэффициент наклона линии регрессии. Перечислите свойства коэффициента корреляции. В каком случае линии регрессии по методу наименьших квадратов не существует.
Нет комментариев для данной презентации
Помогите другим пользователям — будьте первым, кто поделится своим мнением об этой презентации.