Содержание
-
Оценка статистической значимости коэффициентов регрессии и уравнения в целом
-
Большинство эконометрических моделей требуют многократного улучшения и уточнения. Для этого необходимо проведение соответствующих расчетов, связанных: с установлением выполнимости или невыполнимости тех или иных предпосылок;
-
анализом качества найденных оценок; достоверностью полученных выводов. Обычно эти расчеты проводятся по схеме статистической проверки гипотез.
-
Статистической называют гипотезу о виде закона распределения или о параметрах известного распределения. В первом случае гипотеза называется непараметрической, а во втором – параметрической.
-
Гипотеза Н0, подлежащая проверке, называется нулевой (основной). Наряду с нулевой рассматривают гипотезу Н1, которая будет приниматься, если отклоняется Н0.
-
Такая гипотеза называется альтернативной (конкурирующей). Сущность проверки статистической гипотезы заключается в том, чтобы установить, согласуются или нет данные наблюдений и выдвинутая гипотеза.
-
Эта задача решается с помощью специальных методов математической статистики – методов статистической проверки гипотез.
-
При проверке гипотезы выборочные данные могут противоречить гипотезе Н0. Тогда она отклоняется. Если же статистические данные согласуются с выдвинутой гипотезой, то она не отклоняется.
-
Статистическая проверка гипотез на основании выборочных данных неизбежно связана с риском принятия ложного решения. При этом возможны ошибки двух родов.
-
Ошибка первого рода состоит в том, что будет отвергнута правильная нулевая гипотеза. Ошибка второго рода состоит в том, что будет принята нулевая гипотеза, в то время как в действительности верна альтернативная гипотеза.
-
-
Последствия указанных ошибок неравнозначны. Первая приводит к более осторожному, консервативному решению, вторая – к неоправданному риску. Что лучше или хуже – зависит от конкретной постановки задачи и содержания нулевой гипотезы.
-
Например, если Н0 состоит в признании продукции предприятия качественной и допущена ошибка первого рода, то будет забракована годная продукция.
-
Очевидно, последствия второй ошибки более серьезны с точки зрения имиджа фирмы и ее долгосрочных перспектив. Допустив ошибку второго рода, мы отправим потребителю брак.
-
Исключить ошибки первого и второго рода невозможно в силу ограниченности выборки. Поэтому стремятся минимизировать потери от этих ошибок.
-
При этом одновременное уменьшение вероятностей данных ошибок невозможно, так как задачи их уменьшения являются конкурирующими. Снижение вероятности допустить одну из них влечет за собой увеличение вероятности допустить другую.
-
Вероятность совершить ошибку первого рода принято обозначать буквой α, и ее называют уровнем значимости.
-
Обычно значения α задают заранее (например, 0,1; 0,05; 0,01 и т.д.) Если α = 0,05, то это означает, что исследователь не хочет совершить ошибку первого рода более чем в 5 случаях из 100.
-
Проверку статистической гипотезы осуществляют на основании данных выборки. Для этого используют специально подобранную случайную величину (статистику, критерий), точное или приближенное значение которой известно.
-
t - случайная величина распределена по закону Стьюдента; F - случайная величина распределена по закону Фишера.
-
После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества:
-
2. содержит значения критерия, при которых она не отклоняется. содержит значения критерия, при которых нулевая гипотеза отклоняется
-
Совокупность значений критерия, при которых нулевую гипотезу отклоняют, называют критической областью. Совокупность значений критерия, при которых нулевую гипотезу не отклоняют, называют областью принятия гипотезы.
-
Основной принцип проверки статистических гипотез можно сформулировать так:
-
если наблюдаемое значение критерия (вычисленное по выборке) принадлежит критической области, то нулевую гипотезу отклоняют. если же наблюдаемое значение критерия принадлежит области принятия гипотезы, то нулевую гипотезу не отклоняют.
-
Точки, разделяющие критическую область и область принятия гипотезы, называют критическими. В основу определения критических точек и критической области положен принцип практической невозможности маловероятных событий.
-
Общая схема проверки гипотез: 3. Выбор критерия для проверки Н0. 2. Выбор соответствующего уровня значимости α. 1. Формулировка проверяемой (нулевой – Н0) и альтернативной (Н1) гипотез.
-
6. Принятие статистического решения. 5. Вычисление наблюдаемого значения (фактического) критерия. 4. Определение критической области и области принятия гипотезы.
-
Эмпирическое уравнение регрессии определяется на основе конечного числа статистических данных. Коэффициенты эмпирического уравнения регрессии являются случайными величинами, изменяющимися от выборки к выборке.
-
При проведении статистического анализа перед исследователем возникает необходимость сравнения эмпирических коэффициентов регрессии aи b с некоторыми теоретически ожидаемыми значениями α и β этих коэффициентов.
-
Выдвигается ноль-гипотеза: Альтернативная гипотеза: коэффициент регрессии статистически незначим коэффициент регрессии статистически значим
-
Статистическая значимость коэффициента регрессии проверяется с помощью t-критерия Стьюдента.
-
Для этого сначала необходимо определить остаточную сумму квадратов:
-
Ее среднее квадратическое отклонение:
-
Затем определяется стандартная ошибка коэффициента регрессии
-
Фактическое значение t-критерия Стьюдента для коэффициента регрессии рассчитывается как:
-
Критическое значение t-статистики определяется из таблицы распределения данной случайной величины при заданном уровне значимости α и числе степеней свободы (n-2), где n – размер выборки.
-
Если tb>tкр, то нулевая гипотеза отвергается и принимается альтернативная гипотеза о статистической значимости коэффициента регрессии с вероятностью (1- α)
-
В противном случае, говорят, что «нет оснований отвергать нулевую гипотезу»: коэффициент регрессии статистически незначим.
-
По аналогичной схеме на основании t-статистики проверяется гипотеза о статистической значимости коэффициента а.
-
Для парной регрессии более важным является анализ статистической значимости коэффициента b, так как именно в нем скрыто влияние объясняющей переменной Х на зависимую переменную Y.
-
Можно построить доверительный интервал для b:
-
Доверительный интервал накрывает истинное значение параметра b с заданной вероятностью (если α=0,05, то с вероятностью в 95%).
-
Оценка статистической значимости постороенной модели регрессии в целом производится с помощью F-критерия Фишера. В качестве нулевой гипотезы используется утверждение о незначимости коэффициента детерминации: ,
-
Соответственно, альтернативная гипотеза - коэффициент детерминации статистически значим:
-
Фактическое значение F-критерия для уравнения парной регрессии, линейной по параметрам определяется как:
-
Фактическое значение сравнивается с табличным значением случайной величины, распределенной по закону Фишера. Если Fфактич. > Fкрит., то нулевая гипотеза о незначимости коэффициента детерминации отвергается
-
и принимается альтернативная гипотеза – коэффициент детерминации статистически значим. В противном случае, нулевая гипотеза не отвергается.
Нет комментариев для данной презентации
Помогите другим пользователям — будьте первым, кто поделится своим мнением об этой презентации.