Содержание
-
ИСПОЛЬЗОВАНИЕ МЕТОДОВ Математической статистикидля ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХлекция 2
С. И. Смирнова
-
Основные понятия
Статистические гипотезысистематизируют предположения исследователя.
-
Статистический критерий – это решающее правило, которое описывает условия принятия истинной гипотезы и отклонения ложной с высокой степенью вероятности. Чтобы подтвердить или опровергнуть гипотезу, надо сравнить эмпирическое (полученное исследователем) и критическое (табличное) значения критерия.
-
Уровень статистической значимости– это вероятность того, что мы сочли различия существенными, а они на самом деле случайны. Если говорят, что различия достоверны на 5%-ом уровне значимости, то вероятность того, что они все-таки недостоверны, составляет 0,05. Исторически сложилось, что в педагогических исследованиях принято считать низшим уровнем статистической значимости 5%-ый уровень (р ≤ 0,05), достаточным – 1%-ый уровень (р ≤ 0,01) и высшим – 0,1%-ый уровень (р ≤ 0,001).
-
Для облегчения процесса принятия решения об отклонении той или иной гипотезы полезно вычерчивать ось значимости. Зона Зона незначимостиQ0,05 Q0,01значимости … ? Qэмп. ! 6 9 12
-
ПРАВИЛА РАНЖИРОВАНИЯ
Меньшему значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1. Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны. Общая сумма рангов должна совпадать с расчетной, которая вычисляется по формуле: Ri= ½ N (N + 1), где N – общее количество ранжируемых наблюдений. Если суммы не совпадают, необходимо найти ошибку в подсчетах.
-
Пример. Даны результаты теста 15 учащихся: 8, 3, 8, 5, 5, 3, 6, 7, 2, 10, 10, 9, 6, 9, 10. Упорядочим эти данные в порядке возрастания (строка 1 в таблице). Пронумеруем их по порядку от 1 до 15 (строка 2). Присвоим каждому значению ранг (строка 3) в соответствии с правилами ранжирования и найдем сумму полученных рангов. Расчетная сумма рангов: Ri= ½ 15 (15 + 1) = ½ 15 16 = 120. (Верно!)
-
КРИТЕРИИ РАЗЛИЧИЙ
Используются для оценки различий между двумя выборками по уровню какого-либо количественно измеренного признака
-
Q – критерий Розенбаума
В каждой выборке должно быть не менее 11 испытуемых. Критерий очень прост в применении. Если Q-критерий выявляет достоверные различия с уровнем значимости p ≤ 0,01, то это позволяет избежать трудностей применения других критериев. Если же Q-критерий не выявляет достоверные различия, то это еще не означает, что их действительно нет. В этом случае необходимо применить более мощный критерий (например, критерий * – угловое преобразование Фишера).
-
Графическое представлениекритерия Розенбаума
S1 S2 Принято считать первым рядом тот ряд, в котором значения выше. S1 - количество значений в первом ряду, которые превышают наибольшее значение второго ряда; S2 - количество значений во втором ряду, которые меньше наименьшего значения первого ряда. 1-ый ряд 2-ой ряд
-
Ограничения критерия Розенбаума
n1,2 ≥ 11, n1 ≈ n2: если n1,2 ≤ 50,то │n1 – n2│ ≤ 10; если 51 ≤ n1,2 ≤ 100,то │n1 – n2│≤ 20; если n1,2 ≥ 100, то одна из выборок может быть больше другой не более, чем в 1,5-2 раза. Диапазоны разброса не должны совпадать между собой. а) критерий Q беспомощен, б) критерий Q может быть применен
-
Подсчет критерия QРозенбаума. Алгоритм.
Проверить выполнимость ограничений. Упорядочить значения отдельно для каждой выборки по степени возрастания признака. Считать выборкой 1 ту, в которой значения предположительно выше. Сформулировать гипотезы. Определить максимальное значение в выборке 2. Подсчитать количество значений в выборке 1, которые выше максимального значения в выборке 2. Обозначить полученную величину s1. Определить самое низкое значение в выборке 1. Подсчитать количество значений в выборке 2, которые ниже минимального значения в выборке 1. Обозначить полученную величину s2. Подсчитать эмпирическое значение Q по формуле Qэмп. = s1 + s2. По таблице определить критическое значение Q для данных n1и n2. Вычертить ось значимости и принять решение.
-
Пример подсчета критерия QРозенбаума.
Задача. Можно ли утверждать, что одна из групп превосходит другую по уровню беглости счета?
-
Проверим выполнимость ограничений: n1,2 ≥ 11 и n1 ≈ n2. Будем считать выборкой 1 экспериментальную группу, так как в ней значения выше. Сформулируем гипотезы. H0: уровень беглости счета в экспериментальной группе не превосходит уровень беглости счета в контрольной группе. H1: уровень беглости счета в экспериментальной группе превосходит уровень беглости счета в контрольной группе.
-
Пример подсчета критерия QРозенбаума
Определим максимальное значение в выборке 2 – 132. Подсчитаем количество значений в выборке 1, которые выше 132: s1 = 5. Определим самое низкое значение в выборке 1 – 121. Подсчитаем количество значений в выборке 2, которые ниже 121: s2 = 6. Подсчитать эмпирическое значение Qэмп.= 5 + 6 = 11. По таблице определим критические значения Q: 7 (p ≤ 0,05) Qкр.= 9 (p ≤ 0,01)
-
9. Вычертим ось значимости и сделаем выводы.
Принимается гипотеза H1, то есть учащиеся экспериментальной группы превосходят учащихся контрольной группы по уровню беглости счета с уровнем достоверности 0,01. ЗонаЗона незначимостиQ0,05 Q0,01значимости … ? Qэмп. ! 7 9 11 (Эмпирическое значение Q попало в зону значимости!)
-
U – критерий Манна-Уитни
позволяет выявлять различия между малыми выборками (когда n1, n2≥ 3 или n1 = 2, n2 ≥ 5), является более мощным, чем критерий Розенбаума, определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (чем меньше эта зона, тем более вероятно, что различия достоверны).
-
Графическое представлениеU-критерия Манна-Уитни
1 ряд 1 ряд 1 ряд 2 ряд 2 ряд 2 ряд а) в) с)
-
Алгоритм подсчета критерия U – Манна-Уитни
Расположить все значения в единый ряд по степени нарастания признака, не зависимо от того, к какой выборке они относятся. Проранжировать значения (всего рангов получится n1+n2). Подсчитать сумму рангов отдельно для каждой выборки. Проверить, совпадает ли общая сумма рангов с расчетной. Определить большую из двух ранговых сумм.
-
Определить эмпирическое значение U: n1, 2 – количество испытуемых в выборках 1 и 2, Tх – большая из двух ранговых сумм, nх – количество испытуемых в выборке с большей суммой рангов. Определить критические значения U по таблицам. Вычертить ось значимости и принять решение.
-
КРИТЕРИИ ИЗМЕНЕНИЙ
Для сопоставления замеров «до» и «после» экспериментального воздействия отдельно по экспериментальной и контрольной группам
-
Оценка достоверности сдвига в значениях исследуемого признака
Временной сдвиг – сопоставление показателей у одних и тех же испытуемых по одним и тем же методикам, но в разное время. Ситуационный сдвиг – сопоставление показателей, полученных в разных условиях измерения (например, в условиях «покоя» и «стресса»). Сдвиг под влиянием – сопоставление показателей, полученных до и после экспериментального воздействия (если сдвиги окажутся статистически достоверными, то это позволит утверждать, что воздействия были эффективными).
-
Сдвиги, которые кажутся преобладающими, называют типичными. Сдвиги более редкого направления называют нетипичными. Если показатели не изменяются, то сдвиги считают нулевыми (нулевые сдвиги исключают из рассмотрения, число наблюдений уменьшается на число нулевых сдвигов).
-
G – критерий знаков
применяется для установления общего направления сдвига исследуемого признака (изменяются в сторону улучшения, повышения или, наоборот, в сторону ухудшения, понижения), применяется к тем сдвигам, которые определены качественно или измерены количественно, определяет, не слишком ли много наблюдается «нетипичных сдвигов», чтобы сдвиг в типичном направлении считать статистически значимым. Количество наблюдений в группе: от 5 до 300. Gэмп. – это количество нетипичных сдвигов (чем меньше Gэмп., тем более вероятно, что сдвиг в типичном направлении статистически достоверен).
-
Алгоритм подсчета критерия знаков G
Подсчитать количество нулевых реакций и исключить их из рассмотрения. Определить преобладающее (типичное) направление изменений. Сформулировать гипотезы. Определить число нетипичных сдвигов. Считать это число эмпирическим значением G. Определить по таблицам критические значения G для данного n. Вычертить ось значимости и принять решение.
-
Пример подсчета критерия знаков G
Задача. На одной и той же группе учащихся произведены два замера некоторого признака «до обучения» и «после обучения». Можно ли считать обучение эффективным, если результаты таковы:
-
Проверим ограничения: n = 10, 5
-
Сформулируем гипотезы: H0: Улучшение показателей (сдвиг показателей в типичную сторону) является случайным. H1: Улучшение показателей (сдвиг показателей в типичную сторону) является неслучайным. Найдем Gэмп., оно равно числу нетипичных сдвигов. Gэмп. = 2. Найдем критические значения G для n* = 8. Gкр.(р ≤ 0,05) = 1 и Gкр.(р ≤ 0,01) = 0. Изобразим ось значимости: ! ? … Зона значимости Зона незначимости 0 1 Gэмп Так как Gэмп. >Gкр.(р ≤ 0,05), то H0 принимается, то есть различия случайны.
-
Т – критерий Вилкоксона
применяется для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых; позволяет установить не только направленность изменений, но и их выраженность (является ли сдвиг показателей в каком-то одном направлении более интенсивным, чем в другом); эффективен в том случае, если сдвиги между вторым и первым замерами варьируют в достаточно большом диапазоне (если сдвиги изменяются, например, от -35 до +45, то имеет смысл их ранжировать и потом суммировать ранги); количество испытуемых, прошедших измерения в двух условиях, – от 5 до 50 человек.
-
Графическое представление критерия Т
а) б) в)
-
Алгоритм подсчета критерия Т
Вычислить разность между индивидуальными значениями испытуемых во втором и первом замерах («после» – «до»). Определить типичный сдвиг и сформулировать гипотезы. Найти абсолютные значения разности (модуль) и проранжировать их. Проверить совпадение полученной суммы рангов с расчетной. Отметить сдвиги в «нетипичном» направлении и подсчитать сумму соответствующих им рангов. Присвоить это значение Тэмп.. Определить критические значения Т по таблицам. Начертить ось значимости и сделать выводы.
-
Пример подсчета критерия Т
У 11 испытуемых в двух разных условиях были измерены показатели чтения (число слов в минуту): а) в спокойном состоянии, б) при контрольной проверке с внешним проверяющим. Подтвердилась ли гипотеза проверяющего о том, что контрольная ситуация способствует более успешному выполнению задания?
-
Вычислим разности между индивидуальными значениями («после» – «до») Сформулируем гипотезы: H0: Интенсивность сдвигов в сторону увеличения количества прочитанных слов не превышает интенсивности сдвигов в сторону его уменьшения. H1: Интенсивность сдвигов в сторону увеличения количества слов превышает интенсивность сдвигов в сторону его уменьшения. Проранжируем абсолютные значения разностей. Найдем сумму рангов: 9 + 4 + 1,5 + 8 + 7 + 5 + 1,5 + 3 + 10 + 6 = 55. Проверим совпадение с расчетной: ∑ Ri = ½ n(n + 1) = ½ ∙ 10 ∙ 11 = 55
-
Отметим ранги, соответствующие сдвигам в нетипичном (отрицательном) направлении. Найдем их сумму: Тэмп. = 9 + 8 + 7 + 3 = 27. Для n = 10 найдем критические значения по таблицам:
-
Зона Зона Зона значимости неопределенности незначимости 5 10 27 Ткр.(р ≤ 0,01) Ткр.(р ≤ 0,05) Тэмп. Так как Тэмп. >Ткр.(р ≤ 0,05), то H0 подтверждается, то есть интенсивность сдвигов в сторону увеличения количества прочитанных за минуту слов не превышает интенсивности сдвигов в сторону его уменьшения.
-
Критерий χr2Фридмана
применяется для сопоставления показателей, измеренных в трех и более условиях на одной и той же выборке испытуемых; эмпирическое значение критерия указывает на то, насколько различаются суммы рангов по разным условиям; ограничения: не менее двух испытуемых, каждый из которых прошел не менее трех замеров. При с = 3 число испытуемых n ≤ 9.
-
Алгоритм подсчета критерия χr2Фридмана
Проранжировать индивидуальные значения первого испытуемого, полученные им в первом, втором и т.д. замерах. Проделать тоже самое относительно других испытуемых. Просуммировать ранги по условиям, в которых осуществлялись замеры. Проверить совпадение общей суммы рангов с расчетной по формуле:
-
Определить эмпирическое значение по формуле: где с – количество условий, n – количество испытуемых, Тj – суммы рангов по каждому из условий. Определить уровни статистической значимости для χr2эмп. При большем количестве условий или испытуемых определить количество степеней свободы и определить критические значения при данном числе степеней свободы.
-
Многофункциональные критерии
Позволяют определить, какая доля испытуемых характеризуется желаемым эффектом, а какая доля этим эффектом не характеризуется
-
Критерий φ*Фишера
Позволяет определить, какая доля испытуемых характеризуется желаемым эффектом, а какая этим эффектом не характеризуется. Используется для сопоставления двух выборок по частоте встречаемости интересующего исследователя эффекта Число испытуемых может быть небольшим. Признак может быть измерен качественно или количественно.
-
Алгоритм подсчета критерия φ*Фишера
Проверить выполнимость ограничений. Сформулировать гипотезы H0 и H1. Разделить испытуемых на тех, у кого «есть эффект» и тех, у кого «нет эффекта». Начертить четырехклеточную таблицу из двух столбцов и двух строк. Первый столбец – «есть эффект»; второй столбец – «нет эффекта», первая строка сверху – первая группа (выборка); вторая строка – вторая группа. Заполнить таблицу.
-
5. Подсчитать сумму по двум верхним ячейкам. Она должна совпадать с количеством испытуемых в первой группе. 6. Подсчитать сумму по двум нижним ячейкам. Она должна совпадать с количеством испытуемых во второй группе. 7. Определить процентные доли испытуемых, у которых «есть эффект», путем отнесения их количества к общему количеству испытуемых в данной группе (выборке). Записать полученные процентные доли соответственно в левой верхней и левой нижней ячейках таблицы в скобках, чтобы не перепутать их с абсолютными значениями.
-
8. Проверить, не равняется ли одна из сопоставляемых процентных долей нулю. Если это так, попробовать изменить это, сдвинув точку разделения групп в ту или иную сторону. Если это невозможно, отказаться от критерия φ* и использовать критерий χ2. 9. Определить по таблицам величины углов φ* для каждой из сопоставляемых процентных долей.
-
10. Подсчитать φ*эмп. по формуле: * = (1 -2) n1n2 / (n1 + n2), где 1 – угол, соответствующий большей процентной доле, 2– угол, соответствующий меньшей процентной доле 11. Сопоставить полученное значение φ* с критическими значениями. 12. Если φ*эмп. ≥ φ*кр., то Н0 отвергается. 13. При необходимости определить точный уровень значимости полученного φ*эмп. по таблицам.
-
Пример подсчета критерия φ*
Сравниваются две группы студентов по успешности решения новой задачи. В первой группе из 20 человек справились с решением задачи 12 человек. Во второй выборке из 25 человек справились с решением задачи 10 человек. Достоверны ли различия по указанному признаку? Будем считать эффектом успех в решении задачи, а отсутствием эффекта — неудачу в ее решении. Сформулируем гипотезы: Н0: Доля студентов, справившихся с задачей, в первой группе не больше, чем во второй. Н1: Доля студентов, справившихся с задачей, в первой группе больше, чем во второй.
-
Заполним таблицу: Найдем по таблицам величины углов φ, соответствующие этим процентным долям: φ1 (60%) = 1,772, φ2 (40%) = 1,369. Подсчитаем φ*эмп.
-
Начертим ось значимости: φ*0,05 φ*0,01 ... φ*эмп. ? ! 1,34 1,64 2,31 φ*эмп.
-
Задача
Пять испытуемых решали анаграммы (КРУА; АЛСТЬ; ИНААМШ). Достоверны ли различия во времени решения испытуемыми анаграмм?
-
Пример решения задачи
В группе испытуемых численностью 5 человек проведены 3 замера. Требуется установить наличие изменений от одного замера к другому. Признак измерен количественно. Для решения такой задачи можно воспользоваться критерием изменений χr2Фридмана
-
Сформулируем гипотезы: H0: Между временем решения испытуемыми данных диаграмм существуют лишь случайные различия. H1: Между временем решения испытуемыми данных диаграмм существуют неслучайные различия.
-
Проранжируеминдивидуальные значения каждого испытуемого, полученные ими во всех замерах. Просуммируем ранги по условиям, в которых осуществлялись замеры.
-
Проверим совпадение полученной суммы рангов ∑ Ri = 6 + 15 + 9 = 30 с расчетной:
-
Определим эмпирическое значение по формуле: χr2эмп = [12 / (5 ∙ 3 ∙ 4)] ∙ [36 + 225 + 81] – 3 ∙ 5 ∙ 4 = 0,2 ∙ 342 – 60 = 68,4 – 60 = 8,4 Определим уровень статистической значимости для χr2эмп. = 8,4. p = 0,0085. Уровень значимости достаточный, значит, различия неслучайные.
-
-
ГИПОТЕЗЫ И ОСНОВНЫЕ ФОРМУЛЫ, ИСПОЛЬЗУЕМЫЕ ПРИ ПОДСЧЕТЕ КРИТЕРИЕВ
-
Спасибоза внимание!
Нет комментариев для данной презентации
Помогите другим пользователям — будьте первым, кто поделится своим мнением об этой презентации.