Презентация на тему "ИСПОЛЬЗОВАНИЕ МЕТОДОВ Математической статистикидля ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХлекция 2"

Скачать презентацию (0.25 Мб)
19 загрузок
0.0 оценка

Презентация: ИСПОЛЬЗОВАНИЕ МЕТОДОВ Математической статистикидля ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХлекция 2

1 из 56

ВКонтакте Одноклассники Мой Мир Телеграм

Ваша оценка презентации

Оцените презентацию по шкале от 1 до 5 баллов

0.0

0 оценок

Аннотация к презентации

Смотреть презентацию онлайн на тему "ИСПОЛЬЗОВАНИЕ МЕТОДОВ Математической статистикидля ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХлекция 2". Презентация состоит из 56 слайдов. Материал добавлен в 2019 году.. Возможность скчачать презентацию powerpoint бесплатно и без регистрации. Размер файла 0.25 Мб.

Формат

pptx (powerpoint)
Количество слайдов

56
Слова

другое
Конспект

Отсутствует

Содержание

Слайд 1

ИСПОЛЬЗОВАНИЕ МЕТОДОВ Математической статистикидля ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХлекция 2

С. И. Смирнова
Слайд 2
Основные понятия

Статистические гипотезысистематизируют предположения исследователя.
Слайд 3

Статистический критерий – это решающее правило, которое описывает условия принятия истинной гипотезы и отклонения ложной с высокой степенью вероятности. Чтобы подтвердить или опровергнуть гипотезу, надо сравнить эмпирическое (полученное исследователем) и критическое (табличное) значения критерия.
Слайд 4

Уровень статистической значимости– это вероятность того, что мы сочли различия существенными, а они на самом деле случайны. Если говорят, что различия достоверны на 5%-ом уровне значимости, то вероятность того, что они все-таки недостоверны, составляет 0,05. Исторически сложилось, что в педагогических исследованиях принято считать низшим уровнем статистической значимости 5%-ый уровень (р ≤ 0,05), достаточным – 1%-ый уровень (р ≤ 0,01) и высшим – 0,1%-ый уровень (р ≤ 0,001).
Слайд 5

Для облегчения процесса принятия решения об отклонении той или иной гипотезы полезно вычерчивать ось значимости. Зона Зона незначимостиQ0,05 Q0,01значимости … ? Qэмп. ! 6 9 12
Слайд 6
ПРАВИЛА РАНЖИРОВАНИЯ

Меньшему значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1. Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны. Общая сумма рангов должна совпадать с расчетной, которая вычисляется по формуле: Ri= ½ N  (N + 1), где N – общее количество ранжируемых наблюдений. Если суммы не совпадают, необходимо найти ошибку в подсчетах.
Слайд 7

Пример. Даны результаты теста 15 учащихся: 8, 3, 8, 5, 5, 3, 6, 7, 2, 10, 10, 9, 6, 9, 10. Упорядочим эти данные в порядке возрастания (строка 1 в таблице). Пронумеруем их по порядку от 1 до 15 (строка 2). Присвоим каждому значению ранг (строка 3) в соответствии с правилами ранжирования и найдем сумму полученных рангов. Расчетная сумма рангов:  Ri= ½  15  (15 + 1) = ½  15 16 = 120. (Верно!)
Слайд 8
КРИТЕРИИ РАЗЛИЧИЙ

Используются для оценки различий между двумя выборками по уровню какого-либо количественно измеренного признака
Слайд 9
Q – критерий Розенбаума

В каждой выборке должно быть не менее 11 испытуемых. Критерий очень прост в применении. Если Q-критерий выявляет достоверные различия с уровнем значимости p ≤ 0,01, то это позволяет избежать трудностей применения других критериев. Если же Q-критерий не выявляет достоверные различия, то это еще не означает, что их действительно нет. В этом случае необходимо применить более мощный критерий (например, критерий * – угловое преобразование Фишера).
Слайд 10
Графическое представлениекритерия Розенбаума

S1 S2 Принято считать первым рядом тот ряд, в котором значения выше. S1 - количество значений в первом ряду, которые превышают наибольшее значение второго ряда; S2 - количество значений во втором ряду, которые меньше наименьшего значения первого ряда. 1-ый ряд 2-ой ряд
Слайд 11
Ограничения критерия Розенбаума

n1,2 ≥ 11, n1 ≈ n2: если n1,2 ≤ 50,то │n1 – n2│ ≤ 10; если 51 ≤ n1,2 ≤ 100,то │n1 – n2│≤ 20; если n1,2 ≥ 100, то одна из выборок может быть больше другой не более, чем в 1,5-2 раза. Диапазоны разброса не должны совпадать между собой. а) критерий Q беспомощен, б) критерий Q может быть применен
Слайд 12
Подсчет критерия QРозенбаума. Алгоритм.

Проверить выполнимость ограничений. Упорядочить значения отдельно для каждой выборки по степени возрастания признака. Считать выборкой 1 ту, в которой значения предположительно выше. Сформулировать гипотезы. Определить максимальное значение в выборке 2. Подсчитать количество значений в выборке 1, которые выше максимального значения в выборке 2. Обозначить полученную величину s1. Определить самое низкое значение в выборке 1. Подсчитать количество значений в выборке 2, которые ниже минимального значения в выборке 1. Обозначить полученную величину s2. Подсчитать эмпирическое значение Q по формуле Qэмп. = s1 + s2. По таблице определить критическое значение Q для данных n1и n2. Вычертить ось значимости и принять решение.
Слайд 13
Пример подсчета критерия QРозенбаума.

Задача. Можно ли утверждать, что одна из групп превосходит другую по уровню беглости счета?
Слайд 14

Проверим выполнимость ограничений: n1,2 ≥ 11 и n1 ≈ n2. Будем считать выборкой 1 экспериментальную группу, так как в ней значения выше. Сформулируем гипотезы. H0: уровень беглости счета в экспериментальной группе не превосходит уровень беглости счета в контрольной группе. H1: уровень беглости счета в экспериментальной группе превосходит уровень беглости счета в контрольной группе.
Слайд 15
Пример подсчета критерия QРозенбаума

Определим максимальное значение в выборке 2 – 132. Подсчитаем количество значений в выборке 1, которые выше 132: s1 = 5. Определим самое низкое значение в выборке 1 – 121. Подсчитаем количество значений в выборке 2, которые ниже 121: s2 = 6. Подсчитать эмпирическое значение Qэмп.= 5 + 6 = 11. По таблице определим критические значения Q: 7 (p ≤ 0,05) Qкр.= 9 (p ≤ 0,01)
Слайд 16
9. Вычертим ось значимости и сделаем выводы.

Принимается гипотеза H1, то есть учащиеся экспериментальной группы превосходят учащихся контрольной группы по уровню беглости счета с уровнем достоверности 0,01. ЗонаЗона незначимостиQ0,05 Q0,01значимости … ? Qэмп. ! 7 9 11 (Эмпирическое значение Q попало в зону значимости!)
Слайд 17
U – критерий Манна-Уитни

позволяет выявлять различия между малыми выборками (когда n1, n2≥ 3 или n1 = 2, n2 ≥ 5), является более мощным, чем критерий Розенбаума, определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (чем меньше эта зона, тем более вероятно, что различия достоверны).
Слайд 18
Графическое представлениеU-критерия Манна-Уитни

1 ряд 1 ряд 1 ряд 2 ряд 2 ряд 2 ряд а) в) с)
Слайд 19
Алгоритм подсчета критерия U – Манна-Уитни

Расположить все значения в единый ряд по степени нарастания признака, не зависимо от того, к какой выборке они относятся. Проранжировать значения (всего рангов получится n1+n2). Подсчитать сумму рангов отдельно для каждой выборки. Проверить, совпадает ли общая сумма рангов с расчетной. Определить большую из двух ранговых сумм.
Слайд 20

Определить эмпирическое значение U: n1, 2 – количество испытуемых в выборках 1 и 2, Tх – большая из двух ранговых сумм, nх – количество испытуемых в выборке с большей суммой рангов. Определить критические значения U по таблицам. Вычертить ось значимости и принять решение.
Слайд 21
КРИТЕРИИ ИЗМЕНЕНИЙ

Для сопоставления замеров «до» и «после» экспериментального воздействия отдельно по экспериментальной и контрольной группам
Слайд 22
Оценка достоверности сдвига в значениях исследуемого признака

Временной сдвиг – сопоставление показателей у одних и тех же испытуемых по одним и тем же методикам, но в разное время. Ситуационный сдвиг – сопоставление показателей, полученных в разных условиях измерения (например, в условиях «покоя» и «стресса»). Сдвиг под влиянием – сопоставление показателей, полученных до и после экспериментального воздействия (если сдвиги окажутся статистически достоверными, то это позволит утверждать, что воздействия были эффективными).
Слайд 23

Сдвиги, которые кажутся преобладающими, называют типичными. Сдвиги более редкого направления называют нетипичными. Если показатели не изменяются, то сдвиги считают нулевыми (нулевые сдвиги исключают из рассмотрения, число наблюдений уменьшается на число нулевых сдвигов).
Слайд 24
G – критерий знаков

применяется для установления общего направления сдвига исследуемого признака (изменяются в сторону улучшения, повышения или, наоборот, в сторону ухудшения, понижения), применяется к тем сдвигам, которые определены качественно или измерены количественно, определяет, не слишком ли много наблюдается «нетипичных сдвигов», чтобы сдвиг в типичном направлении считать статистически значимым. Количество наблюдений в группе: от 5 до 300. Gэмп. – это количество нетипичных сдвигов (чем меньше Gэмп., тем более вероятно, что сдвиг в типичном направлении статистически достоверен).
Слайд 25
Алгоритм подсчета критерия знаков G

Подсчитать количество нулевых реакций и исключить их из рассмотрения. Определить преобладающее (типичное) направление изменений. Сформулировать гипотезы. Определить число нетипичных сдвигов. Считать это число эмпирическим значением G. Определить по таблицам критические значения G для данного n. Вычертить ось значимости и принять решение.
Слайд 26
Пример подсчета критерия знаков G

Задача. На одной и той же группе учащихся произведены два замера некоторого признака «до обучения» и «после обучения». Можно ли считать обучение эффективным, если результаты таковы:
Слайд 27

Проверим ограничения: n = 10, 5
Слайд 28

Сформулируем гипотезы: H0: Улучшение показателей (сдвиг показателей в типичную сторону) является случайным. H1: Улучшение показателей (сдвиг показателей в типичную сторону) является неслучайным. Найдем Gэмп., оно равно числу нетипичных сдвигов. Gэмп. = 2. Найдем критические значения G для n* = 8. Gкр.(р ≤ 0,05) = 1 и Gкр.(р ≤ 0,01) = 0. Изобразим ось значимости: ! ? … Зона значимости Зона незначимости 0 1 Gэмп Так как Gэмп. >Gкр.(р ≤ 0,05), то H0 принимается, то есть различия случайны.
Слайд 29
Т – критерий Вилкоксона

применяется для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых; позволяет установить не только направленность изменений, но и их выраженность (является ли сдвиг показателей в каком-то одном направлении более интенсивным, чем в другом); эффективен в том случае, если сдвиги между вторым и первым замерами варьируют в достаточно большом диапазоне (если сдвиги изменяются, например, от -35 до +45, то имеет смысл их ранжировать и потом суммировать ранги); количество испытуемых, прошедших измерения в двух условиях, – от 5 до 50 человек.
Слайд 30
Графическое представление критерия Т

а) б) в)
Слайд 31
Алгоритм подсчета критерия Т

Вычислить разность между индивидуальными значениями испытуемых во втором и первом замерах («после» – «до»). Определить типичный сдвиг и сформулировать гипотезы. Найти абсолютные значения разности (модуль) и проранжировать их. Проверить совпадение полученной суммы рангов с расчетной. Отметить сдвиги в «нетипичном» направлении и подсчитать сумму соответствующих им рангов. Присвоить это значение Тэмп.. Определить критические значения Т по таблицам. Начертить ось значимости и сделать выводы.
Слайд 32
Пример подсчета критерия Т

У 11 испытуемых в двух разных условиях были измерены показатели чтения (число слов в минуту): а) в спокойном состоянии, б) при контрольной проверке с внешним проверяющим. Подтвердилась ли гипотеза проверяющего о том, что контрольная ситуация способствует более успешному выполнению задания?
Слайд 33

Вычислим разности между индивидуальными значениями («после» – «до») Сформулируем гипотезы: H0: Интенсивность сдвигов в сторону увеличения количества прочитанных слов не превышает интенсивности сдвигов в сторону его уменьшения. H1: Интенсивность сдвигов в сторону увеличения количества слов превышает интенсивность сдвигов в сторону его уменьшения. Проранжируем абсолютные значения разностей. Найдем сумму рангов: 9 + 4 + 1,5 + 8 + 7 + 5 + 1,5 + 3 + 10 + 6 = 55. Проверим совпадение с расчетной: ∑ Ri = ½ n(n + 1) = ½ ∙ 10 ∙ 11 = 55
Слайд 34

Отметим ранги, соответствующие сдвигам в нетипичном (отрицательном) направлении. Найдем их сумму: Тэмп. = 9 + 8 + 7 + 3 = 27. Для n = 10 найдем критические значения по таблицам:
Слайд 35

Зона Зона Зона значимости неопределенности незначимости 5 10 27 Ткр.(р ≤ 0,01) Ткр.(р ≤ 0,05) Тэмп. Так как Тэмп. >Ткр.(р ≤ 0,05), то H0 подтверждается, то есть интенсивность сдвигов в сторону увеличения количества прочитанных за минуту слов не превышает интенсивности сдвигов в сторону его уменьшения.
Слайд 36
Критерий χr2Фридмана

применяется для сопоставления показателей, измеренных в трех и более условиях на одной и той же выборке испытуемых; эмпирическое значение критерия указывает на то, насколько различаются суммы рангов по разным условиям; ограничения: не менее двух испытуемых, каждый из которых прошел не менее трех замеров. При с = 3 число испытуемых n ≤ 9.
Слайд 37
Алгоритм подсчета критерия χr2Фридмана

Проранжировать индивидуальные значения первого испытуемого, полученные им в первом, втором и т.д. замерах. Проделать тоже самое относительно других испытуемых. Просуммировать ранги по условиям, в которых осуществлялись замеры. Проверить совпадение общей суммы рангов с расчетной по формуле:
Слайд 38

Определить эмпирическое значение по формуле: где с – количество условий, n – количество испытуемых, Тj – суммы рангов по каждому из условий. Определить уровни статистической значимости для χr2эмп. При большем количестве условий или испытуемых определить количество степеней свободы и определить критические значения при данном числе степеней свободы.
Слайд 39
Многофункциональные критерии

Позволяют определить, какая доля испытуемых характеризуется желаемым эффектом, а какая доля этим эффектом не характеризуется
Слайд 40
Критерий φ*Фишера

Позволяет определить, какая доля испытуемых характеризуется желаемым эффектом, а какая этим эффектом не характеризуется. Используется для сопоставления двух выборок по частоте встречаемости интересующего исследователя эффекта Число испытуемых может быть небольшим. Признак может быть измерен качественно или количественно.
Слайд 41
Алгоритм подсчета критерия φ*Фишера

Проверить выполнимость ограничений. Сформулировать гипотезы H0 и H1. Разделить испытуемых на тех, у кого «есть эффект» и тех, у кого «нет эффекта». Начертить четырехклеточную таблицу из двух столбцов и двух строк. Первый столбец – «есть эффект»; второй столбец – «нет эффекта», первая строка сверху – первая группа (выборка); вторая строка – вторая группа. Заполнить таблицу.
Слайд 42

5. Подсчитать сумму по двум верхним ячейкам. Она должна совпадать с количеством испытуемых в первой группе. 6. Подсчитать сумму по двум нижним ячейкам. Она должна совпадать с количеством испытуемых во второй группе. 7. Определить процентные доли испытуемых, у которых «есть эффект», путем отнесения их количества к общему количеству испытуемых в данной группе (выборке). Записать полученные процентные доли соответственно в левой верхней и левой нижней ячейках таблицы в скобках, чтобы не перепутать их с абсолютными значениями.
Слайд 43

8. Проверить, не равняется ли одна из сопоставляемых процентных долей нулю. Если это так, попробовать изменить это, сдвинув точку разделения групп в ту или иную сторону. Если это невозможно, отказаться от критерия φ* и использовать критерий χ2. 9. Определить по таблицам величины углов φ* для каждой из сопоставляемых процентных долей.
Слайд 44

10. Подсчитать φ*эмп. по формуле: * = (1 -2) n1n2 / (n1 + n2), где 1 – угол, соответствующий большей процентной доле, 2– угол, соответствующий меньшей процентной доле 11. Сопоставить полученное значение φ* с критическими значениями. 12. Если φ*эмп. ≥ φ*кр., то Н0 отвергается. 13. При необходимости определить точный уровень значимости полученного φ*эмп. по таблицам.
Слайд 45
Пример подсчета критерия φ*

Сравниваются две группы студентов по успешности решения новой задачи. В первой группе из 20 человек справились с решением задачи 12 человек. Во второй выборке из 25 человек справились с решением задачи 10 человек. Достоверны ли различия по указанному признаку? Будем считать эффектом успех в решении задачи, а отсутствием эффекта — неудачу в ее решении. Сформулируем гипотезы: Н0: Доля студентов, справившихся с задачей, в первой группе не больше, чем во второй. Н1: Доля студентов, справившихся с задачей, в первой группе больше, чем во второй.
Слайд 46

Заполним таблицу: Найдем по таблицам величины углов φ, соответствующие этим процентным долям: φ1 (60%) = 1,772, φ2 (40%) = 1,369. Подсчитаем φ*эмп.
Слайд 47

Начертим ось значимости: φ*0,05 φ*0,01 ... φ*эмп. ? ! 1,34 1,64 2,31 φ*эмп.
Слайд 48
Задача

Пять испытуемых решали анаграммы (КРУА; АЛСТЬ; ИНААМШ). Достоверны ли различия во времени решения испытуемыми анаграмм?
Слайд 49
Пример решения задачи

В группе испытуемых численностью 5 человек проведены 3 замера. Требуется установить наличие изменений от одного замера к другому. Признак измерен количественно. Для решения такой задачи можно воспользоваться критерием изменений χr2Фридмана
Слайд 50

Сформулируем гипотезы: H0: Между временем решения испытуемыми данных диаграмм существуют лишь случайные различия. H1: Между временем решения испытуемыми данных диаграмм существуют неслучайные различия.
Слайд 51

Проранжируеминдивидуальные значения каждого испытуемого, полученные ими во всех замерах. Просуммируем ранги по условиям, в которых осуществлялись замеры.
Слайд 52

Проверим совпадение полученной суммы рангов ∑ Ri = 6 + 15 + 9 = 30 с расчетной:
Слайд 53

Определим эмпирическое значение по формуле: χr2эмп = [12 / (5 ∙ 3 ∙ 4)] ∙ [36 + 225 + 81] – 3 ∙ 5 ∙ 4 = 0,2 ∙ 342 – 60 = 68,4 – 60 = 8,4 Определим уровень статистической значимости для χr2эмп. = 8,4. p = 0,0085. Уровень значимости достаточный, значит, различия неслучайные.
Слайд 54
Слайд 55
ГИПОТЕЗЫ И ОСНОВНЫЕ ФОРМУЛЫ, ИСПОЛЬЗУЕМЫЕ ПРИ ПОДСЧЕТЕ КРИТЕРИЕВ
Слайд 56
Спасибоза внимание!