Презентация на тему "Достовірність різниць середніх і перевірка зв'язку між змінними лекції"

Презентация: Достовірність різниць середніх і перевірка зв'язку між змінними лекції
Включить эффекты
1 из 37
Ваша оценка презентации
Оцените презентацию по шкале от 1 до 5 баллов
  • 1
  • 2
  • 3
  • 4
  • 5
5.0
1 оценка

Комментарии

Нет комментариев для данной презентации

Помогите другим пользователям — будьте первым, кто поделится своим мнением об этой презентации.


Добавить свой комментарий

Аннотация к презентации

Смотреть презентацию онлайн с анимацией на тему "Достовірність різниць середніх і перевірка зв'язку між змінними лекції" по психологии. Презентация состоит из 37 слайдов. Для студентов. Материал добавлен в 2017 году. Средняя оценка: 5.0 балла из 5.. Возможность скчачать презентацию powerpoint бесплатно и без регистрации. Размер файла 1.09 Мб.

  • Формат
    pptx (powerpoint)
  • Количество слайдов
    37
  • Слова
    другое
  • Конспект
    Отсутствует

Содержание

  • Презентация: Достовірність різниць середніх і перевірка зв'язку між змінними лекції
    Слайд 1

    ДОСТОВІРНІСТЬ РІЗНИЦЬ СЕРЕДНІХТА ПЕРЕВІРКА ЗВ’ЯЗКУ МІЖ ЗМІННИМИ ЛЕКЦІЯ 5 Мета: Навчальна: Навчитися встановлювати достовірність різниць між середніми показниками вибірок та виявляти наявність можливих зв’язків між змінними. Розвиваюча: Удосконалити навички первинного аналізу даних. Виховна: Виховати уміння робити аналітико-логічні висновки. План Параметричні критерії перевірки гіпотез про середні і дисперсії; критерій Фішера, t-критерій Стьюдента. Непараметричні критерії перевірки достовірності різниць; поняття рангів, критерій Уілкоксона, критерій Манна-Уітні. Параметрична кореляція (коефіцієнт кореляції Пірсона). Поняття про приватну кореляцію. Непараметричні методи кореляції (коефіцієнт кореляції Спірмена).

  • Слайд 2

    Питання для самостійного опрацювання Аналіз однорідності дисперсій за Кохреном. Критерій Бартлета. Критерій знаків. Критерій Зігеля-Тьюкі. КритерійКракскела-Уоліса. Коефіцієнт кореляції Кендала. Конкордація Кендала. Перевірка рівності декількох середніх та фактору впливу на змінні методом дисперсійного аналізу. Таблиці спряження.

  • Слайд 3

    Параметричні критерії перевірки гіпотез про середні і дисперсії Параметричними називаються такі методи дослідження, у яких усі дані, що входять до вибірок чи генеральних сукупностей попадають під закон нормального розподілу. При параметричних методах дослідження оперують та порівнюють між собою, в основному, показники дисперсій (або середньоквадратичних відхилень) та середньоарифметичні значення (також використовують інші середні величини: геометричні, гармонійні, квадратичні та кубічні).

  • Слайд 4

    Критерій Фішера - обов’язково повинно бути більше одиниці Тому, або на початку більшу дисперсію ділять на меншу, або якщо результат уже відомий і він менший від одиниці (наприклад 0,843), то одиницю ділять на результат (в нашому випадку 1/0,843). Критичне значення критерію Фішера перевіряють за спеціальними таблицями. Причому для перевірки беруться ступені вільності чисельника і знаменника окремо (nчис-1, nзнам-1). Якщо розрахункове (емпіричне) значення критерію Фішера (при заданому ступені вірогідності ) більше за табличне (критичне), то дисперсії різні.

  • Слайд 5

    Приклад. Дисперсія такого показника як стресостійкість для учителя фізкультури в школі складала 6,17 (n1=32), а для спортивного менеджера 4,41 (n2=33). Дані в обох вибірках попадали під закон нормального розподілу. Чи можна вважати, що рівень дисперсій у них приблизно однаковий? Розв’язок. Нульова гіпотеза. Дисперсії вибірок не відрізняються. Визначаємо емпіричне (розрахункове) значення критерію за Фішером. Перевіривши критичне значення за таблицею побачимо, що при рівні значимості 0,05 критичним значенням для даних вибірок з відповідними ступенями вільності (n1-1=31 та n2-1=32) буде Fкр.(0,05; 31; 32)=1,81. Таким чином, Fемп.

  • Слайд 6

    t-критерій Стьюдента Особливості застосування: Усі вибірки мають нормальний розподіл Якщо застосовується t-критерій Стьюдента для незалежних вибірок, то потрібно, щоб дисперсії були рівними. Потрібно враховувати розмір та співвідношення розмірів вибірок. Випадки, які потрібно враховувати: Об’єм вибірки обидві групи великі (n>30) обидві групи малі (n

  • Слайд 7

    Для незалежних вибірок та рівних дисперсій (гомоскедастичний тест) Для 2-х великих, або великої та малої вибірок: або де: та - середні арифметичні 1-ї та 2-ї вибірок - дисперсії 1-ї та 2-ї вибірок та - похибки середніх арифметичних 1-ї та 2-ї вибірок та та - об’єми 1-ї та 2-ї вибірок Критичне значення t-критерію Стьюдента перевіряють за спеціальними таблицями. Для перевірки беруться ступені вільності, які розраховуються за формулою: k=n1+n2-2, або k=n1-1+n2-1. Якщо розрахункове (емпіричне) значення t-критерію Стьюдента(при заданому ступені вірогідності ) більше за табличне (критичне) то середні різні.

  • Слайд 8

    Для 2-х малих вибірок:   де: та - середні арифметичні 1-ї та 2-ї вибірок - дисперсії 1-ї та 2-ї вибірок та та - об’єми 1-ї та 2-ї вибірок та- кожне із значень 1-ї та 2-ї вибірок   Критичне значення t-критерію Стьюдента перевіряють за спеціальними таблицями. Для перевірки беруться ступені вільності, які розраховуються за формулою: k=n1+n2-2, або k=n1-1+n2-1. Якщо розрахункове (емпіричне) значення t-критерію Стьюдента(при заданому ступені вірогідності ) більше за табличне (критичне) то середні різні.

  • Слайд 9

    Для залежних вибірок без уяви про дисперсії Даний критерій досить точний і може застосовуватися як для великих так і малих за розміром вибірок   та - середні арифметичні 1-ї та 2-ї вибірок - дисперсії 1-ї та 2-ї вибірок та та - об’єми 1-ї та 2-ї вибірок та- кожне із значень 1-ї та 2-ї вибірок   де: Критичне значення t-критерію Стьюдента перевіряють за спеціальними таблицями. Для перевірки беруться ступені вільності, які розраховуються за формулою: k=n1+n2-2, або k=n1-1+n2-1 . Якщо розрахункове (емпіричне) значення t-критерію Стьюдента(при заданому ступені вірогідності ) більше за табличне (критичне) то середні різні.

  • Слайд 10

    Для незалежних вибірок нерівних дисперсій (гетероскедастичний тест) На даний момент даний вид порівняння середніх має лише наближене вирішення і в математиці називається проблемою Беренса-Фішера. Можна наближено застосувати формулу (як і для рівних дисперсій): де: та - середні арифметичні 1-ї та 2-ї вибірок - дисперсії 1-ї та 2-ї вибірок та - похибки середніх арифметичних 1-ї та 2-ї вибірок та та - об’єми 1-ї та 2-ї вибірок або Критичне значення t-критерію Стьюдента перевіряють за спеціальними таблицями. Для перевірки беруться ступені вільності, які розраховуються за формулою: k=. Якщо розрахункове (емпіричне) значення t-критерію Стьюдента(при заданому ступені вірогідності ) більше за табличне (критичне) то середні різні.  

  • Слайд 11

    Для порівняння із заданим значенням Якщо дані попадають під закон нормального розподілу і їх потрібно порівняти із якоюсь стандартною величиною, то використовують наступну формулу: де: - середнє арифметичне вибірки - дисперсія вибірки Критичне значення t-критерію Стьюдента перевіряють за спеціальними таблицями. Для перевірки беруться ступені вільності вибірки, якій розраховується за формулою: k=n-1. Якщо розрахункове (емпіричне) значення t-критерію Стьюдента(при заданому ступені вірогідності ) більше за табличне (критичне) то середні різні. - величина з якою порівнюється середнє арифметичне вибірки

  • Слайд 12

    Приклад. Проводилися дослідження серед 16-річних школярів-хлопчиків з бігу на 100 м. В школі №1 середній результат серед 36 юнаків був 14,8±1,7 с, а в школі №2 серед 38 юнаків результат був 15,1±1,6 с. Чи можна вважати, що в школі №1 результати з бігу кращі ніж у школі №2 (дані попадали під закон нормального розподілу)? Розв’язок. Нульова гіпотеза. Різниці у показниках немає. Оскільки кількість даних більша за 30, дані у вибірках незалежні, то задача на t-критерій Стьюдента для 2-х великих вибірок. Але виникає питання чи рівні у цих вибірках дисперсії, від цього буде залежати та чи інша формула (а скоріше формула розрахунку ступенів вільності)? Дисперсію ми можемо визначити, виходячи із значення похибки середнього арифметичного. Підставивши дані з першої та другої вибірок ми знайдемо, що Провівши порівняння дисперсій за критерієм Фішера (F-тест) визначимо: Або Перевіривши критичне значення за таблицею побачимо, що при рівні значимості 0,05 критичним значенням для даних вибірок з відповідними ступенями вільності (n1-1=35та n2-1=37) буде Fкр.(0,05; 35; 37)=1,74. Таким чином, Fемп.

  • Слайд 13

    Отже, вибірки незалежні, дисперсії рівні. Значить підходить формула: А ступені вільності обрахуємо за формулою: k=n1+n2-2 Тобто , а k=38+36-2=72 За таблицею для даних ступенів вільності критичне значення буде: tкр.(0,05; 37; 35)=1,99. Оскільки розрахункове значення (емпіричне) менше за критичне (табличне), тобто tрозр.

  • Слайд 14

    Можливі парадокси при перевірці гіпотез про середні і , але і , але Для перевірки рівності декількох середніх потрібно користуватися спеціальними критеріями Наприклад: 6,2±1,1  7,1±1,6. У свою чергу 7,1±1,6  8,4±0,5. Але 6,2±1,18,4±0,5

  • Слайд 15

    Непараметричні критерії перевірки достовірності різниць Поняття про ранги та ранжування Ранг – це той номер значення у варіаційному ряду, який би воно (значення) отримало, якби ці значення були відсортовані (розставлені) по порядку. Наприклад Є ряд даних: 34, 17, 25, 43, 15, 26, 14, 20 Відсортуємо їх у порядку зростання 14, 15, 17, 20, 25, 26, 34, 43 Пронумеруємо ці дані у порядку зростання: 14, 15, 17, 20, 25, 26, 34, 43 1 2 3 4 5 6 7 8 Отримані номера (з 1 по 8 ) і будуть називатися рангами, а сам процес їх встановлення – ранжуванням. Часто ранги можна і не визначати, а скористатися готовими експериментальними даними, якщо ці дані являють собою цілі числа і їх розмах однаковий для всіх порівнювальних груп. Це можуть бути шкільні оцінки, суддівські бали, кількість вистрелів і т.п.

  • Слайд 16

    Правила ранжування Меншомузначенню нараховується менший ранг. Найменшому значенню нараховується ранг 1. Найбільшому значенню нараховується ранг, що відповідає кількості значень, які ранжуються. Наприклад, якщо n=7, то найбільше значення отримає ранг 7, за можливим виключенням для тих випадків, які передбачені правилом 2. У разі, якщо декілька значень рівні, їм нараховується ранг, що є середнім значенням з тих рангів, які вони отримали б, якби не були рівні.Наприклад, 3 найменші значення дорівнюють 10 секундам. Якби ми вимірювали час точніше, то ці значення могли б розрізнятися і складали б, скажімо, 10,2 с; 10,5 с; 10,7 с. В цьому випадку вони отримали б ранги, відповідно, 1, 2 і 3. Але оскільки отримані нами значення рівні, кожне з них отримує середній ранг: (1 + 2 + 3)/3 = 6/3 = 2. Допустимо, наступні 2 значення дорівнюють 12 сек. Вони повинні були б отримати ранги 4 і 5, але, оскільки вони рівні, то отримують середній ранг:(4 + 5) / 2 = 4,5 3. Загальна сума рангів повинна співпадати з розрахунковою, яка визначається по формулі: рангів = (n²+n)/2, де n - загальна кількість спостережень (значень), що ранжуються. Неспівпадання реальної і розрахункової сум рангів свідчить про помилку, допущену при нарахуванні рангів або їх підсумовуванні.

  • Слайд 17

    Критерій Уілкоксона (Вілкоксона, W-критерій) Застосовується для аналізу достовірності різниць переважно у залежних вибірках, коли немає відомостей про рівність дисперсій. Вимоги: Шкала вимірювання повинна бути порядковою, інтервальною або відносною (тобто критерій не можна застосовувати до номінальних змінних). Досліджувані значення повинні бути неперервними і симетричними відносно своєї медіани Кількість значень для аналізу повинна бути не менше 5. Послідовність виконання розрахунків: Скласти список досліджуваних вимірів у будь-якому порядку, наприклад алфавітному (повинно вийти 2 стовпчика: до дослідження та після). Вирахувати різницю між індивідуальними значеннями у другому і першому вимірюваннях («після» - «до»). Якщо в різниця рівна 0, то її до уваги не беруть. Проранжувати ці дані не звертаючи уваги на знаки (по модулю). Просумувати ранги окремо для позитивних і негативних різниць. Яка сума буде меншою, ту й вважають емпіричним (експериментальним) критерієм Уілкоксона. Якщо емпіричне значення більше критичного (табличного) то різниця недостовірна.

  • Слайд 18

    Приклад Вивчалася кількість попадань у мішень з 10 патронів при кульовій стрільбі. Обстежувані стріляли в сонячну погоду і, наступного дня, в похмуру. Дані занесено в таблицю: Чи можна вважати, що дані у сонячну погоду відрізнялися від даних отриманих у похмуру? Розв’язок. Нульова гіпотеза: Різниць немає. Розраховуємо різницю між окремими показниками в сонячну погоду та, відповідно, похмуру.

  • Слайд 19

    2. Відкидаємо дані з нульовими значеннями 3. Сортуємо дані за різницею від найменшого до найбільшого без врахування знаку (по модулю)

  • Слайд 20

    4. Назначаємо ранги відсоротованимрізницям 5. розраховуємо суму окремо рангів для позитивних і негативних значень W+=1+2+4=7, W-=4+4+6+7=21 6. Для порівняння беремо менше із значень сум рангів. В даному випадку це 7 7. Перевіряємо його із табличним (критичним значенням). Для нашого випадку для 7 значень критичне значення буде рівне 2. 8. Відповідь. Оскільки емпіричне (розрахункове, експериментальне) значення більше за табличне (критичне), то нульова гіпотеза приймається, тобто середні значення у двох вибірках суттєво не відрізняються.

  • Слайд 21

    Застосовується для аналізу достовірності різниць переважно у незалежних вибірках, коли немає відомостей про рівність дисперсій. Вважається найпотужнішим із непараметричних критеріїв. Вимоги: Шкала вимірювання повинна бути порядковою, інтервальною або відносною (тобто критерій не можна застосовувати до номінальних змінних). Досліджувані значення повинні бути повинні бути неперервними і симетричними відносно своєї медіани Кількість значень для аналізу у меншій вибірці повинна бути не менше 5. Послідовність виконання розрахунків: Скласти список досліджуваних вимірів у будь-якому порядку в один ряд або стовпчик наприклад алфавітному (повинно вийти 2 стовпчика). Об’єднати 2 стовпчика в один. Відсортувати дані у стовпчику за зростанням. Проранжувати ці дані. Провести розрахунки за формулами: де R1і R2 - суми рангів, розрахованих для значень, які належать першій і другій вибіркам відповідно, n1і n2 – об’єми першої та другої вибірок. Яке значення U1чи U2 буде меншим, те значення вважають емпіричним (експериментальним) критерієм Манна-Уітні. Якщо емпіричне значення більше критичного (табличного) то різниця недостовірна. Критерій Манна-Уітні (U-критерій, Уілкоксона-Манна-Уітні) U1=n1n2+0,5n1(n1+1)-R1 , U2=n1n2+0,5n2(n2+1)-R2

  • Слайд 22

    Приклад Аналізувалися показники часу затримки дихання на вдиху (в секундах) у хлопців-баскетболістів та хлопців-футболістів. Дані занесено в таблицю: Чи можна вважати, що середні значення між баскетболістами і футболістами відрізнялися? Розв’язок. Нульова гіпотеза: Різниць немає. Об’єднуємо дані в одну спільну вибірку. 2. Відсортовуємо дані за зростанням 3. Присвоюємо даним відповідні ранги

  • Слайд 23

    5. Розраховуємо U1та U2 U1=n1n2+0,5n1(n1+1)-R1 =97+0,59(9+1)-72=36; U2=n1n2+0,5n2(n2+1)-R2=97+0,57(7+1)-64=27. 4. Підсумовуємо ранги з першої та другої вибірок. R1=2+3,5+3,5+6+7+11+12+13+14=72 R2=1+5+8+9,5+9,5+15+16=64 Для порівняння беремо менше із значень U1чи U2.В нашому випадку це 27. 6. Перевіряємо його із табличним (критичним даним). Для нашого випадку для 9 та 7 значень критичне значення буде рівне 12. 7. Відповідь. Оскільки емпіричне (розрахункове, експериментальне) значення більше за табличне (критичне), то нульова гіпотеза приймається, тобто середні значення у двох вибірках суттєво не відрізняються.

  • Слайд 24

    Кореляція(англ. correlation) в прямому перекладі означає "співвідношення". Якщо зміна однієї змінної супроводжується зміною іншої, то можна говорити про кореляцію цих змінних. Кореляція

  • Слайд 25

    Види кореляційних зв’язків Види кореляцій а) строга позитивна, б) сильна позитивна, в) слабка позитивна, г) нульова, д) сильна негативна, е) строга негативна, ж) нелінійна, з) нелінійна.

  • Слайд 26

    Значення коефіцієнта кореляції завжди перебуває в межах від -1 до 1. Якщо коефіцієнт кореляції зі знаком «-», то кореляція негативна (від’ємна, мінусова, обернена), якщо зі знаком «+», то позитивна (додатна, плюсова, пряма). Коефіцієнт кореляції часто показує лише на залежність величини X від велечини Y, але це не значить, що величина Y теж обов’язково буде залежати від величини X. Кількість обстежуваних у обох вибірках повинна бути строго однакова. В противному випадку, або програма відмовиться рахувати, або недостаючі (порожні) дані будуть замінені нульовими значеннями, що призведе до значних викривлень у розрахунках. Достовірність коефіцієнту кореляції залежить від об’єму вибірки. Чим більша за об’ємом вибірка, тим менше значення (за абсолютною величиною) коефіцієнту кореляції буде вважатися достовірним.

  • Слайд 27

    Параметрична кореляція (коефіцієнт кореляції Пірсона) Значимість коефіцієнта кореляції   де та - кожне значення із вибірки Xта вибірки Yвідповідно, та - середні арифметичні із вибірки Xта вибірки Yвідповідно.   Умови застосування. Лише тоді коли дані в обох вибірках попадають під закон нормального розподілу   де - коефіцієнт кореляції, – кількість обстежуваних у вибірці (об’єм вибірки).   Значення tкорперевіряється із табличним (критичним). Якщо розраховане (експериментальне) значення коефіцієнту кореляції більше за табличне (критичне), то така кореляція вважається достовірною.

  • Слайд 28

    Приватна кореляція Необхідно пам'ятати: впливаючихзмінних може бути не три, а скільки завгодно; ви можете не знати про всі впливаючізмінні; деякі автори стверджують, що для коректного використання приватного коефіцієнта кореляції необхідна наявність так званого багатомірного нормального закону розподілу   де - коефіцієнт кореляціїміж вибірками Xта Y, - коефіцієнт кореляціїміж вибірками Xта Z, - коефіцієнт кореляціїміж вибірками Yта Z,   Кореляція між двома змінними, вирахувана після усунення впливу усіх інших змінних, називається приватною кореляцією. Наприклад Довжина волосся може корелювати з ростом людини (чим вищалюдина, тим коротше волосся), проте ця залежність стає слабкою або зовсім зникає, якщо усунути вплив статіспостережуваних людей, оскільки жінки зазвичай нижче ростом і частіше мають довше волосся, ніж чоловіки.

  • Слайд 29

    Рангова кореляція Спірмена (-кореляція) Умови застосування Змінні мають рангову шкалу виміру; Розподіл даних хоча б у одній вибірці занадто відрізняється від нормального або взагалі невідомий; Вибірки мають невеликий об'єм (n

  • Слайд 30

    Приклад: Визначити, чи залежить результат стрибка в довжину з розгону (ознака X) від величини кінцевої швидкості розгону (ознака Y). Нульова гіпотеза: результат стрибка не залежить від швидкості розгону Розв’язок Даних мало. Отже під закон нормального розподілу вони не попадуть. Тому для встановлення залежності застосуємо коефіцієнт кореляції Спірмена. 1. Замінимо всі дані на їхні ранги (проранжуємо дані за ознакою Xта ознакою Y).   2. У відповідності до формули знайдемо квадрат різниці рангів.

  • Слайд 31

      3. Знаходимо суму квадратів різниць рангів: 0+0,25+6,25+0+0,25+2,25+0+0=9 4. Розраховуємо власне коефіцієнт кореляції Спірмена:   5. Перевіряємо достовірність розрахованого нами коефіцієнту кореляції. Табличне значення для 8 досліджуваних 0,64. 6. Відповідь. Оскільки емпіричне (розрахункове, експериментальне) значення більше за табличне (критичне), то нульова гіпотеза відкидається (не приймається), тобто результат стрибка в довжину з розгону залежить від величини кінцевої швидкості розгону

  • Слайд 32

    ВИСНОВКИ Параметричні методи можна застосовувати лише тоді, коли усі досліджувані дані або показники попадають під закон нормального розподілу. У випадку коли є сумніви, що до відповідності розподілу даних за законом нормального розподілу, то в такому разі доцільніше використовувати непараметричні (рангові) методи аналізу даних. Усі непараметричні методи аналізу базуються на перетворенні досліджуваних величин у рангові показники.

  • Слайд 33

    Вибір методу для рішення задач про порівняння параметрів розподілу вибірок [1]В ряді випадків фактично перевіряється гіпотеза про рівність медіан або обох мір положення [1]В ряді випадків фактично перевіряється гіпотеза про рівність медіан або обох мір положення

  • Слайд 34
  • Слайд 35

    Вибір методу аналізу зв’язку між ознаками

  • Слайд 36
  • Слайд 37

    Додаткова література ГланцСтентон. Медико-биологическая статистика. – М.: Практика, 1999, - 459 с. Годик М.А. Спортивная метрология. – М.: Физкультура и спорт, 1988, - 192 с. Рокицкий П.Ф. Биологическая статистика. – Минск: Вышэйшая школа, 1973, 320 с. Сидоренко Е.В. Методы математической обработки в психологии. – Санкт-Петербург: Социально-психологический центр, 1996, 350 с.

Посмотреть все слайды

Сообщить об ошибке