Презентация на тему "ОСНОВЫ БИОСТАТИСТИКИ"

Презентация: ОСНОВЫ БИОСТАТИСТИКИ
1 из 26
Ваша оценка презентации
Оцените презентацию по шкале от 1 до 5 баллов
  • 1
  • 2
  • 3
  • 4
  • 5
0.0
0 оценок

Комментарии

Нет комментариев для данной презентации

Помогите другим пользователям — будьте первым, кто поделится своим мнением об этой презентации.


Добавить свой комментарий

Аннотация к презентации

Скачать презентацию (1.61 Мб). Тема: "ОСНОВЫ БИОСТАТИСТИКИ". Предмет: математика. 26 слайдов. Добавлена в 2017 году.

  • Формат
    pptx (powerpoint)
  • Количество слайдов
    26
  • Слова
    математика
  • Конспект
    Отсутствует

Содержание

  • Презентация: ОСНОВЫ БИОСТАТИСТИКИ
    Слайд 1

    ОСНОВЫ БИОСТАТИСТИКИ Александр Владимирович Рубанович зав. лаб. экологической генетики ИОГен РАН rubanovich@vigg.ru тел. (499) 132-8958

  • Слайд 2

    Оценка ассоциаций «генотип-фенотип» и их значимости Факторы, влияющие на значимость оценок Объединение выборок и метаисследования Учет множественности сравнений Темы для обсуждения

  • Слайд 3

    Выявление ассоциаций «генотип-фенотип»: минимальный набор действий Фенотип - качественный признак (например: «здоровый - больной», «русский - татарин») Фенотип - количественный признак (например: вес, содержание кальция, частота аберраций) Вычисляем OR; значимость по точному тесту Фишера Вычисляем средние значения признака для разных генотипов; значимость по критерию Манна-Уитни Кроме этого в обоих случаях можно строить различные регрессионные модели: Зависимая переменная – признак (фенотип), независимыми переменные – генотипы. Например так: A/A - 0, A/T - 1, T/T - 2

  • Слайд 4

    OR– непременный атрибут «case-controlassociation study» (выявление «генов предрасположенности» к заболеванию путем сопоставлений частот генотипов у больных и здоровых) OR – количественная мера предрасположенности (Odd Ratio) Группа больных Контроль (здоровые) - генотип, указывающий на предрасположенность к заболевания OR = ______________________ Рбольные (1- Рконтроль) Рконтроль (1- Рбольные) Рбольные Рконтроль >> OR>1 – генотип связан с болезнью OR=1 – нет связи между генотипом и болезнью OR

  • Слайд 5

    Soft для вычисления OR и проведения матаисследований WinPepi Portal (2010) - computer programs forepidemiologists Free! 30 дней

  • Слайд 6

    Статистический анализ сопряженности генотипов и количественных признаков 0.00 0.01 0.002 0.03 0.04 Частота аберраций хромосом A/G G/G A/A + Рецессивная модель + Доминантная модель Самое простое и необходимое: вычисление средних значений признака для носителей различных генотипов. Далее сравнение по непараметрическому тесту (не по Стьюденту!) Гомозигота по мажорному аллелю Гомозигота по минорному аллелю Обычно стараются рассмотреть две группы

  • Слайд 7

    0 10 20 30 40 50 0 1 Частота аберраций на 100 клеток Частота, % 60 Сравнение частот генотипов для групп с низким (или высоким) значением признака Самое простое и необходимое: вычисление средних значений признака для носителей различных генотипов. Далее сравнение по непараметрическому тесту (не по Стьюденту!) 0 10 20 30 40 50 0-1 1-2 2-3 3-4 4-5 5-6 >6 Частота аберраций на 100 клеток Частота, % , Группа людей с нулевым уровнем аберраций A/A A/G G/G A/A A/G G/G Статистический анализ сопряженности генотипов и количественных признаков Далее вычисляется OR и значимость по точному критерию Фишера. В данном примере риск возникновения аберраций у носителей минорного аллеля G равен OR=2,1и р=0,015

  • Слайд 8

    Сравнение частот генотипов для групп с низким (или высоким) значением признака Логистическая и пуассоновская регрессии р – частота аберраций xi – генотип i-го локуса аi – коэф. регрессии Нелинейные многомерные регрессии, реализованные в пакетах Statistica и SPSS Для логиcтической регрессии ai =ln(ORi) Самое простое и необходимое: вычисление средних значений признака для носителей различных генотипов. Далее сравнение по непараметрическому тесту (не по Стьюденту!) Статистический анализ сопряженности генотипов и количественных признаков Зависимая переменная – признак (р), независимыми переменные – генотипы (xi). Например так: A/A - 0, A/T - 1, T/T - 2

  • Слайд 9

    X. Sole, E. Guino, J. Valls, R. Iniesta1, V. Moreno (2006) http://bioinfo.iconcologia.net/index.php?module=Snpstats Soft для работы с генотипами и гаплотипами http://www.bios.unc.edu/~lin/hapstat/ WinStat for Excel Free! Free!

  • Слайд 10

    Оценка ассоциаций «генотип-фенотип» и их значимости Факторы, влияющие на значимость оценок Объединение выборок и метаисследования Учет множественности сравнений Темы для обсуждения

  • Слайд 11

    Чуть-чуть об ошибках статистических тестов Ошибка I рода () Вероятность отвергнуть правильную нулевую гипотезу = Вероятность обнаружить различия там, где их нет = Вероятность совершить фальшивое открытие Ошибка II рода () Вероятность принять неправильную нулевую гипотезу = Вероятность не обнаружить существующие различия = Вероятность упустить открытие Мощность теста = 1- Ошибка II рода = Вероятность правильно отвергнуть нулевую гипотезу Вероятность не упустить открытие Нулевая гипотеза – обычно предположение об отсутствии различий = 2 выборки из одной генеральной совокупности Традиционно биолог ориентирован на контроль ошибки I рода (через уровень значимости), т.е. на гарантии отсутствия ложных открытий, … и при этом мало заботится о возможности упустить открытие (ошибка II рода)

  • Слайд 12

    От чего зависят ошибки статистических тестов? От размаха реально существующих отличий и разброса данных От объемов выборок Ошибки I и II рода однозначно не связаны. В целом ошибка II рода растет при уменьшении ошибки I рода С увеличением объема выборки мощность теста (вероятность не упустить открытие) всегда возрастает Крайний случай: «критерий» св. Фомы Неверующего (0033) Ошибка I рода = 0  Ошибка II рода = 1 Ошибка I рода (вероятность фальшивого открытия) слабо зависит от объемов выборок, если они сравнимы по величине

  • Слайд 13

    Сравнение частот при уровне значимости 0.05 Объемы выборок в опыте и контроле одинаковы Если в контроле нет мутаций, то при значимости отличий в опыте их должно быть больше 5 независимо от объемов выборок (100 или 1000)

  • Слайд 14

    Оценка ассоциаций «генотип-фенотип» и их значимости Факторы, влияющие на значимость оценок Объединение выборок и метаисследования Учет множественности сравнений Темы для обсуждения

  • Слайд 15

    Проверка однородности материала и вычисление OR для нескольких выборок Выборки можно объединять, если Можно ли объединить kнезависимых выборок и оценить частоту как Индекс рассеяния для биномиальных выборок Mantel-Haenszeltest

  • Слайд 16

    Mantel-Haenszeltest Вычисление OR для совокупности выборок Значимость гетерогенности выборок

  • Слайд 17

    Объединение выборок с незначимыми эффектами Если ассоциации нет, то случаи «больше-меньше» должны появляться с вероятностью ½ Только в 3 выборках из 18 частота гетерозигот w/d у HIV+выше, чем у HIV- Вероятность выпадения 3 (и менее) орлов в 18 бросаниях монеты равна Если это принять за 4-ое превышение, то р=0.015 Монета достоверно несимметрична! Гетерозиготы w/d чаще встречаются среди HIV- Но какое OR?

  • Слайд 18

    Mantel-Haenszeltestwith WinPepi: результаты Протективное действие гетерозиготы w/d CCR5 достоверно, но не велико: OR=1.15

  • Слайд 19

    Оценка ассоциаций «генотип-фенотип» и их значимости Факторы, влияющие на значимость оценок Объединение выборок и метаисследования Учет множественности сравнений Темы для обсуждения

  • Слайд 20

    Генерируем две одинаково распределенные выборки по 100 особей с 20-локусными генотипами Как это бывает? Наблюдаем появление фальшивых ассоциаций OR p ГенВыборка 1 Выборка 2 Больные Здоровые 1 Должно быть OR=1 Значимо! 2 3 4 Сразу 3 локуса «ассоциированы» с заболеваемостью! Частоты минорых аллелей (в среднем 0.1)

  • Слайд 21

    Как избежать фальшивых открытий? Правило Карло Бонферрони (1935): При проведение m независимых статистических тестов значимы только те результаты, для которых False Discovery Rate control: FDR - контроль Permutation test (компьютерная перестановка лэйблов «case-control»)

  • Слайд 22

    Зависимость ошибки II рода от числа тестов (SNP) при использовании поправки Бонферрони Вероятность пропустить ген с OR=2.7 на выборках 100(case)и 100 (control) При 100 сравнениях ради того, чтобы гарантировать отсутствие хотя бы одного ложного результата, мы упускаем 88% открытий! При m=100 ошибка равна 0.88 1 В отдельном тесте вероятность упустить открытие равна 0.2 При 5 сравнениях упускаем 50% открытий

  • Слайд 23

    Новый принцип проверки статистических гипотез: FDR-контроль False Discovery Rate control: Benjamini, Hochberg (1995) Вероятность хотя бы одного фальшивого открытия

  • Слайд 24

    Пример: множественные сравнения по 10 тестам Значимые различия без поправок на множественность Располагаем тесты в порядке увелечения p Поправка Бонферрони оставляет значимым лишь первое сравнение В первой клетке как у Бонферрони, во второй клетке вдвое больше, втрое больше и т.д …. Для 6-ого теста pбольше этого значения Значимые различия после коррекции по FDR И это все!!!

  • Слайд 25

    Permutation tests: случайные перестановки пометок «case-control» вкомпьютерных симуляциях по алгоритму: Что делать, если FDR не помогает? В исходной базе данных делаем случайную перестановку лейблов case-control Вычисляем зановоp-уровни для каждого гена (pperm) Повторяем процедуру Nраз(минимум 10000), фиксируя случаи, когда pperm меньше исходного значения p Вычисляем откорректированное pкак Тем самым мы отказываемся от попыток вычислить значимость различий. Вместо этого мы ее «измеряем» экспериментально, разыгрывая ситуацию на компьютере Точный тест Фишера – это тоже permutation test, только реализованный аналитически (р вычисляется по формулам комбинаторной теории вероятностей)

  • Слайд 26

    Значимо без коррекции на множественность Permutation test применительно к данным об ассоциации заболеваемости с 10 SNP Переставляем отметки«case-control» 10000 раз. В результате получаем коррекциюp Значимо по Бонферрони Значимо по FDR Indulgentia Но так бывает не всегда Совсем маленькая программка

Посмотреть все слайды

Сообщить об ошибке