Содержание
-
Оценка параметров генеральной совокупности (генеральные параметры).
-
План лекции
Методы группировки экспериментальных данных. Точечная оценка параметра. Интервальная оценка параметра.
-
Методы группировки экспериментальных данных
Допустим, из генеральной совокупности извлечена выборка объемом n, измерена некоторая величина Х, в результате чего получен ряд значений х1, х2, . . . хn. Этот ряд называется простым статистическим рядом.
-
Пример: измерена масса тела 10 девочек 6 лет. Полученные данные образуют простой статистический ряд: 24 22 23 28 24 23 25 27 25 25 Отдельные значения статистического ряда называются вариантами. Если варианта хi появиласьfраз, то число fназывают частотой, а ее отношение к объему выборки f /n – относительной частотой. Последовательность вариант, записанная в возрастающем (убывающем) порядке, называется ранжированным рядом.
-
Пример: Ранжированный ряд: 22 23 23 24 24 25 25 25 27 28 Таблица, в первой строке которой записаны все значения величины (варианты), во второй – соответствующие им частоты, называется безынтервальным вариационным рядом. Пример:Безынтервальный вариационный ряд
-
Графическим изображением безынтервального вариационного ряда является полигон (рис. 1). Рис. 1. Полигон вариационного ряда Для его построения на оси ОХ откладывают значения вариант, на оси ОУ – соответствующие им частоты. Точки с координатами (хi; fi) соединяют отрезками, полученная ломаная линия называется полигоном частот.
-
Основными параметрами генеральной совокупности являются математическое ожидание (генеральная средняя) М(Х) и среднее квадратическое отклонение . Это постоянные величины, которые можно оценить по выборочным данным. Оценка генерального параметра, выражаемая одним числом, называется точечной.
-
Точечной оценкой генеральной средней m является выборочное среднее . Выборочным средним называется среднее арифметическое всех значений величины, встречающихся в выборке.
-
Пример: Вычислить среднее значение массы тела девочек 6 лет.
-
Если выборочное среднее вычисляется по вариационному ряду, то находят сумму произведений вариант на соответствующие частоты, и делят на количество элементов в выборке. Пример: Вычислить среднее значение массы тела девочек 6 лет(ранжированный ряд – 22 23 23 24 24 25 25 25 26 27).
-
Выборочное среднее является основной характеристикой положения, показывает центр распределения совокупности, позволяет охарактеризовать исследуемую совокупность одним числом, проследить тенденцию развития, сравнить различные совокупности. Непараметрическими характеристиками положения являются мода и медиана. Модой называется варианта, имеющая наибольшую частоту Медианой называется варианта, расположенная в центре ранжированного ряда. Если ряд состоит из четного числа вариант, то медианой считают среднее арифметическое двух вариант, расположенных в центре ранжированного ряда.
-
Пример: найти моду и медиану выборочной совокупности по массе тела девочек 6 лет Мо = 25; Ме = 24,5
-
генеральные параметры
-
Пример.Определить основные статистические показатели результатов измерения роста студентов, если данные выборки таковы (n=16): 185, 171, 190, 170, 190, 178, 188, 174, 193, 178, 176, 180, 175, 176, 180, 192.
-
-
Для того чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны быть: несмещенными; эффективными; состоятельными.
-
Определение. Оценка называется несмещенной, если математическое ожидание ее выборочного распределения совпадает со значением генерального параметра. Определение.Точечная оценка называется эффективной, если она имеет наименьшую дисперсию выборочного распределения по сравнению с другими аналогичными оценками, т.е. обнаруживает наименьшую случайную вариацию.
-
Определение. Точечная оценка называется состоятельной, если при увеличении объема выборочной совокупности она стремиться к величине генерального параметра. Для выборки из нормальной генеральной совокупности эта оценка является эффективной, состоятельной и несмещенной.
-
Интервальная оценка параметра
При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками. Интервальной называют оценку, которая определяется двумя числами – концами интервала – доверительного интервала. Интервальные оценки позволяют установить точность и надежность оценок.
-
Знание величины ошибки репрезентативности недостаточно, чтобы быть уверенным в результатах выборочного исследования, т.к. конкретная ошибка одного выборочного наблюдения может быть больше (меньше) средней ошибки выборки. Поэтому на практике определяют так же пределы возможных ошибок выборки или предельную ошибку выборки (∆). Т.к. предельная ошибка может быть как в сторону увеличения, так и в сторону уменьшения, то говорят о доверительном интервале или доверительных границах, в пределах которых будет находиться показатель генеральной совокупности на основании данных выборочного исследования.
-
Для оценки генерального параметра с помощью доверительного интервала необходимы три величины: значение выборочного показателя; критерий надежности t, или показатель безошибочных прогнозов, значение которого определяется заранее, при планировании исследования, исходя из представления о большей или меньшей ответственности возможных результатов работы; ошибка репрезентативности mили показатель точности выборочного параметра (определяется на основе выборочных данных по формулам математической статистики).
-
Если признак генеральной совокупности распределён нормально, то интервальную оценку производят, используя интервал Стьюдента: t- критерий достоверности или критерий Стьюдента, который показывает, с какой вероятностью данные выборки совпадут с данными генеральной совокупности (определяется по таблице Стьюдента); - доверительная вероятность.
-
-
Для большинства медицинских исследований допускают р = 0,95 или 95%. В этом случае вероятность выхода результата выборочного исследования за границы доверительного интервала, т.е. вероятность ошибки составляет 0,05 или 5%. Поэтому говорят, что результат исследования получен с уровнем значимости 0,05 (р=0,05). При необходимости более строгой оценки р=0,99 (99%), вероятность ошибки составит 0,01 (1%) и следовательно уровень значимости будет р=0,01
-
Виды интервалов нижняя граница последующего интервала повторяет верхнюю границу последующего интервала. С индивидуальными границами в интервал входят верхняя и нижняя границы. открытый интервал, интервал с одной границей При расчетах по интервальному вариационному ряду за xi принимается середина интервала.
-
-
Интервалы могут быть как равные, так и нет. При изучении вариационного ряда существенную помощь оказывает графическое изображение.
-
Правило «трех сигм»
-
68.3 % всех вариант отклоняются от своей средней не более чем на σ 95.4% вариант находятся в пределах X ± 2σ 99.7% вариант находятся в пределах X ± 3σ Отклонение параметра от его средней арифметической в пределах σ расценивается как норма. Субнормальнымсчитается отклонение в пределах ± 2σ. Патологическим- сверх этого предела, т.е. > ± 2σ
-
конец
Нет комментариев для данной презентации
Помогите другим пользователям — будьте первым, кто поделится своим мнением об этой презентации.