Содержание
-
Министерство образования и науки Российской ФедерацииФедеральное бюджетное государственное образовательное учреждениевысшего профессионального образования«Уральский государственный педагогический университет»Математический факультетКафедра математического анализаТеория вероятностей и математическая статистика (ТВиМС). Часть 5. Элементы математической статистики.Бодряков Владимир Юрьевич, д.ф.-м.н.зав. кафедрой математического анализа МФ УрГПУ E-mail: Bodryakov_VYu@e1.ru
Екатеринбург – 2011-2012
-
Литература и интернет - ресурсы
Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб. пособие. – М.: Высшее образование, 2006. – 479 с. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математическая статистика: Учеб. пособие. – М.: Высшее образование, 2006. – 404 с. http://e-lib.uspu.ru www.exponenta.ru
-
Введение. Основные понятия математической статистики
Определение: Основной задачей математической статистики (МС) считают создание методов сбора и обработки экспериментальных данных с целью получения достоверной информации о случайной величине, интересующей экспериментатора. Более подробно: Первая задача МС – указать способы сбора и группировки статистических сведений, полученных в результате наблюдений или специально поставленных экспериментов. Вторая задача МС – разработать методы анализа статистических данных в зависимости от целей исследования. Сюда относятся: (а) Оценка неизвестной вероятности события; оценка неизвестной функции распределения, оценка параметров распределения вид которого известен; оценка зависимости с.в. от одной или нескольких случайных величин и др.; (б) Проверка статистических гипотез о виде неизвестного распределения или о величине параметров распределения, вид которого известен.
-
Генеральная и выборочная совокупности. Дискретный вариационный ряд. Полигон частот. Гистограмма.
Определение: Множество всех объектов, подлежащих изучению, называется генеральной совокупностью. На языке теории множеств аналогом генеральной совокупности является универсальное множество. З а м е ч а н и е: Часто сплошное изучение (по качественному или количественному признаку) всех элементов генеральной совокупности сопряжено со значительными трудностями: большое число объектов в совокупности, необходимость уничтожения объектов при проведении некоторых видов испытаний и др. В этом случае приходится ограничиваться изучением ограниченной выборочной совокупности. Определение: Выборочной совокупностью (выборкой) называется совокупность объектов, случайно отобранных из генеральной совокупности. Выборочную совокупность можно интерпретировать как подмножество Aуниверсального множества U (рис. 1).
-
Продолжение …
Рис. 1. Требование: Для того, чтобы по данным выборки можно было уверенно судить о всей генеральной совокупности, выборка должна быть репрезентативной (представительной). В силу закона больших чисел, выборка будет репрезентативной при выполнении следующих условий: Объем выборки достаточно велик; Обеспечена случайность отбора объектов совокупности; Обеспечена равная вероятность попадания в выборку любого объекта генеральной совокупности.
-
Пусть измеряется некоторый интересующий исследователя количественный или качественный признак X генеральной совокупности. Определение:Возможные значения признака x1, x2, … , xnназывают вариантами. Обозначим через miчастоту появления варианты xi, через n – объем выборки, через wi = mi/n - относительную частоту. Определение: Таблицу, в которой перечислены (в возрастающем порядке) все варианты признака Xи соответствующие им частоты (или относительные частоты) называют статистическимзаконом распределения признака Xили дискретным статистическим рядом. П р и м. При составлении статистического ряда необходимо проверять контрольные суммы частот (относительных частот).
-
Определение:Интервальным называется статистический ряд, в котором значения признака отнесены к одному из непересекающихся промежутков, покрывающих в совокупности весь диапазон возможных значений признака. П р и м е р 1. Проведено измерение роста x (см) группы учащихся в n = 32 чел. «Сырые» результаты измерений таковы: 152, 160, 174, 177, 148, 149, 151, 178, 163, 170, 172, 152, 167, 171, 163, 156, 154, 168, 173, 145, 168, 155, 154, 153, 169, 144, 168, 173, 157, 172, 167, 164. Построить интервальный статистический ряд и частотную гистограмму распределения учащихся по росту. Рис. 2. Частотная гистограмма распределения учащихся по росту.
-
§1. Статистическое изучение случайной величины. Статистические оценки параметров распределения.
Пусть имеется генеральная совокупность объема Nи X изучаемый признак распределения. Для изучения этого признака генеральной совокупности произведена репрезентативная выборка объема n свыборочным частотным распределением: Определение: Взвешенным выборочным средним (выборочной средней) распределения называют сумму произведений всех ее возможных значений на соответствующие относительные частоты: = = . Определение: Выборочной дисперсиейраспределения называют сумму произведений относительных частот и квадратов отклонений: Dв = Определение: Выборочное СКО равно квадратному корню из Dв: в = Dв.
-
§1. Продолжение …
Определение: Генеральной среднейназывают среднее арифметическое значений признака Xпо генеральной совокупности. Если все значения x1, x2, …, xN признака генеральной совокупности объема N различны, то = (x1+ x2 + … + xN). Если же значения x1, x2, …, xkпризнака X имеют, соответственно, частоты N1, N2, …, Nk, причем N1 +N2+ … +Nk = N, то = (N1 x1+ N2 x2+ … + Nkxk). Определение: Генеральной дисперсией Dгназывают среднее из квадратов отклонений значений признака от их среднего значения : Если все значения x1, x2, …, xN признака Xразличны, то Dг = Если же значения x1, x2, …, xk признака X имеют, соответственно, частоты N1, N2, …, Nk, причем N1 +N2+ … +Nk = N, то Dг = Определение:Генеральное СКО равно квадратному корню из Dг: г= Dг.
-
Философия статистического анализа случайной величины: Пусть г некоторая «генеральная» числовая характеристика генеральной совокупности. Например, г = {M(Xг); D(Xг); …}. Пусть внекоторая числовая характеристика генеральная совокупности. Например, в = {; Dв; …}. Выборочная оценка в является случайной величиной, поскольку сам процесс выборки носит случайный характер. Поэтому в общем случае в г. Можно ли по величине выборочной характеристики в можно судить о величине интересующей исследователя генеральной характеристики г? С какой достоверностью можно по величине в судить о величине г? Существуют два вида оценок параметров (числовых характеристик) изучаемого признака генеральной совокупности по данным выборки: точечные и интервальные оценки. Определение: В результате точечной оценки получается конкретное числовое значение оцениваемого параметра; интервальная оценка дает диапазон в котором с определенной вероятностью лежит оцениваемое значение статистической случайной величины и, следовательно, позволяет судить о точности оценки.
-
§1. Продолжение …. Точечные оценки.
Пусть найдено выборочное значение в интересующей исследователя числовой характеристики генеральной совокупности. Если можно утверждать, что в = г,то говорят, что оценка в является несмещенной, состоятельной и эффективной оценкой числовой характеристики генеральной совокупности г. Определение: Выборочная оценка вназывается несмещенной, если ее математическое ожидание равно г, т.е. M(в)= г. Если M(в) г, то оценка будет смещенной. Определение: Выборочная оценка В называется эффективной, если при данном объеме выборки nиз всех возможных оценок она имеет наименьшую дисперсию. Определение: Выборочная оценка вназывается состоятельной, если в сходится по вероятности к г при n ,т.е. если: (|вг|
-
Теорема 1. Об оценке генеральной средней по выборочной средней. Пусть из генеральной совокупности в результате наблюдений над количественным признаком Xизвлечена повторная выборка объемом nс различными значениями признака x1, x2, …, xn.Пусть определена выборочная средняя: = . Тогда M() = . Док-во: Будем рассматривать выборочную среднюю как случайную величину и x1, x2, …, xn как независимые одинаково распределенные случайные величины X1, X2, …, Xn.Поскольку эти величины одинаково распределены, они имеют одинаковые числовые характеристики, в частности, математические ожидания, которые мы обозначим через a.В силу свойств математического ожидания имеем: M() = M = M(X1 + X2 + … + Xn) = = a = , т.е. выборочная средняя есть несмещенная оценка генеральной средней, ч.т.д. З а м е ч а н и е: можно показать, что выборочная средняя является и состоятельной оценкой генеральной средней.
-
Из доказанной теоремы 1 следует, что при увеличении объема выборки nвыборочная средняя стремится по вероятности к генеральной средней. В результате, если по нескольким выборкам достаточно большого объема из одной и той же генеральной совокупности будут найдены выборочные средние, то они будут приближенно равны между собой (тем точнее, чем больше n). В этом и состоит свойство устойчивости выборочных средних. З а м е ч а н и е. До сих пор выборка предполагалась повторной. Однако полученные выводы справедливы и для бесповторной выборки, если ее объем значительно меньше объема генеральной совокупности. Это положение широко используется на практике. Теорема 2. Формула дисперсии. Дисперсию D(как выборочную, так и генеральную) можно вычислить как D = ()2. Док-во: СРС.
-
Теорема 3. Оценка генеральной дисперсии по исправленной выборочной дисперсии. Пусть из генеральной совокупности в результате наблюдений над количественным признаком Xизвлечена повторная выборка объемом nсо значениями признака x1, x2, …, xkисоответствующими частотами m1, m2, …, mk. Пусть определена выборочная дисперсия:Dв = Тогда M(Dв) =Dг. Док-во: Без доказательства. З а м е ч а н и е: Легко «исправить» выборочную дисперсию Dв так, чтобы ее математическое ожидание M(Dв) было равно генеральной дисперсии Dг. В силу теоремы 3 имеем: Определение: Исправленной выборочной дисперсией s2 называется величина: s2= Dв = Определение:Исправленным выборочным среднеквадратическим отклонением (СКО) sназывается корень квадратный из исправленного СКОs2. З а м е ч а н и е: Исправленное СКО s является смещенной оценкой г.
-
§2. Точность оценки, доверительная вероятность (надежность). Доверительный интервал.
Определение:Точечной называют оценку в статистической случайной величины X, которая определяется одним числом. Все рассмотренные выше оценки – точечные. Например, точечной оценкой генерального СКО г является исправленное СКО s. Однако точечная оценка не позволяет судить о точности этой оценки. По этой причине предпочтительнее пользоваться интервальными оценками. Определение:Интервальной называют оценку с.в. X, которая определяется двумя числами – концами интервала, заключающего в себе точечную оценкуэтой с.в. Все рассмотренные выше оценки – точечные. Например, точечной оценкой генерального СКО г является исправленное СКО s. Однако точечная оценка не позволяет судить о точности этой оценки. По этой причине предпочтительнее пользоваться интервальными оценками. Пусть найденная по данным выборки величина в служит случайной оценкой неизвестного параметра г генеральной совокупности. Число > 0 служит мерой точности случайной оценки, если |гв|
-
§2. Точность оценки … Продолжение.
Определение:Надежностью (доверительной вероятностью) оценки г по в называют вероятность , с которой осуществляется неравенство |г в|
-
§2. Точность оценки … Доверительные интервалы для оценки математического ожидания нормального распределения при известном .
Постановка задачи: Пусть количественный признак X генеральной совокупности распределен нормально, причем СКО этого распределения известно. Оценим неизвестное математическое ожидание aпо выборочной средней с оценкой доверительных интервалов, покрывающих параметр a, с надежностью . Решение: Будем рассматривать выборочную среднюю как случайную величину .Такой подход оправдан, ибо меняется от выборки к выборке. Будем считать выборочные значения признака x1, x2, …, xnчастными значениями одинаково распределенных случайных величин X1, X2, …, Xn, имеющих одинаковые математическое ожидание aи СКО . Можно показать, что если с.в. X распределена нормально, то выборочная средняя , найденная по независимым наблюдениям, также распределена нормально. Параметры распределения таковы: M() = a; () = /n. Потребуем, чтобы выполнялось соотношение P(|a|
-
§2. Точность оценки …Продолжение.
Как известно, для нормального распределения P(|Xa|
-
Альтернативное решение: Пусть количественный признак X генеральной совокупности распределеннормально, причем M(X) = a, (X) = . Тогда, как отмечено выше, выборочная средняя имеет нормальное распределение с параметрами M() = a; () = /n. Если из этой генеральной совокупности извлекать выборки объема n и по ним находить выборочные средние, то можно доказать, что случайная величина Z = , где выборочная средняя; a генеральная средняя; известное СКО по генеральной совокупности; n – объем выборки, также имеет нормальное распределение как линейная функция нормального аргумента , причем M(Z) = 0, (Z) = 1 (рис. 3). Рис. 3. Плотность и интегральная функция нормального распределения.
-
П р и м е р 2. С.в. Z принимает значения в промежутке (1; +1), т.е. в промежутке (; +) с вероятностью P(
-
З а м е ч а н и е 1. Оценку |a|
-
§2. Точность оценки … Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном .
Постановка задачи: Пусть количественный признак X генеральной совокупности распределен нормально, причем СКО этого распределения неизвестно. Оценим неизвестное математическое ожидание aпо выборочной средней с оценкой доверительных интервалов, покрывающих параметр a, с надежностью . Решение: Вследствие того, что величина СКО генеральной совокупности теперь неизвестна, нельзя напрямую пользоваться результатами решения предыдущей задачи. Однако и в этом случае можно применять ту же идеологию оценки доверительного интервала. Построим по данным выборки с.в. Tс возможными значениями t: T = , где выборочная средняя; a генеральная средняя; S исправленное выборочное СКО; n – объем выборки. Можно показать, что с.в. T имеет t-распределение Стьюдентасk = n – 1 степенями свободы. Свойства распределения Стьюдента хорошо изучены (см. Приложение 1). Плотность S(t; n) распределения Стьюдента подобна нормальному распределению, и зависит только от двух параметров: действительного t и натурального n.
-
§2. Точность оценки …Продолжение..
С учетом четности распределения Стьюдента, вероятность осуществления неравенства 30) распределение Стьюдента стремится к нормальному и может быть им заменено.Однако при малом объеме выборки применение нормального распределения вместо распределения Стьюдента ведет к существенным ошибкам.
-
§2. Точность оценки …Продолжение…
П р и м е р 4. Количественный признак Xгенеральной совокупности распределен нормально. По выборке объема n = 16 найдены выборочная средняя = 20,2 и исправленное СКО s = 0,8. Оценить неизвестное математическое ожидание aс надежностью = 0,95. Решение: Пользуясь таблицей значений интегрального распределения Стьюдента, по заданным объему выборки n = 16 и доверительной вероятности = 0,95 находим величину t = 2,13. Остается выписать доверительные границы: t s/= 20,8 2,130,8/=19,77; +t s/= 20,8+2,130,8/=20,63. Ответ: С надежностью = 0,95 математическое ожидание с.в. X, распределенной нормально с неизвестным СКО,заключено в доверительном интервале 19,77
-
§2. Точность оценки …Оценка истинного значения измеряемой величины
Постановка задачи. Пусть производится nнезависимых равноточных измерений некоторой физической величины X, истинное значение которой неизвестно. Будем рассматривать результаты отдельных измерений как случайные величины X1, X2, …, Xn. Эти величины: независимы (ибо измерения независимы); имеют одно и то же математическое ожидание a (истинное значение измеряемой величины – ибо величины X1, X2, …, Xn взяты из одной генеральной совокупности); имеют одинаковые дисперсии 2 (по той же причине, что и a); В силу сказанного, можно непосредственно применить результаты решения предшествующей задачи. П р и м е р 5. Баллы Xза ЕГЭ по математике группы абитуриентов объемом n= 366чел. сгруппированы c 5-балльным шагом. Предполагая, что распределение нормально, оценить математическое ожидание с.в. Xи доверительный интервал для него с надежностью = 0,95. Сравнить визуально эмпирическое и расчетное распределения.
-
§2. Точность оценки …Продолжение
Решение: В качестве оценки математического ожидания aс.в. Xпо известным статистическим формулам вычислим выборочное среднее значение = 54,70; исправленную выборочную дисперсию D= 54,57 и исправленное СКО s= 7,39. Пользуясь таблицей значений интегрального распределения Стьюдента, по заданным объему выборки n = 366 и доверительной вероятности = 0,95 находим величину t = 1,960. Остается выписать доверительные границы для математического ожидания: a= t s/= 54,70 1,9607,39/=54,700,76. Ответ:C надежностью = 0,95 М.О. a= t s/= 54,70 0,76 (рис.4). Рис. 4. Эмпирическое (кружки) и теоретическое частотное распределение с.в. X.
-
Приложение 1. Распределение Стьюдента
Определение:t - распределением Стьюдента (рис. 5) называется распределение вероятностей, заданное плотностью распределения: S(t; n) = Bn, где t – действительный аргумент распределения; n – натуральный параметр распределения (объем выборки). Нормирующие множители: Bn = ; В свою очередь, (z) гамма – функцияЭйлера. По определению (z) = . Основные свойства гамма – функции определяются равенствами: () = ; (1) = 1; (n + 1) =n!;(z + 1) =z (z). Определение:Интегральным t- распределением Стьюдента (рис. 4) называется распределение вероятностей, заданное интегралом от плотности t - распределения: Sint(t; n) = = 2. Свойства интегральной функции t - распределения Стьюдента: 1) Функция Sint(t; n) четна; 2) 0 Sint(t; n) 1; 3) При n t - распределениепереходит в нормальное N(a=1; =1; x).
-
Приложение 1. Распределение Стьюдента. Продолжение
Рис. 5. Плотность и интегральная функция t – распределения Стьюдента (синие линии) для нескольких значений n. Для сравнения показано (красная линия) нормальное распределение N(a=1; =1; x).
-
Приложение 2. WilliamSealyGosset
Уи́льямСи́лиГо́ссет (13 июня1876 г. — 16 октября1937 г.) — известный учёный-статистик, более известный под своим псевдонимом Стьюдент и за свои работы по исследованию т.н. Распределения Стьюдента.
-
Приложение 2. WilliamSealyGosset. Продолжение
Родился в Кентербери, у Агнес Сили Видал и полковника Фредерика Госсета. Госсет посещал колледж Винчестер (англ.), а затем прослушал курсы химии и математики в Новом колледже Оксфорда. По окончании университета в 1899 году он поступил на работу на пивоваренный завод ArthurGuinnessSon & Co в Дублине. «Гиннесс» был передовым предприятием пищевой промышленности, и Госсет мог применить свои знания в области статистики как при варке пива, так и на полях — для выведения самого урожайного сорта ячменя. Госсет приобретал эти знания путём изучения, методом проб и ошибок, проведя два года (1906—1907 гг.) в биометрической лаборатории Карла Пирсона. Госсет и Пирсон были в хороших отношениях, и Пирсон помогал Госсету в математической части его исследований. Так, Пирсон был причастен к публикациям 1908 года (принёсших славу Стьюденту), но придавал мало значения этому открытию. Исследования были обращены к нуждам пивоваренной компании и проводились на малом количестве наблюдений. Биометристы же обычно имели дело с сотнями наблюдений и не испытывали необходимости в развитии методов, основанных на малом их количестве. Ранее другой исследователь, работавший на «Гиннесс», опубликовал в своих материалах сведения, составлявшие коммерческую тайну этой пивоваренной компании. Чтобы предотвратить дальнейшее раскрытие конфиденциальной информации, «Гиннесс» запретил своим работникам публикацию любых материалов, независимо от содержавшейся в них информации. Это означало, что Госсет не мог опубликовать свои работы под своим именем. Поэтому он избрал себе псевдоним Стьюдент, чтобы скрыть себя от работодателя. Поэтому его самое важное открытие получило название Распределение Стьюдента, иначе бы оно могло называться теперь распределением Госсета.
-
Госсет практически все свои работы, включая работу «Вероятная ошибка среднего» (англ. Theprobableerrorof a mean) опубликовал в журнале Пирсона «Биометрика» под псевдонимом Стьюдент. Первым, кто понял значение работ Госсета по оценке параметров малой выборки, был биолог Рональд Фишер. Госсет написал ему: «Я посылаю вам копию таблиц Стьюдента, поскольку вы, похоже, единственный человек, который когда-либо станет пользоваться ими!» Фишер считал, что Госсет совершил «логическую революцию». По иронии судьбы, t - статистика, благодаря которой знаменит Госсет, была фактически изобретением Фишера. Госсет считал статистику для z = t /√(n1). Фишер предложил вычислять статистику для t, потому что такое представление укладывалось в его теорию степеней свободы. Фишер также применил распределение Стьюдента в регрессионном анализе. Стьюдентизированные остатки также названы в честь Стьюдента, хотя их предложили другие учёные. Подобно проблемам, которые привели к распределению Стьюдента, в их основе лежит та же идея — исправление (adjusting) выборочного стандартного отклонения. Интерес Госсета к выращиванию ячменя привёл его к мысли, что опыт надо планировать с той целью, чтобы не просто повысить среднюю урожайность, но чтобы вывести такие сорта ячменя, чья урожайность была бы устойчива к колебаниям состава почвы или климата. Этот принцип встречается только позднее у Фишера и затем в 1950-х в работе ГэнъитиТагути. В 1935 году он покинул Дублин, чтобы занять должность главного пивовара, ответственного за научную сторону производственного процесса, в новой пивоварне Гиннесса в Парк Ройял (англ.), в северо-западной части Лондона. Он скончался от сердечного приступа в городе Беконсфильд (англ.) в Англии. Госсет был другом Пирсона и Фишера и был достаточно скромным человеком. Известен случай, когда он оборвал речь своего почитателя словами «Фишер всё равно бы сумел открыть всё это сам».
-
§3. Элементы корреляционного анализа. Функциональная, статистическая и корреляционная зависимости
Во многих задачах требуется установить наличие и оценить степень зависимости изучаемой величины Yот одной или нескольких других случайных величин X (или X1, X2, …, Xn).Прежде всего, рассмотрим зависимость с.в. Yот одной случайной или неслучайной величины X. Две с.в. Yи Xмогут быть: а) связаны функционально; б) связаны статистической, в частности, корреляционной зависимостью; в) независимы. Определение:Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой. Если, при этом, изменение одной из величин влечет изменение среднего значения другой, то такую статистическую зависимость называют корреляционной. П р и м е р 6. Пусть с.в. Y – урожай зерна; с.в. X – количество внесенных удобрений. С одинаковых по площади участков снимают различный урожай, т.е. Yне является функцией X, ибо на величину урожая, помимо количества удобрений, влияет множество случайных факторов (осадки, температура воздуха, качество почвы и др.). Вместе с тем, как показывает опыт, средний урожай определенно зависит от количества внесенных удобрений. Иными словами с.в. Yи Xсвязаны корреляционной зависимостью.
-
§3. Элементы корреляционного анализа. Отыскание параметров выборочного уравнения прямой линии среднеквадратической регрессии.
Пусть изучается система количественных признаков (X; Y). В результате n независимых опытов получены nпар чисел (x1; y1), (x2; y2), …, (xn; yn). Найдем по данным наблюдений выборочное уравнение прямой линии среднеквадратичной регрессии. Уравнение будем искать в видерегрессии Yна X: y = kx + b, где угловой коэффициент kназывают выборочным коэффициентом регрессии Y на X и обычно обозначают yx. Определение: Выборочным уравнением линейной регрессии Yна Xназывают уравнение вида Y= yxx+ b, наилучшим образом (в определенном смысле) описывающее nпар чисел (x1; y1), (x2; y2), …, (xn; yn). Определение: Назовем отклонением разность Yi yi, i = 1, 2, …, n. Здесь Yiрасчетная по уравнению регрессии ордината, соответствующая абсциссе xi,yi экспериментальная i-ая ордината.
-
§3. Элементы корреляционного анализа. Продолжение...
Подберем параметры yxи bтак, чтобы сумма квадратов отклонений(Yi yi)2 была минимальной: F(yx; b) = = min. Такой подход называется методом наименьших квадратов (МНК). Для минимизации функции F(yx; b) приравняем нулю частные производныепо параметрам (для краткости обозначено yx = ): = 2 = 0; = 2 = 0. Выполнив элементарные преобразования (СРС), получим систему линейных уравнений относительно параметров yx иb, откуда yx= ; b = . Аналогично можно найти выборочное уравнение прямой линейной регрессии xна y: x= xyy+ d, где xy выборочный коэффициент регрессии Xна Y.
-
П р и м е р 7. Найти выборочное уравнение прямой линии регрессии Yна Xпо данным n = 5 наблюдений: Решение: Составим расчетную таблицуи вычислим yx иb: yx= (526,975 158,15)/(557,5152) = 0,202; b = (57,58,15 1526,975)/(557,5152) = 1,024.
-
Напишем искомое уравнение регрессиии построим ее в сопоставлении с эмпирическими данными (см. рис. 6): Y = 0,202x + 1,024. Рис. 6. Линейная регрессия: символы – эмпирические данные; линия – расчет. Уравнение линейной регрессии: Y = 0,202x + 1,024. Ответ: Выборочное уравнение линейной регрессии получено методом МНК; уравнение имеет вид Y= 0,202x + 1,024 и находится в разумном согласии с эмпирическими данными.
-
Обобщим полученный результат, заметив, что: x = n; y= n;x2= n;xy= n. Теперь система уравнений для коэффициентов yx иb примет вид: nyx + nb = n; nyx + nb= n. Исключив b из системы, получим для yx представление: yx = = . Здесь использовано обозначение: x2 = n( ()2) для выборочной дисперсии случайной величины X. В корреляционном анализе, как правило, пользуются не выборочным коэффициентом регрессии yx, а более показательной величиной - выборочным коэффициентом линейной корреляции rв, отражающем тесноту корреляционной связи между с.в.Y и X. Определение: Выборочным коэффициентом линейной корреляции между с.в.Y и X называют с.в.: rв= yx = .
-
Замечание 1: Выборочный коэффициент линейной корреляции является выборочной оценкой генерального коэффициента корреляции: rг = . З а м е ч а н и е 2: Коэффициент линейной корреляции 1 rв +1. З а м е ч а н и е 3: Если с.в. Xи Yнезависимы, то коэффициент корреляции r = 0; если с.в. Xи Yсвязаны линейной функциональной зависимостью, то коэффициент корреляции r = 1. З а м е ч а н и е 4: Если генеральная совокупность имеет нормальное распределение, то для оценки генерального коэффициента линейной корреляции rг, можно пользоваться выборочным коэффициентом линейной корреляции rв (объем выборки n 50): rв 3 rг rв+3. З а м е ч а н и е 5: Важный с точки зрения корреляционного анализа вопрос о значимости коэффициента корреляции rг решается средствами теории статистической проверки статистических гипотез.
-
Спасибо за внимание! Данный раздел закончен.
Ваши вопросы, замечания, предложения …
Нет комментариев для данной презентации
Помогите другим пользователям — будьте первым, кто поделится своим мнением об этой презентации.