Содержание
-
Исследование статистической зависимости между двумя случайными величинами методами математической статистики
Выполнили: учащиеся 10 класса Сергеева Н.С., КраузеВ.В. Конкурсная работа по математике Руководитель: учитель математики I квалификационной категории Бурцева О.Г. Консультант: кандидат физико-математических наук Савичева Г.В.
-
Цели работы
проверить зависимость между ценообразованием продуктов одной категории «фрукты» (бананы и апельсины) в различных магазинах города Новозыбкова Брянской области; исследовать статистическую совокупность данных; сделать вывод о статистической зависимости между двумя исследуемыми случайными величинами.
-
Задачи работы:
изучить учебную и методическую литературу по теме; сформировать двумерную выборку статистических данных о ценовых характеристиках продуктов одной категории «фрукты» в различных магазинах г. Новозыбкова Брянской области; провести первичную обработку собранных статистических данных; построить эмпирическую ломаную по полученным данным; сделать вывод о характере зависимости между двумя случайными величинами (ценами на продукты одной категории)
-
Объект исследования –исследование статистических данных методами математической статистики. Предмет исследования – статистические методы оценки зависимости между двумя изучаемыми случайными величинами.
-
Практическое исследование статистической зависимости между двумя случайными величинами
Предположение:цены на товары одной категории (фрукты) зависят от того, в каком магазине их приобретают. Для практического исследования выбираются две случайные величины: Х – цена за 1 кг бананов, Y—цена за 1 кг апельсинов. Задача:проверить, действительно ли, если в определенном магазине цена за бананы выше, чем в других магазинах, то и цена за апельсины в этом магазине также будет выше, и наоборот. Другими словами, мы хотим проверить существует ли статистическая зависимость между выбранными нами случайными величинами.
-
1 этап исследования Сбор статистических данных
Общий объем выборки 20 магазинов.
-
2 этап исследованияСоставление корреляционной таблицы
Максимальное значение Хmax=86 Минимальное значение Хmin=47 Размах выборки 39. Ряд для случайной величины Х будем разбивать на 5 интервалов длины 8.
-
Максимальное значение Ymax=129 Минимальное значение Ymin=72 Размах выборки 57. Ряд для случайной величины Yбудем разбивать на 5 интервалов длины 12.
-
На основе полученных данных (на этапе сбора информации) заполняем сборную двумерную таблицу статистических данных.
-
Теперь скорректируем полученную таблицу, заменив интервалы значений на их середины, а номера магазинов – на их количество. Пустые ячейки означают, что в заданные интервалы не попадает ни один магазин.
-
3 этап исследованияПервичная обработка корреляционной таблицы
К первичной обработке корреляционной таблицы относят нахождение суммарных частот niи njпо строчкам и столбцам. Например, Аналогично, находим сумму частот в каждой строке: nx2=4, nx3=4, nx4=5, nx5=4. Эти частоты должны соответствовать частотам ni в распределении случайной величины Х (см. слайд 7). Далее получаем: ny2=5, ny3=5, ny4=4, ny5=4. Эти частоты должны соответствовать частотам nj в распределении случайной величины Y (см. слайд 8).
-
Теперь для каждого значения хi (i=1, 2, …, 5), то есть для каждой строки корреляционной таблицы, вычисляются групповые средние по формуле:
-
Аналогично для каждого значения yj (j=1, 2, …, 5) по формуле вычислим групповые средние .
-
Полученные значения суммарных частот и групповых средних заносим в последние строки и столбцы корреляционной таблицы
-
4 этап исследованияПостроение на координатной плоскости эмпирических линий регрессии
Сначала строим эмпирическую линию регрессии Y по Х по точкам А(51;97), B(59; 89), C(67; 92), D(75;110,6), E(83;122), и соединяем их ломаной линией ABCDE. Полученная эмпирическая линия сильно отличается от прямой и отклонения вершин ломаной от выравнивающей прямой значительны. Вывод: однозначно нельзя утверждать, что в магазинах города Новозыбкова, чем выше стоимость бананов, тем выше будет и стоимость апельсинов.
-
В то же время, если из рассмотрения убрать точку А, то оставшаяся часть эмпирической ломаной BCDE уже значительно лучше выравнивается прямой линией. Таким образом, в повседневной практике мы можем пользоваться введенным нами предположением о взаимозависимости цен на фрукты в разных магазинах города, ведь только несколько торговых точек, участвующих в исследовании, опровергают наше предположение.
-
Аналогично строим эмпирическую линию регрессии Х по Yсоединяя точки К(55; 77), L(63,8; 89), M(65,4;101), N(71; 113), P(81; 125). Вывод: в этом случае можно уже смело говорить о наличии весомой зависимости между переменными Y и Х, то есть чем выше стоимость апельсинов в магазине, то тем выше и стоимость бананов
-
Заключение
В ходе практического исследования были реализованы все поставленные задачи, среди которых сбор и обработка статистических данных, построение на их основе эмпирических ломанных и формулировка вывода о характере зависимости между двумя случайными величинами исходя из анализа формы эмпирических линий. Построение эмпирических ломанных по заданным координатам вершин и выравнивание их в прямую линию производилось посредством бесплатной математической программы GeoGebra. Следует отметить, что основная цель работы – проверить зависимость между ценообразованием на бананы и апельсины в различных магазинах города Новозыбкова Брянской области, исследовать статистическую совокупность данных и сделать вывод о статистической зависимости между двумя исследуемыми случайными величинами – выполнена. Данная работа будет полезна учителям математики и ученикам старших классов, отдающих предпочтение математическим и экономическим специальностям.
-
Спасибо за внимание
Нет комментариев для данной презентации
Помогите другим пользователям — будьте первым, кто поделится своим мнением об этой презентации.