ОГЛАВЛЕНИЕ
Введение. 2
Понятие статистики. 2
История математической статистики. 3
Простейшие статистические характеристики. 5
Статистические исследования. 8
1. СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ 9
2. РАЗМАХ 10
4. МЕДИАНА 11
5. СОВМЕСТНОЕ ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК 11
Перспективы и вывод. 11
Список литературы. 12
Введение.
В октябре на перемене перед уроком наш учитель математики Марианна Рудольфовна проверяла самостоятельные работы у 7 класса. Увидев, о чем они пишут, я не поняла ни слова, но спросила у Марианны Рудольфовны, что означают незнакомые мне слова – размах, мода, медиана, среднее. Получив ответ, я ничего не поняла. Под конец 2 четверти Марианна Рудольфовна предложила кому-нибудь из нашего класса сделать реферат на эту самую тему. Мне показалась эта работа очень интересной, и я согласилась.
В ходе работы рассматривались такие вопросы
Что такое математическая статистика?
В чем значение статистики для обычного человека?
Где применяются полученные знания?
Почему человек не может обойтись без математической статистики?
Понятие статистики.
СТАТИСТИКА – это наука, которая занимается получением, обработкой и анализом количественных данных о разнообразных явлениях, происходящих в природе и обществе.
В средствах массовой информации часто встречаются такие фразы, как статистика аварий, статистика народонаселения, статистика заболеваний, статистика разводов и др.
Одна из основных задач статистики состоит в надлежащей обработке информации. Конечно, у статистики есть много других задач: получение и хранение информации, выработка различных прогнозов, оценка их достоверности и т. д. Ни одна из этих целей не достижима без обработки данных. Поэтому, первое, чем стоит заняться - это статистическими методами обработки информации. Для этого есть много терминов, принятых в статистике.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА - раздел математики, посвященный методам и правилам обработки и анализа статистических данных
История математической статистики.
Математическая статистика как наука начинается с работ знаменитого немецкого математика Карла Фридриха Гаусса (1777-1855), который на основе теории вероятностей исследовал и обосновал метод наименьших квадратов, созданный им в 1795 г. и примененный для обработки астрономических данных (с целью уточнения орбиты малой планеты Церера). Его именем часто называют одно из наиболее популярных распределений вероятностей – нормальное, а в теории случайных процессов основной объект изучения – гауссовские процессы.
В конце XIX в. – начале ХХ в. крупный вклад в математическую статистику внесли английские исследователи, прежде всего К.Пирсон (1857-1936) и Р.А.Фишер (1890-1962). В частности, Пирсон разработал критерий «хи-квадрат» проверки статистических гипотез, а Фишер – дисперсионный анализ, теорию планирования эксперимента, метод максимального правдоподобия оценки параметров.
В 30-е годы ХХ века поляк Ежи Нейман (1894-1977) и англичанин Э.Пирсон развили общую теорию проверки статистических гипотез,
а советские математики академик А.Н. Колмогоров (1903-1987) и член-корреспондент АН СССР Н.В.Смирнов (1900-1966) заложили основы непараметрической статистики.
В сороковые годы ХХ в. румынский математик А. Вальд (1902-1950) построил теорию последовательного статистического анализа.
Математическая статистика бурно развивается и в настоящее время.
^ Простейшие статистические характеристики.
В повседневной жизни мы, не догадываясь, используем такие понятия как медиана, мода, размах и среднее арифметическое. Даже когда мы ходим в магазин или делаем уборку.
^ Средним арифметическим ряда чисел называется частное от деления суммы этих чисел на их количество. Среднее арифметическое является важной характеристикой ряда чисел, но иногда полезно рассматривать и другие средние.
Модой называют число ряда, которое встречается в этом ряду наиболее часто. Можно сказать, что данное число самое «модное» в этом ряду. Такой показатель, как мода, используется не только для числовых данных. Если, например, опросить большую группу учеников, какой школьный предмет им нравится больше всего, то модой этого ряда ответов окажется тот предмет, который будут называть чаще остальных.
Мода – показатель, который широко используется в статистике. Одним из наиболее частых использований моды является изучение спроса. Например, при решении вопросов, в пачки какого веса фасовать масло, какие открывать авиарейсы и т. п., предварительно изучается спрос и выявляется мода - наиболее часто встречающийся заказ.
Заметим, что в рядах, рассматриваемых в реальных статистических исследованиях, иногда выделяют больше одной моды. Когда в ряду много данных, то интересными бывают все те значения, которые встречаются гораздо чаще других. Их статистики тоже называют модой.
Однако нахождение среднего арифметического или моды далеко не всегда позволяет делать надежные выводы на основе статистических данных. Если есть ряд данных, то, помимо средних значений, надо еще указать, насколько используемые данные различаются между собой.
Одним из статистических показателей различия или разброса данных является размах.
Размах - это разность между наибольшим и наименьшим значениями ряда данных.
Еще одной важной статистической характеристикой ряда данных является его медиана. Обычно медиану ищут в случае, когда числа в ряду являются какими-либо показателями и надо найти, например, человека, показавшего средний результат, фирму со средней годовой прибылью, авиакомпанию, предлагающую средние цены на билеты, и т. д.
Медианой ряда, состоящего из нечетного количества чисел, называется число данного ряда, которое окажется посередине, если этот ряд упорядочить. Медианой ряда, состоящего из четного количества чисел, называется среднее арифметическое двух стоящих посередине чисел этого ряда.
Например:
1. В школах г. Перми каждый год проходит ЕРТ за 4 класс и в 2010 году были получены следующие средние баллы:
Математика
Русский язык
Гимназия № 4
Моя мама работает на пермском пороховом заводе бухгалтером. Зарплата сотрудников этого предприятия колеблется в размерах от 12000 до18000. разность составляет 6000. Это называется размах
Несколько лет назад мы с родителями отдыхали на юге в Анапе. Я обратила внимание, что на номерах машин чаще всего встречается №23 – номер региона. Это называется мода.
На выполнение домашнего задания я тратила в течение недели такое время – 60 мин в понедельник, во вторник 103 мин, в среду 58, в четверг 76 , а в пятницу 89 мин. Записав эти числа от меньшего к большему, посередине стоит число 76 – это называется медиана.
Статистические исследования.
«Статистика знает всё»,- утверждали Ильф и Петров в своем знаменитом романе «Двенадцать стульев» и продолжали: «Известно, сколько какой пищи съедает в год средний гражданин республики... Известно, сколько в стране охотников, балерин... станков, велосипедов, памятников, маяков и швейных машинок... Как много жизни, полной пыла, страстей и мысли, глядит на нас со статистических таблиц!..» Зачем нужны эти таблицы, как их составлять и обрабатывать, какие выводы на их основании можно делать – на эти вопросы отвечает статистика (от итальянского stato – государство, латинского status – состояние).
^ 1. СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ
Я вычислила средние затраты на электроэнергию в нашей семье в течение 2010 года:
Расход, кВт/ч
(189 + 155*2 + 106*2 + 102 + 112*2 + 138 + 160 + 156 + 149) : 12 = 136 – среднее арифметическое
^ Когда нужно и не нужно среднее арифметическое?
Имеет смысл вычислять средние траты в семье на продукты, среднюю урожайность картофеля на огороде, средние расходы на продукты, чтобы понять, как поступать в следующий раз, чтобы не было большого перерасхода, среднюю оценку за четверть – по ней поставят оценку за четверть.
Нет смысла вычислять среднюю зарплату моей мамы и Абрамовича, среднюю температуру здорового и больного человека, средний размер обуви у меня и у моего брата.
2. РАЗМАХ
Рост девочек нашего класса самый разный:
151 см, 160 см, 163 см, 162 см, 145 см, 130 см, 131 см, 161 см
Размах составляет 163 – 130 = 33 см. Размах определяет разницу в росте.
^ Когда нужен и не нужен размах?
Размах ряда находят тогда, когда хотят определить, как велик разброс данных в ряду. Например, в течение суток отмечали каждый час температуру воздуха в городе. Для полученного ряда данных полезно не только вычислять среднее арифметическое, показывающее, какова среднесуточная температура, но и найти размах ряда, характеризующий колебание температуры воздуха в течение этих суток. Для температуры на Меркурии, например, размах равен 350 + 150=500 С. Конечно, такого перепада температур человек выдержать не может.
3. МОДА
Я выписала свои оценки за декабрь по математике:
4,5,5,4,4,4,4,5,5,4,5,5,4,5,5,5,5,5,5. Оказалось, что я получила:
«5» - 7, «4» - 5, «3» - 0, «2» - 0
Мода равна 5.
Но мода бывает не одна, например, по природоведению в октябре у меня были такие оценки – 4,4,5,4,4,3,5,5,5. Мод здесь две – 4 и 5
Когда нужна мода?
Мода важна для производителей при определении самого популярного размера одежды, обуви, размеров бутылки сока, пачки чипсов, популярного фасона одежды
4. МЕДИАНА
При анализе результатов, показанных участниками забега учеников класса на 100 метров знание медианы позволяет учителю физкультуры выделить для участия в соревнованиях группу ребят, показавших результат выше срединного.
^ Когда нужна и не нужна медиана?
Медиана чаще применяется с другими статистическими характеристиками, но по неё одной можно отбирать результаты, выше или ниже медианы
^ 5. СОВМЕСТНОЕ ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК
В нашем классе за последнюю проверочную работу по математике по теме «Измерение углов и их виды» были получены следующие оценки: «5» - 10, «4» - 5, «3» - 7, «2» - 1.
Среднее арифметическое - 4.3, размах - 3, мода - 5, медиана – 4.
^ Перспективы и вывод.
Статистические характеристики позволяют изучать числовые ряды. Только все вместе они могут дать объективную оценку ситуации
Нельзя правильно организовывать нашу жизнь, не зная законов математики. Она позволяет изучать, узнавать, исправлять.
Статистика создает фундамент точных и бесспорных фактов, который необходим для теоретических и практических целей.
Математики изобрели статистику потому, что она была нужна обществу
Думаю, что знания, полученные при работе над данной темой, пригодятся мне в дальнейшей учебе и в жизни.
Изучая литературу, я узнала, что есть еще такие характеристики, как среднее квадратичное отклонение, дисперсия и другие.
Однако моих знаний недостаточно, чтобы в них разобраться. О них – в будущем.
^ Список литературы.
Учебное пособие для учащихся 7-9 классов общеобразовательных учреждений «Алгебра. Элементы статистики и теории вероятностей». Ю.Н.Макарычев, Н.Г.Миндюк, под редакцией С.А.Теляковского; Москва. Просвещение. 2005 г.
Статьи из приложения к газете «Первое сентября. Математика».
Энциклопедический СЛОВАРЬ ЮНОГО МАТЕМАТИКА
http://statist.my1.ru/
http://art.ioso.ru/seminar/2009/projects11/rezim/stat1.html
К основным статистическим характеристикам ряда измерений (вариационного ряда) относятся характеристики положения (средние характеристики, или центральная тенденция выборки ); характеристики рассеяния (вариации, или колеблемости ) и характеристики формы распределения.
К характеристикам положения относятся среднее арифметическое значение (среднее значение ), мода и медиана.
К характеристикам рассеяния (вариации, или колеблемости ) относятся: размах вариации , дисперсия , среднее квадратическое (стандартное ) отклонение , ошибка средней арифметической (ошибка средней ), коэффициент вариации и др.
К характеристикам формы относятся коэффициент асимметрии, мера скошенности и эксцесс.
Характеристики положения
Среднее арифметическое значение – одна из основных характеристик выборки.
Она, как и другие числовые характеристики выборки, может вычисляться как по необработанным первичным данным, так и по результатам группировки этих данных.
Точность вычисления по необработанным данным выше, но процесс вычисления оказывается трудоёмким при большом объёме выборки.
Для несгруппированных данных среднее арифметическое определяется по формуле:
где n - объем выборки, х 1 , х 2 , ... х n - результаты измерений.
Для сгруппированных данных:
где n - объем выборки, k – число интервалов группировки, n i – частоты интервалов, x i – срединные значения интервалов.
Мода
Определение 1. Мода - наиболее часто встречающаяся величина в данных выборки. Обозначается Мо и определяетсяпо формуле:
где - нижняя граница модального интервала, - ширина интервала группировки, - частота модального интервала, - частота интервала, предшествующего модальному, - частота интервала, последующего за модальным.
Определение 2. Модой Мо дискретной случайной величины называется наиболее вероятное её значение.
Геометрически моду можно интерпретировать как абсциссу точки максимума кривой распределения. Бывают двухмодальные и многомодальные распределения. Встречаются распределения, которые имеют минимум, но не имеют максимума. Такие распределения называются антимодальными .
Определение. Модальным интервалом называется интервал группировки с наибольшей частотой.
Медиана
Определение . Медиана - результат измерения, который находится в середине ранжированного ряда, иначе говоря, медианой называется значение признака Х , когда одна половина значений экспериментальных данных меньше её, а вторая половина – больше, обозначается Ме .
Когда объем выборки n - четное число, т. е. результатов измерений четное количество, то для определения медианы рассчитывается среднее значение двух показателей выборки, находящихся в середине ранжированного ряда.
Для данных, сгруппированных в интервалы, медиану определяют по формуле:
,
где - нижняя граница медианного интервала; ширина интервала группировки, 0,5n – половина объёма выборки, - частота медианного интервала, - накопленная частота интервала, предшествующего медианному.
Определение. Медианным интервалом называется тот интервал, в котором накопленная частота впервые окажется больше половины объёма выборки (n/ 2) или накопленная частость окажется больше 0,5.
Численные значения среднего, моды и медианы отличаются, когда имеет место несимметричная форма эмпирического распределения.
Характеристики рассеяния результатов измерений
Для математико-статистического анализа результатов выборки знать только характеристики положения недостаточно. Одна и та же величина среднего значения может характеризовать совершенно различные выборки.
Поэтому кроме них в статистике рассматривают также характеристики рассеяния (вариации, или колеблемости ) результатов .
Размах вариации
Определение. Размахом вариации называется разница между наибольшим и наименьшим результатами выборки, обозначается R и определяется
R =X max - X min .
Информативность этого показателя невелика, хотя при малых объёмах выборки по размаху легко оценить разницу между лучшим и худшим результатами спортсменов.
Дисперсия
Определение. Дисперсией называется средний квадрат отклонения значений признака от среднего арифметического.
Для несгруппированных данных дисперсия определяется по формуле
s 2 =
, (1)
где Х i – значение признака, - среднее арифметическое.
Для данных, сгруппированных в интервалы, дисперсия определяется по формуле
,
где х i – среднее значение i интервала группировки, n i – частоты интервалов.
Для упрощения расчётов и во избежание погрешностей вычисления при округлении результатов (особенно при увеличении объёма выборки) используются также другие формулы для определения дисперсии. Если среднее арифметическое уже вычислено, то для несгруппированных данных используется следующая формула:
для сгруппированных данных:
.
Эти формулы получаются из предыдущих раскрытием квадрата разности под знаком суммы.
Цель работы: научиться обрабатывать статистические данные в электронных таблицах с помощью встроенных функций; изучить возможности Пакета анализа в MS Excel 2010 и его некоторые инструменты: Генерация случайных чисел, Гистограмма, Описательная статистика.
Теоретическая часть
Очень часто для обработки данных, полученных в результате обследования большого числа объектов или явлений (статистических данных ), используются методы математической статистики.
Современная математическая статистика подразделяется на две обширные области: описательную и аналитическую статистику . Описательная статистика охватывает методы описания статистических данных, представления их в форме таблиц, распределений и пр.
Аналитическая статистика называется также теорией статистических выводов. Ее предметом является обработка данных, полученных в ходе эксперимента, и формулировка выводов, имеющих прикладное значение для самых различных областей человеческой деятельности
Полученный в результате обследования набор чисел называетсястатистической совокупностью.
Выборочной совокупностью (или выборкой ) называется совокупность случайно отобранных объектов. Генеральной совокупностью называется совокупность объектов, из которой производится выборка. Объемом совокупности (генеральной или выборочной) называется число объектов этой совокупности.
Для статистической обработки результаты исследования объектов представляют в виде чисел x 1 , x 2 , …, x k . Если значение x 1 наблюдалось n 1 раз, значение x 2 наблюдалось n 2 раз, и т.д., то наблюдаемые значения x i называются вариантами , а числа их повторений n i называются частотами . Процедура подсчета частот называется группировкой данных.
Объем выборки n равен сумме всех частот n i :
Относительной частотой значения x i называется отношение частоты этого значения n i к объему выборки n :
. (2)
Статистическим распределением частот (или просто распределением частот ) называется перечень вариант и соответствующих им частот, записанных в виде таблицы:
|
|
|
|
|
|
|
|
|
|
|
Распределением относительных частот называется перечень вариант и соответствующих им относительных частот.
1. Основные статистические характеристики.
Современные электронные таблицы имеют огромный набор средств для анализа статистических данных. Наиболее часто используемые статистические функции встраиваются в основное ядро программы, то есть эти функции доступны с момента запуска программы. Другие более специализированные функции входят в дополнительные подпрограммы. В частности, в Excel, такая подпрограмма называется Пакетом анализа. Команды и функции пакета анализа называют Инструментами анализа. Мы ограничимся изучением нескольких основных встроенных статистических функций и наиболее полезных инструментов анализа из пакета анализа в электронной таблице Excel.
Среднее значение.
Функция СРЗНАЧ вычисляет выборочное (или генеральное) среднее, то есть среднее арифметическое значение признака выборочной (или генеральной) совокупности. Аргументом функции СРЗНАЧ является набор чисел, как правило, задаваемый в виде интервала ячеек, например, =СРЗНАЧ (А3:А201).
Дисперсия и среднее квадратическое отклонение.
Для
оценки разброса данных используются
такие статистические характеристики,
как дисперсия D
и среднее квадратическое
(или стандартное) отклонение
.
Стандартное отклонение есть квадратный
корень из дисперсии:
.
Большое стандартное отклонение указывает
на то, что значения измерения сильно
разбросаны относительно среднего, а
малое – на то, что значения сосредоточены
около среднего.
В Excel
имеются функции, отдельно вычисляющие
выборочную дисперсиюD
в
и стандартное отклонение
в
и генеральные дисперсиюD
г и
стандартное отклонение
г.
Поэтому, прежде чем вычислять дисперсию
и стандартное отклонение, следует четко
определиться, являются ли ваши данные
генеральной совокупностью или выборочной.
В зависимости от этого нужно использовать
для расчетаD
г и
г,D
в
и
в
.
Для
вычисления выборочной дисперсии D
в
и выборочного стандартного отклонения
в
имеются функции ДИСП) и СТАНДОТКЛОН.
Аргументом этих функций является набор
чисел, как правило, заданный диапазоном
ячеек, например, =ДИСП (В1:В48).
Для
вычисления генеральной дисперсии D
г и генерального стандартного отклонения
г имеются функции ДИСПР и СТАНДОТКЛОНП,
соответственно.
Аргументы этих функций такие же как и для выборочной дисперсии.
Объем совокупности.
Объем совокупности выборочной или генеральной – это число элементов совокупности. Функция СЧЕТ определяет количество ячеек в заданном диапазоне, которые содержат числовые данные. Пустые ячейки или ячейки, содержащие текст, функция СЧЕТ пропускает. Аргументом функции СЧЕТ является интервал ячеек, например: =СЧЕТ (С2:С16).
Для определения количества непустых ячеек, независимо от их содержимого, используется функция СЧЕТ3. Ее аргументом является интервал ячеек.
Мода и медиана.
Мода – это значение признака, которое чаще других встречается в совокупности данных. Она вычисляется функцией МОДА. Ее аргументом является интервал ячеек с данными.
Медиана – это значение признака, которое разделяет совокупность на две равные по числу элементов части. Она вычисляется функцией МЕДИАНА. Ее аргументом является интервал ячеек.
Размах варьирования. Наибольшее и наименьшее значения.
Размах варьирования R – это разность между наибольшимx max и наименьшим x min значениями признака совокупности (генеральной или выборочной):R =x max –x min . Для нахождения наибольшего значенияx max имеется функция МАКС (или MAX), а для наименьшегоx min – функция МИН (или MIN). Их аргументом является интервал ячеек. Для того, чтобы вычислить размах варьирования данных в интервале ячеек, например, от А1 до А100, следует ввести формулу: =МАКС (А1:А100)-МИН (А1:А100).
Отклонение случайного распределения от нормального.
Нормально
распределенные случайные величины
широко распространены на практике,
например, результаты измерения любой
физической величины подчиняются
нормальному закону распределения.
Нормальным называется распределение
вероятностей непрерывной случайной
величины, которое описывается плотностью

,
где
дисперсия,
- среднее значение случайной величины
.
Для оценки отклонения распределения данных эксперимента от нормального распределения используются такие характеристики как асимметрия А и эксцессЕ . Для нормального распределенияА =0 иЕ =0.
Асимметрия
показывает, на сколько распределение
данных несимметрично относительно
нормального распределения: если А
>0,
то большая часть данных имеет значения,
превышающие среднее
;
еслиА
<0, то большая часть данных
имеет значения, меньшие среднего
.
Асимметрия вычисляется функцией СКОС.
Ее аргументом является интервал ячеек
с данными, например, =СКОС (А1:А100).
Эксцесс
оценивает «крутость», т.е. величину
большего или меньшего подъема максимума
распределения экспериментальных данных
по сравнению с максимумом нормального
распределения. Если Е
>0, то максимум
экспериментального распределения выше
нормального; еслиЕ
<0, то максимум
экспериментального распределения ниже
нормального. Эксцесс вычисляется
функцией ЭКСЦЕСС, аргументом которой
являются числовые данные, заданные, как
правило, в виде интервала ячеек, например:
=ЭКСЦЕСС (А1:А100).
Задание 1. Применение статистических функций
Одним и тем же вольтметром было измерено 25 раз напряжение на участке цепи. В результате опытов получены следующие значения напряжения в вольтах: 32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35, 34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30.Найдите выборочные среднюю, дисперсию, стандартное отклонение, размах варьирования, моду, медиану. Проверить отклонение от нормального распределения, вычислив асимметрию и эксцесс.
Наберите результаты эксперимента в столбец А.
В ячейку В1 наберите «Среднее», в В2 – «выборочная дисперсия», в В3 – «стандартное отклонение», в В4 – «Максимум», в В5 – «Минимум», в В6 – « Размах варьирования», в В7 – «Мода», в В8 – «Медиана», в В9 – «Асимметрия», в В10 – «Эксцесс». Выровняйте ширину этого столбца с помощью Автоподбора ширины.
Выделите ячейку С1 и нажмите на знак «=» в строке формул. С помощью Мастера функций в категорииСтатистические найдите функцию СРЗНАЧ, затем выделите интервал ячеек с данными и нажмитеEnter .
Выделите ячейку С2 и нажмите на знак «=» в строке формул. С помощью помощью Мастера функций в категорииСтатистические найдите функцию ДИСП, затем выделите интервал ячеек с данными и нажмитеEnter .
Проделайте самостоятельно аналогичные действия для вычисления стандартного отклонения, максимума, минимума, моды, медианы, асимметрии и эксцесса.
Для вычисления размаха варьирования в ячейку С6 следует ввести формулу: =МАКС (А1:А25)-МИН(А1:А25).
Лабораторная работа №9
Статистический анализ данных
Цель работы: научиться обрабатывать статистические данные в электронных таблицах с помощью встроенных функций; изучить возможности Пакета анализа в MS Excel 2010 и его некоторые инструменты: Генерация случайных чисел, Гистограмма, Описательная статистика.
Теоретическая часть
Очень часто для обработки данных, полученных в результате обследования большого числа объектов или явлений (статистических данных ), используются методы математической статистики.
Современная математическая статистика подразделяется на две обширные области: описательную и аналитическую статистику . Описательная статистика охватывает методы описания статистических данных, представления их в форме таблиц, распределений и пр.
Аналитическая статистика называется также теорией статистических выводов. Ее предметом является обработка данных, полученных в ходе эксперимента, и формулировка выводов, имеющих прикладное значение для самых различных областей человеческой деятельности
Полученный в результате обследования набор чисел называетсястатистической совокупностью.
Выборочной совокупностью (или выборкой ) называется совокупность случайно отобранных объектов. Генеральной совокупностью называется совокупность объектов, из которой производится выборка. Объемом совокупности (генеральной или выборочной) называется число объектов этой совокупности.
Для статистической обработки результаты исследования объектов представляют в виде чисел x 1 , x 2 , …, x k . Если значение x 1 наблюдалось n 1 раз, значение x 2 наблюдалось n 2 раз, и т.д., то наблюдаемые значения x i называются вариантами , а числа их повторений n i называются частотами . Процедура подсчета частот называется группировкой данных.
Объем выборки n равен сумме всех частот n i :
Относительной частотой значения x i называется отношение частоты этого значения n i к объему выборки n :
Статистическим распределением частот (или просто распределением частот ) называется перечень вариант и соответствующих им частот, записанных в виде таблицы:
| … | ||||
| … |
Распределением относительных частот называется перечень вариант и соответствующих им относительных частот.
Основные статистические характеристики.
Современные электронные таблицы имеют огромный набор средств для анализа статистических данных. Наиболее часто используемые статистические функции встраиваются в основное ядро программы, то есть эти функции доступны с момента запуска программы. Другие более специализированные функции входят в дополнительные подпрограммы. В частности, в Excel, такая подпрограмма называется Пакетом анализа. Команды и функции пакета анализа называют Инструментами анализа. Мы ограничимся изучением нескольких основных встроенных статистических функций и наиболее полезных инструментов анализа из пакета анализа в электронной таблице Excel.
Среднее значение.
Функция СРЗНАЧ вычисляет выборочное (или генеральное) среднее, то есть среднее арифметическое значение признака выборочной (или генеральной) совокупности. Аргументом функции СРЗНАЧ является набор чисел, как правило, задаваемый в виде интервала ячеек, например, =СРЗНАЧ (А3:А201).
Тип урока : урок изучения нового материала.
Цель урока: Создание условий для усвоения темы на уровне осмысления и первичного запоминания; для формирования математической компетенции личности учащегося
Образовательные:
сформировать представление о статистике как науке; ознакомить учащихся с понятиями основных статистических характеристик; сформировать умения находить среднее арифметическое, размах, моду, медиану ряда, анализировать данные.
Развивающие:
способствовать владению понятиями и их толкованием; развитию надпредметных навыков анализа, сравнения, систематизации и обобщения; способствовать формированию ключевых компетенций (познавательной, информационной, коммуникативной) на различных этапах урока, способствовать формированию у учащихся единой научной картины мира путем выявления межпредметных связей статистики и различных наук.
Воспитательные:
воспитывать интерес к изучаемому предмету, информационную культуру; готовность к выполнению общепринятых норм и правил, высокой работоспособности и организованности.
Используемые технологии
: Технология МДО.
Необходимое оборудование
, материалы
: мультимедийный проектор, компьютер, интерактивная доска.
План урока
Организационный момент. Класс разделен на 4 группы.
Включить видеоролик из фильма Служебный роман.
Файл "WMV" (.wmv)
Как вы думаете, о каком понятии мы сегодня будем говорить?
…….. верно, о статистике
Что такое статистика? (Слайд 2)
…….. вот такое определение нам выдаёт словарь (Слайд 3)
Влияет ли статистика на жизнь людей, на общество? Выскажете свои предположения по желанию.
Статистика как наука включает разные разделы: политическая, экономическая, прикладная, правовая, медицинская и др.
Нас будет интересовать математическая статистика. В чём особенность мат статистики?
…….. конечно с помощью математики (Слайд 4)
Математическая статистика обладает рядом характеристик. (на доске перевернуть слово «статистические характеристики»).
Перед вами понятия. (на доске таблички со словами:биссектриса, лунула, мюли, среднее арифметическое, медиана, мода, размах, диаметр, середина, максимум, оптимум, инварианта, константа, высота) Предположите, какие из них можно отнести к статистическим, как вы думаете?
(Предложенные слова поставить после слова статистические характеристики)
Сейчас вы обратитесь к текстам, которые помогут вам подтвердить или опровергнуть ваши предположения: являются ли выбранные понятия статистическими характеристиками и насколько велико влияние статистики на жизнь общества. Каждый ученик получил таблицу (Приложение 1), которую должен заполнить в течении урока.. Давайте вспомним правила работы в группе: спокойно, самостоятельно, по-деловому, с распределением обязанностей. Группа должна заполнить таблицу (Приложение 2)
Работа в группах. Тексты для групп. Приложение 3. (10 мин)
Защита (слайд с определением + слайд с задачей)
Обязательно заполняем листы-памятки. (У каждой группы спрашиваем, кто, что для себя отметил по данной характеристике в листке-памятке) (Приложение 1,2)
Среднее арифметическое
Наведём порядок в статистических характеристиках
(оставить только 4 характеристики)
1 группа выходят к доске и рассказывают о статистической характеристике - среднее арифметическое, решение предложенных задач, выводы. (Слайд 5,6).
2 группа выходят к доске и рассказывают о статистической характеристике- мода, решение предложенных задач, выводы. (слайд 7,8)
3 группа выходят к доске и рассказывают о статистической характеристике- размах, решение предложенных задач, выводы. (слайд 9,10)
4 группа выходят к доске и рассказывают о статистической характеристике- медиана, решение предложенных задач, выводы. (слайд 11,12)
Все группы пришли к выводу, что есть взаимосвязь между жизнью общества и статистикой, влияние велико, даже тогда, когда мы этого и не предполагаем.
Давайте обратимся к слайдам и посмотрим как в нашей обыденной жизни статистические характеристики могут себя проявлять.(Слайды с шутками 13-19, 20)
Сейчас мы вам предлагаем поработать статистами. (Раздаются 4 задачи практического содержания) (7 минут)
Итак, с какой статистической характеристикой вы работали в первой задаче, что у вас получилось
…….. мода - цвет глаз и волос (провести быстрый опрос каждой группы)
…….. размах - ширина ладони (провести быстрый опрос каждой группы)
с какой статистической характеристикой вы работали в третьей задаче, что у вас получилось
…….. медиана - размер обуви (провести быстрый опрос каждой группы)
с какой статистической характеристикой вы работали во второй задаче, что у вас получилось
…….. среднее арифметическое - рост (провести быстрый опрос каждой группы)
Судя, по результатам среднестатистический юноша в нашем классе выглядит так (Слайд 21)
А девушка так (Слайд 22)
На такой оптимистичной ноте мы завершаем наше занятие.
(Ответы к заданиям Приложение 5)
Приложение 1.
Приложение 2.
Приложение 3.
Группа 1. Статистика изучает численность отдельных групп населения страны и ее регионов, производство и потребление разнообразных видов продукции, перевозку грузов и пассажиров различными видами транспорта, природные ресурсы и т.п. Результаты статистических исследований широко используются для практических и научных выводов.
Средним арифметическим ряда чисел называется статистическая характеристика, которая позволяет найти частное от деления суммы этих чисел на число слагаемых. Обычно, среднее арифметическое находят тогда, когда хотят определить среднее значение для некоторого ряда данных: среднюю урожайность пшеницы с 1га в районе, средний суточный удой молока от одной коровы на ферме, среднюю выработку одного рабочего и т.п. Заметим, что среднее арифметическое находят только для однородных величин.
Например, при изучении учебной нагрузки учащихся выделили группу из 12 семиклассников. Их попросили отметить в определенный день время (в минутах), затраченное на выполнение домашнего задания по алгебре. Получили такие данные: 23, 18, 25, 20, 25, 25, 32, 37, 34, 26, 34, 25.
Имея этот ряд данных, можно определить, сколько минут в среднем затратили учащиеся на выполнение домашнего задания по алгебре. Для этого указанные числа надо сложить и полученную сумму разделить на количество, т.е. в данном случае 12:
Ср. арифм. ===27
Таким образом, мы нашли, что на выполнение домашнего задания по алгебре учащиеся затратили в среднем по 27 минут.
Найдите среднее арифметическое в следующих задачах:
Задача 1. Из предложенных в таблице загрязняющих атмосферу веществ, отходящих от стационарных источников в ХМАО-Югре, выберите сначала выбросы наиболее распространенных веществ, а потом определите среднее количество этих выбросов за три года, представленных в таблице в тыс.тонн.
| твердые вещества | |||
| газообразные и жидкие вещества | |||
| диоксид серы | |||
| оксиды азота | |||
| оксид углерода |
Задача 2. Определите среднюю температуру воздуха по городу Урай на 14 февраля 2017 года, если известно, что на сайтах: Яндекс -9 o C , Gismeteo -11 o C , rp5 -16 o C , - 11 oC, meteonovosti -15 o C , meteonova -10 o C , synoptic -11 o C .
Роль статистики в нашей жизни настолько значительна, что люди часто не задумываясь и не осознавая, постоянно используют элементы статистической методологии не только в трудовых процессах, но и в повседневном быту. Работая и отдыхая, делая покупки, знакомясь с другими детьми, принимая какие-то решения, человек пользуется определенной системой, имеющихся у него сведений, сложившихся вкусов и привычек, фактов, систематизирует, сопоставляет эти факты, анализирует их, делает вывод и принимает определенные решения, предпринимает конкретные действия. Таким образом, в каждом человеке заложены элементы статистического мышления, представляющего собой способности и к анализу и синтезу информации об окружающем мире.
Группа 2.
Значение слова «статистика
Результаты статистических исследований широко используются для практических и научных выводов.
При обработке данных статистика использует некоторые характеристики, одной из которых является мода. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей.
Мода ряда - значение во множестве наблюдений, которое встречается наиболее часто. Мода = типичность. В ряду 3,4,3,5,5,4,5,3,5 мода = 5. Как наиболее часто встречающееся число.
Иногда в совокупности встречается более, чем одна мода. Например: 6, 2, 6, 6, 8, 9, 9, 9, 10; мода = 6 и 9. В этом случае можно сказать, что совокупность мультимодальна. Из структурных средних величин только мода обладает таким уникальным свойством.
В ряду чисел 69,68,72,74,89,87,84 моды нет.
Мода как средняя величина употребляется чаще для данных, имеющих нечисловую природу. Среди перечисленных цветов автомобилей — белый, черный, синий металлик, белый, синий металлик, белый — мода будет равна белому цвету. При экспертной оценке с её помощью определяют наиболее популярные типы продукта, что учитывается при прогнозе продаж или планировании их производства
Решите следующие задачи:
Задача 1. В реках Ханты-Мансийского Автономного округа обитает много рыб.В реке Большой Юган обитают рыбы щука, окунь, плотва, карась, язь, налим. В реке Аган обитает рыба: щука, окунь, плотва, стерлядь, карась, язь, налим, нельма. В реке Вах обитает рыба: щука, окунь, плотва. В реке Тромъган обитает рыба: щука, окунь, плотва, карась, язь, налим. Совокупность рыб ХМАО-Югры, мультимодальна (щука, окунь и плотва встречаются во всех реках на территории округа. Определите наиболее типичную рыбу в представленных реках.
Залача 2. В таблице показан расход электроэнергии в январе жильцами 9 квартир
Определите моду данного ряда
Группа 3. Значение слова «статистика » за последние два столетия претерпело значительные изменении. Слово «статистика» имеет один корень со словом «государство» (state) и первоначально означало искусство и науку управления: первые преподаватели статистики университетов Германии 18-го века сегодня назывались бы специалистами по общественным наукам. Поскольку решения правительства до некоторой степени основываются на данных о населении, промышленности и т.д. статистики, естественно, стали интересоваться и такими данными, и постепенно слово «статистика» стало означать сбор данных о населении, о государстве, а затем вообще сбор и обработку данных. Нет смысла извлекать данные, если из этого не извлекается какая-то польза. Поэтому одна из основных задач статистики состоит в надлежащей обработке информации.
Сегодня статистика и анализ данных пронизывают практически любую современную область знаний: экономика, реклама, маркетинг, бизнес, медицина, образование и т.д. Она определяет динамику развития, спада или роста общественных явлений. Это наука, которая решает определенные задачи благодаря наличию и развитию статистических методов, в том числе благодаря развивающимся информационным технологиям.
При обработке данных статистика использует некоторые характеристики, одной из которых является медиана.
Медианой называется значение величины, расположенное в центре упорядоченного ряда.
Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц. При этом у одной половины значение признака не больше медианы, у другой - не меньше.
| Медиану находят по следующему алгоритму: Выстраивают числа по возрастанию, Если ряд содержит нечетное количество элементов, то медиана-число, стоящее в середине; Если ряд содержит четное количество элементов, медиана лежит между двумя средними элементами ряда и равна среднему арифметическому, вычисленному по этим двум элементам. Пример . Найти медиану ряда 16,13,15,10,19,22,25,12,18,14,19,14,16,10. Решение. Выстроим ряд по возрастанию: 10,10,12,13,14,14,15,16,16,18,19,19,22,25, он содержит четное число элементов n=14, следовательно медиана лежит между двумя средними элементами выборки - между 7-элементом и 8-элементом: 10,10,12,13,14,14,15,16,16,18,19,19,22,25 и равна среднему арифметическому этих элементов: Me=(15+16)/2=15,5 |
Приведем примеры реального использования медианы в статистике. Так при анализе результатов, показываемых участниками забега, медиана позволяет выделить группу спортсменов, показавших результат выше серединного и выставлять их в следующий этап соревнований.
Математическим свойством медианы является то, что сумма абсолютных (по модулю) отклонений от медианного значения дает минимально возможное значение. Данный факт находит свое применение, например, при решении транспортных задач, когда нужно рассчитать место строительства объекта около дороги таким образом, чтобы суммарная длина рейсов до него из разных мест была минимальной (остановки, заправки, склады и т.д. и т.п.).
Решите следующие задачи:
Задача 1. Текущие затраты на охрану окружающей среды в ХМАО составили в млн. рублей:
Найдите медиану данного ряда.
Группа 4. Статистика - наука, которая занимается получением, обработкой и анализом количественных данных разнообразных массовых явлениях, происходящих в природе и обществе.
Одной из основных задач статистики состоит в надлежащей обработке информации. Конечно у статистики есть много и других: получение и хранение информации, выработка различных прогнозов, оценка их достоверности и т.д.
Одним из статистических показателей различия или разброса данных является «Размах». Размахом ряда называется разность между наибольшим и наименьшим из этих чисел. Разберем задачу: При изучении учебной нагрузки учащихся выделили группу из 12 человек. Их попросили отметить в определенный день время (в минутах), затраченное на выполнение домашнего задания по алгебре. Получили такие данные: 23, 18, 25, 20, 25, 25, 32, 37, 34, 26, 34, 25.
Наибольший расход времени - 37 минут, а наименьший - 18 минут. Найдем размах ряда:
37-18=19 минут.
Решите следующие задачи:
Задача 1. Река Обь-это артерия Западной Сибири и несет свои воды по такой стране, как Россия. Длина водотока - 3650 км. Река Обь среди рек России вторая, уступает только Лене. Вместе со своим притоком Иртышом, Обь находится на первом месте по протяженности в России (5410 км.) и на втором - в Азии Глубина Оби - от 2-6 м в начале, у г. Бийска, доходит до 25 м у г. Новосибирска (возле ГЭС), уменьшается до 8 м возле устья Томи и вновь увеличивается до 15 м в верховьях Обской губы, куда впадает река. Найдите размах глубины реки Обь.
Задача 2. В период с 17 по 19 декабря отклонение среднесуточной температуры от нормы в ХМАО достигало 16-26 градусов. А 21 декабря администрация Белоярского района ХМАО сообщила о похолодании до - 62 ° C, в Ханты-Мансийске - 40°, в Сургуте - 43°, в Урае - 38°, в Югорске - 42°, в Кондинске - 33°. Найдите размах температуры данных населенных пунктов.
Статистика изучает численность отдельных групп населения страны и ее регионов, производство и потребление разнообразных видов продукции, перевозку грузов и пассажиров различными видами транспорта, природные ресурсы и т.п. Результаты статистических исследований широко используются для практических и научных выводов.
Роль статистики в нашей жизни настолько значительна, что люди часто не задумываясь и не осознавая, постоянно используют элементы статистической методологии не только в трудовых процессах, но и в повседневном быту. Работая и отдыхая, делая покупки, знакомясь с другими детьми, принимая какие-то решения, человек пользуется определенной системой, имеющихся у него сведений, сложившихся вкусов и привычек, фактов, систематизирует, сопоставляет эти факты, анализирует их, делает вывод и принимает определенные решения, предпринимает конкретные действия. Таким образом, в каждом человеке заложены элементы статистического мышления, представляющего собой способности и к анализу и синтезу информации об окружающем мире. Результаты статистических исследований широко используются для практических и научных выводов.
| Приложение 4. Задача 1. Опросите 10 человек из класса. Определите наиболее распространенный среди них цвет волос и глаз. С какой статистической характеристики вы работали? Задача 2. Опросите 10 человек из класса. Измерьте ширину их ладоней. Найдите разность наибольшего и наименьшего значений. Какая статистическая характеристика используется в этой задаче? Задача 3. Опросите 9 человек из класса. Выясните их размер обуви. Выстройте числа в порядке возрастания. Определите медиану ряда. Задача 4. Опросите 10 человек из класса. Выясните их рост. Найдите средний рост респондентов. С каким видом статистической характеристики вы работали? Приложение 5. Ответы к заданиям. |
||
| Среднее арифметическое | ||
| Щука, окунь, плотва | ||









