Elettracompany.com

Компьютерный справочник
3 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Нормрасп в excel пример

Нормальное распределение. Построение графика в Excel. Концепция шести сигм

Наверное, не все знают, что в Excel есть встроенная функция для построения нормального распределения. Графики нормального распределения часто используются для демонстрации идей статистической обработки данных.

Функция НОРМРАСП имеет следующий синтаксис:

НОРМРАСП (Х; среднее; стандартное_откл; интегральная)

Х — аргумент функции; фактически НОРМРАСП можно трактовать как y=f(x); при этом функция возвращает вероятность реализации события Х

Среднее (µ) — среднее арифметическое распределения; чем дальше Х от среднего, тем ниже вероятность реализации такого события

Стандартное_откл (σ) — стандартное отклонение распределения; мера кучности; чем меньше σ, тем выше вероятность у тех Х, которые расположены ближе к среднему

Интегральная — логическое значение, определяющее форму функции. Если «интегральная» имеет значение ИСТИНА, функция НОРМРАСП возвращает интегральную функцию распределения, тот есть суммарную вероятность всех событий для аргументов от -∞ до Х; если «интегральная» имеет значение ЛОЖЬ, возвращается вероятность реализации события Х, точнее говоря, вероятность событий находящихся в некотором диапазоне вокруг Х

Например, для µ=0 имеем:

Скачать заметку в формате Word, пример в формате Excel

Здесь по оси абсцисс единица измерения – σ, или (что то же самое), можно сказать, что график построен для σ = 1. То есть, «-2» на графике означает -2σ. По оси ординат шкала убрана умышленно, так как она лишена смысла. Точнее говоря, высота кривой зависит от плотности точек на оси абсцисс, по которым мы строим график. Например, если на интервал от 0 до 1σ приходится 10 точек, то высота в максимуме составит 4%, а если 20 точек – 2%. Здесь проценты означают вероятность попадания случайной величины в узкий диапазон окрестности точки на оси абсцисс. Зато имеет смысл площадь под кривой на определенном интервале. И эта площадь не зависит от плотности точек. Так, например, площадь под кривой на интервале от 0 до 1σ составляет 34,13%. Это значение можно интерпретировать следующим образом: с вероятностью 68,26% случайная величина Х попадет в диапазон µ ± σ.

Теперь, наверное, вам будет лучше понятен смысл выражения «качество шести сигм». Оно означает, что производство налажено таким образом, что случайная величина Х (например, диаметр вала) находясь в диапазон µ ± 6σ, всё еще удовлетворяет техническим условиям (допускам). Это достигается за счет значительного уменьшения сигмы, то есть случайная величина Х очень близка к нормативному значению µ. На графике ниже представлено три ситуации, когда границы допуска остаются неизменными, а благодаря повышению качества (уменьшению вариабельности, сужению сигма) доля брака сокращается:

На первом рисунке только 1,5σ попадают в границы допуска, то есть только 86,6% деталей являются годными. На втором рисунке уже 3σ попадают в границы допуска, то есть 99,75% являются годными. Но всё еще 25 деталей из каждых 10 000 произведенных являются браком. На третьем рисунке целых 6σ попадают в границы допуска, то есть в брак попадут только две детали на миллиард изготовленных!

Вообще-то говоря, измерение качества в терминах сигм использует не совсем нормальное распределение. 🙂 Вот что пишет на эту тему Википедия:

Опыт показывает, что показатели процессов имеют тенденцию изменяться с течением времени. В результате со временем в промежуток между границами поля допуска будет входить меньше, чем было установлено первоначально. Опытным путём было установлено, что изменение параметров во времени можно учесть с помощью смещения в 1,5 сигма. Другими словами, с течением времени длина промежутка между границами поля допуска под кривой нормального распределения уменьшается до 4,5 сигма вследствие того, что среднее процесса с течением времени смещается и/или среднеквадратическое отклонение увеличивается.

Широко распространённое представление о «процессе шесть сигма» заключается в том, что такой процесс позволяет получить уровень качества 3,4 дефектных единиц на миллион готовых изделий при условии, что длина под кривой слева или справа от среднего будет соответствовать 4,5 сигма (без учёта левого или правого конца кривой за границей поля допуска). Таким образом, уровень качества 3,4 дефектных единиц на миллион готовых изделий соответствует длине промежутка 4,5 сигма, получаемых разницей между 6 сигма и сдвигом в 1,5 сигма, которое было введено, чтобы учесть изменение показателей с течением времени. Такая поправка создана для того, чтобы предупредить неправильною оценку уровня дефектности, встречающееся в реальных условиях.

С моей точки зрения, не вполне внятное объяснение. Тем не менее, во всем мире принята следующая таблица соответствия числа дефектов и уровня качества в сигмах:

Exceltip

Блог о программе Microsoft Excel: приемы, хитрости, секреты, трюки

Как построить график с нормальным распределением в Excel

Так как я часто имею дело с большим количеством данных, у меня время от времени возникает необходимость генерировать массивы значений для проверки моделей в Excel. К примеру, если я хочу увидеть распределение веса продукта с определенным стандартным отклонением, потребуются некоторые усилия, чтобы привести результат работы формулы СЛУЧМЕЖДУ() в нормальный вид. Дело в том, что формула СЛУЧМЕЖДУ() выдает числа с единым распределением, т.е. любое число с одинаковой долей вероятности может оказаться как у нижней, так и у верхней границы запрашиваемого диапазона. Такое положение дел не соответствует действительности, так как вероятность возникновения продукта уменьшается по мере отклонения от целевого значения. Т.е. если я произвожу продукт весом 100 грамм, вероятность, что я произведу 97-ми или 103-граммовый продукт меньше, чем 100 грамм. Вес большей части произведенной продукции будет сосредоточен рядом с целевым значением. Такое распределение называется нормальным. Если построить график, где по оси Y отложить вес продукта, а по оси X – количество произведенного продукта, график будет иметь колоколообразный вид, где наивысшая точка будет соответствовать целевому значению.

Таким образом, чтобы привести массив, выданный формулой СЛУЧМЕЖДУ(), в нормальный вид, мне приходилось ручками исправлять пограничные значения на близкие к целевым. Такое положение дел меня, естественно, не устраивало, поэтому, покопавшись в интернете, открыл интересный способ создания массива данных с нормальным распределением. В сегодняшней статье описан способ генерации массива и построения графика с нормальным распределением.

Характеристики нормального распределения

Непрерывная случайная переменная, которая подчиняется нормальному распределению вероятностей, обладает некоторыми особыми свойствами. Предположим, что вся производимая продукция подчиняется нормальному распределению со средним значением 100 грамм и стандартным отклонением 3 грамма. Распределение вероятностей для такой случайной переменной представлено на рисунке.

Из этого рисунка мы можем сделать следующие наблюдения относительно нормального распределения — оно имеет форму колокола и симметрично относительно среднего значения.

Стандартное отклонение имеет немаловажную роль в форме изгиба. Если посмотреть на предыдущий рисунок, то можно заметить, что практически все измерения веса продукта попадают в интервал от 95 до 105 граммов. Давайте рассмотрим следующий рисунок, на котором представлено нормальное распределение с той же средней – 100 грамм, но со стандартным отклонением всего 1,5 грамма

Читать еще:  Чистнз в excel

Здесь вы видите, что измерения значительно плотней прилегают к среднему значению. Почти все производимые продукты попадают в интервал от 97 до 102 грамм.

Небольшое значение стандартного отклонения выражается в более «тощей и высокой кривой, плотно прижимающейся к среднему значению. Чем больше стандартное, тем «толще», ниже и растянутее получается кривая.

Создание массива с нормальным распределением

Итак, чтобы сгенерировать массив данных с нормальным распределением, нам понадобится функция НОРМ.ОБР() – это обратная функция от НОРМ.РАСП(), которая возвращает нормально распределенную переменную для заданной вероятности для определенного среднего значения и стандартного отклонения. Синтаксис формулы выглядит следующим образом:

=НОРМ.ОБР(вероятность; среднее_значение; стандартное_отклонение)

Другими словами, я прошу Excel посчитать, какая переменная будет находится в вероятностном промежутке от 0 до 1. И так как вероятность возникновения продукта с весом в 100 грамм максимальная и будет уменьшаться по мере отдаления от этого значения, то формула будет выдавать значения близких к 100 чаще, чем остальных.

Давайте попробуем разобрать на примере. Выстроим график распределения вероятностей от 0 до 1 с шагом 0,01 для среднего значения равным 100 и стандартным отклонением 1,5.

Как видим из графика точки максимально сконцентрированы у переменной 100 и вероятности 0,5.

Этот фокус мы используем для генерирования случайного массива данных с нормальным распределением. Формула будет выглядеть следующим образом:

=НОРМ.ОБР(СЛЧИС(); среднее_значение; стандартное_отклонение)

Создадим массив данных для нашего примера со средним значением 100 грамм и стандартным отклонением 1,5 грамма и протянем нашу формулу вниз.

Теперь, когда массив данных готов, мы можем выстроить график с нормальным распределением.

Построение графика нормального распределения

Прежде всего необходимо разбить наш массив на периоды. Для этого определяем минимальное и максимальное значение, размер каждого периода или шаг, с которым будет увеличиваться период.

Далее строим таблицу с категориями. Нижняя граница (B11) равняется округленному вниз ближайшему кратному числу. Остальные категории увеличиваются на значение шага. Формула в ячейке B12 и последующих будет выглядеть:

В столбце X будет производится подсчет количества переменных в заданном промежутке. Для этого воспользуемся формулой ЧАСТОТА(), которая имеет два аргумента: массив данных и массив интервалов. Выглядеть формула будет следующим образом =ЧАСТОТА(Data!A1:A175;B11:B20). Также стоит отметить, что в таком варианте данная функция будет работать как формула массива, поэтому по окончании ввода необходимо нажать сочетание клавиш Ctrl+Shift+Enter.

Таким образом у нас получилась таблица с данными, с помощью которой мы сможем построить диаграмму с нормальным распределением. Воспользуемся диаграммой вида Гистограмма с группировкой, где по оси значений будет отложено количество переменных в данном промежутке, а по оси категорий – периоды.

Осталось отформатировать диаграмму и наш график с нормальным распределением готов.

Итак, мы познакомились с вами с нормальным распределением, узнали, что Excel позволяет генерировать массив данных с помощью формулы НОРМ.ОБР() для определенного среднего значения и стандартного отклонения и научились приводить данный массив в графический вид.

Вам также могут быть интересны следующие статьи

12 комментариев

Ренат, добрый день.
Все несколько проще:
Данные->Анализ данных->Генерация случайных чисел (Распределение=Нормальное)
+
Данные->Анализ данных->Гистограмма->Галка на «вывод графика» («Карманы» можно даже не задавать)

Инструкция по подбору параметров нормального распределения в MS Excel

На лист MS Excel в таблицу результатов контроля заносятся следующие данные (рисунок Н.1):

— столбец 1 – истинные значения контролируемого параметра образцов;

— столбец 2 – количество попыток, в которых образец был признан соответствующим;

— столбец 3 – заранее рассчитанная вероятность признания образца соответствующим.

Рисунок Н.1 – Пример заполнения таблицы результатов контроля

Отдельно от таблицы результатов контроля на лист MS Excel заносятся приближенные значения параметров m и s нормального распределения
(см. рисунок Н.1), аппроксимирующего распределение вероятности признания образцов соответствующими.

Приближенные значения указанных параметров определяются следующим образом:

— m определяется как истинное значение параметра образца , для которого вероятность признания образца соответствующим равна 0,5. Если образец, имеющий такое значение параметра, отсутствует, то m рассчитывается по формуле:

, (Н.1)

где , – минимальное и максимальное действительные значения параметра контролируемых образцов.

— s определяется по формуле:

. (Н.2)

Пример – для результатов контроля, представленных на рисунке 1, были получены следующие приближенные значения:

;

.

В столбец 4 таблицы результатов контроля заносятся значения аппроксимирующего нормального распределения (рисунок Н.2), рассчитанные по формуле:

=НОРМРАСП( ;m;s;ИСТИНА) (Н.3)

где – номер ячейки, содержащей предполагаемое истинное значение параметра контролируемого образца, находящейся в той же строке, в столбце 1 таблицы результатов контроля;

m, s – номера ячеек, содержащих значения соответствующих параметров.

«ИСТИНА» – параметр, определяющий применение интегральной функции нормального закона распределения.

В столбец 5 таблицы результатов контроля заносятся значения квадрата разности, рассчитанные по формуле:

(Н.3)

где – номер ячейки, содержащей находящейся в той же строке, в столбце 4 таблицы результатов контроля;

– номер ячейки, содержащей находящейся в той же строке, в столбце 3 таблицы результатов контроля.

В ячейку, соответствующую следующей после окончания таблицы строке и столбцу 5 таблицы результатов контроля заносится значение суммы столбца 5 с помощью кнопки и указания диапазона ячеек столбца 5 с помощью курсора мыши (рисунок Н.3).

Рисунок Н.2 – Схема заполнения столбца 4 таблицы результатов контроля

Рисунок Н.3 – Схема вычисления суммы столбца 5

Для поиска аппроксимирующего нормального распределения методом наименьших квадратов необходимо выбрать пункт «Сервис» главного меню, затем подпункт «Поиск решения» (рисунок Н.4). При том на экране отобразится диалоговое окно «Поиск решения» (рисунок Н.5).

Рисунок Н.4 – Выбор подпункта «Поиск решения»

Рисунок Н.5 – Диалоговое окно «Поиск решения»

В поле ввода «Установить целевую» следует указать номер ячейки, в которой содержится сумма столбца 5.

Переключатель «Равной» следует установить на поле «минимальному значению» (см. рисунок Н.5).

В поле ввода «Изменяя ячейки» указываются номера ячеек, содержащих значения m и s.

В поле ввода «Ограничения:» вводится дополнительное ограничение. Для этого необходимо нажать кнопку «Добавить» справа от поля ввода «Ограничения:», после чего на экране отобразится диалоговое окно «Добавление ограничения» (рисунок Н.6).

В поле ввода «Ссылка на ячейку:» указывается номер ячейки, содержащей значение s.

В поле выбора знака с помощью раскрывающегося меню выбрать знак «>=« (рисунок Н.7).

Рисунок Н.6 – Диалоговое окно «Добавление ограничения»

Рисунок Н.7 – Выбор знака в окне «Добавление ограничения»

В поле ввода «Ограничение:» следует с клавиатуры набрать «0».

После ввода всех параметров ограничения следует нажать кнопку в левом нижнем углу диалогового окна, после чего произойдет возврат в диалоговое окно «Поиск решения», введенное ограничение отобразится в поле ввода «Ограничения».

В диалоговом окне «Поиск решения» после заполнения всех поле ввода для подбора параметров нормального распределения следует нажать кнопку в верхнем правом углу диалогового окна. После завершения расчетов на экране отобразится окно «Результаты поиска решения» (рисунок Н.8).

Читать еще:  Как создать резюме в word

Рисунок Н.8 – Диалоговое окно «Результаты поиска решения»

В диалоговом окне «Результаты поиска решения» следует выбрать опцию «Сохранить найденное решение» и нажать на кнопку в левом нижнем углу диалогового окна.

Точные значения подобранных параметров аппроксимирующего нормального распределения будут отображены в ячейках, в которых ранее находились приближенно рассчитанные значения m и s.

Функции распределения вероятности признания образцов соответствующими и аппроксимирующего нормального распределения можно отобразить графически с помощью диаграммы MS Excel.

Для этого следует, удерживая нажатой клавишу , мышью выделить столбцы 1, 3 и 4 таблицы результатов контроля.

Для построения диаграммы по выбранным столбцам необходимо выбрать пункт «Вставка» главного меню, затем подпункт «Диаграмма» (рисунок Н.9). При том на экране отобразится диалоговое окно «Мастер диаграмм» (рисунок Н.10).

Рисунок Н.9 – Выбор подпункта «Диаграмма»

Рисунок Н.10 – Диалоговое окно «Мастер диаграмм»

В диалоговом окне «Мастер диаграмм» следует выбрать тип диаграммы «Точечная» и вид «Точечная диаграмма со значениями, соединенными сглаживающими линиями» (см. рисунок Н.10).

После выбора нужного типа диаграммы рекомендуется нажать кнопку «Готово», после чего диаграмма будет отображена на листе MS Excel.

Приложение П
(обязательное)

Протокол анализа смещения и сходимости средства контроля № ______


Приложение Р
(рекомендуемое)

Таблица значений распределения Стьюдента

В таблице Р.1 приведены значения t-распределения (распределения Стьюдента).

Шаблон Excel для проверки законов распределения данных наблюдений по критерию согласия Пирсона

Рубрика: Экономика и управление

Дата публикации: 30.03.2019 2019-03-30

Статья просмотрена: 3980 раз

Библиографическое описание:

Фаюстов А. А. Шаблон Excel для проверки законов распределения данных наблюдений по критерию согласия Пирсона // Молодой ученый. — 2019. — №13. — С. 142-147. — URL https://moluch.ru/archive/251/57618/ (дата обращения: 06.04.2020).

В статье рассматривается процедура создания шаблона Excel и опыт его применения для автоматического построения гистограмм и кривых Гаусса по результатам данных экспериментальных наблюдений с одновременной оценкой согласия по критерию Пирсона в учебном процессе. Показываются преимущества данного метода перед ручным счетом по проверке рассмотренного критерия.

Ключевые слова: шаблон Excel, гистограмма, кривая распределения, критерий согласия Пирсона

В современном мире к статистике проявляется большой интерес, поскольку это отличный инструмент для анализа и принятия решений, а также это отличное средство для поиска причин нарушений процесса и их устранения. Статистический анализ применим во многих сферах, где существуют большие массивы данных: металлургии, а также в экономике, биологии, политике, социологии и т. д. Рассмотрим использование некоторых средств статистического анализа, а именно — гистограмм для обработки больших массивов данных.

Целью первичной обработки экспериментальных наблюдений обычно является выбор закона распределения, наиболее хорошо описывающего случайную величину, выборку которой мы наблюдали. Проверка того, насколько хорошо наблюдаемая выборка описывается теоретическим законом, осуществляется с использованием различных критериев согласия. Целью проверки гипотезы о согласии опытного распределения с теоретическим является стремление удостовериться в том, что данная модель теоретического закона не противоречит наблюдаемым данным, и использование ее не приведет к существенным ошибкам при вероятностных расчетах. Некорректное использование критериев согласия может приводить к необоснованному принятию или необоснованному отклонению проверяемой гипотезы [1].

Сходимость результатов наблюдений можно оценить наиболее полно, если их распределение является нормальным. Поэтому исключительно важную роль при обработке результатов наблюдений играет проверка нормальности распределения.

Эта задача представляет собой частный случай более общей проблемы, заключающейся в подборе теоретической функции распределения, в некотором смысле наилучшим образом согласующейся с опытными данными. Сама процедура проверки нормальности распределения относится к распространенной стандартной и довольно тривиальной задаче обработки данных и достаточно подробно и широко описана в различной литературе по метрологии и статистической обработке данных измерений [2- 4].

Данные, получаемые в результате измерений при контроле технологических процессов, оценке характеристик различных объектов и др. для дальнейшей обработки желательно представлять в виде теоретического распределения, максимально соответствующего экспериментальному распределению. Проверку гипотезы о виде функции распределения в настоящее время проводят по различным критериям согласия — Пирсона, Колмогорова, Смирнова и другим в соответствии с новыми разработанными нормативными документами — рекомендациями по стандартизации [5, 6].

Наиболее часто используется критерий Пирсона  2 . Однако применение критериев согласия требует обычно довольно значительного объёма данных. Так, критерий Пирсона обычно рекомендуется использовать при объёме выборки не менее 50…100. Поэтому при небольшом объёме выборки проверку гипотезы о виде функции распределения проводят приближёнными методами — графическим методом или по асимметрии и эксцессу. Применение критерия Пирсона для ручной обработки данных очень подробно было изложено в известной работе [2]. Как свидетельствует опыт проверок согласия экспериментальных данных с теоретическими по различным критериям, эта процедура является очень трудоемкой, требует некоторой усидчивости и особого внимания при обработке от исследователя, как правило, не исключает ошибок в работе и не вызывает особого энтузиазма у выполняющего эту работу.

Решение задач статистического анализа связано со значительными объемами вычислений. Проведение реальных многовариантных статистических расчетов в ручном режиме является очень громоздкой и трудоемкой задачей и без использования компьютера в настоящее время практически невозможно. В настоящее время разработано достаточное количество универсальных и специализированных программных средств для статистического анализа и обработки экспериментальных данных. Автор предлагает к рассмотрению достаточно простой и эффективный шаблон для быстрого построения гистограммы и кривой нормального распределения.

По виду гистограммы можно предположить (принять гипотезу) о том, что выборка случайных чисел подчиняется нормальному закону распределения. Далее, для того чтобы убедиться в правильности выбранной гипотезы надо, первое — построить график гипотетического нормального закона распределения, выбрав в качестве параметров (математического ожидания и среднего квадратического отклонения) их оценки (среднее и стандартное отклонение), и совместить график гипотетического распределения с графиком гистограммы. И, второе — используя в данном случае, как пример, критерий согласия Пирсона, установить справедливость выбранной гипотезы.

Рассмотрим порядок действий при работе с критерием Пирсона в среде Excel.

1. Полученные в результате измерений значения 100 случайных результатов измерений внести в ячейки A1:A100 шаблона Excel и приступить к построению гистограммы на основе данных, назначая длину интервала (карман) и выбирая необходимое число интервалов.

2. Затем на этом же листе создается таблица, в которую посредством формул Excel вносятся основные расчетные величины, используемые для построения гистограммы и кривой Гаусса: среднее арифметическое, стандартное отклонение, минимальное и максимальное значения выборки, размах, величина кармана (рис. 1).

Рис. 1. Фрагмент таблицы с исходными данными

В ячейку D2 вносится формула =СРЗНАЧ(A1:A100), D3: =СТАНДОТКЛОН(A1:A100), D4: =МИН(A1:A100), D5: =МАКС(A1:A100), D6: =D5-D4, D7: =D6/D8. В ячейку D8 вводится число интервалов, которое для числа измерений, равным 100, может быть принято от 7 до 12.

Для оценки оптимального для нашего массива данных количества интервалов можно воспользоваться формулой Стерджесса: k

1+3,322lgN, где N— количество всех значений величины. Например, для N = 100, n = 7,6, которое должно быль округлено до целого числа, округляем до n = 8.

3. Интервал карманов вычисляют так: разность максимального и минимального значений массива, деленная на количество интервалов: .

4. Теперь в каждой ячейке шаг за шагом прибавляем полученное значение ширины кармана: сначала к минимальному значению нашего массива (ячейка D4), затем в следующей ячейке ниже — к полученной сумме и т. д. Так постепенно доходим до максимального значения. Таким образом, мы и построили интервалы карманов в виде столбца значений.

Интервалом считается следующий диапазон: (i-1; i] или i Научный журнал “Молодой Ученый” в социальных сетях:

Построение выборочной функции распределения в Excel

Выборочный метод и выборочная функция распределения

На практике часто бывают ситуации, когда полное исследование каждого объекта из интересующей совокупности по различным причинам невозможно. В этих случаях из всей совокупности объектов случайным образом отбирают ограниченное число объектов и подвергают их исследованию. Вся совокупность объектов, из которых производится выборка называется генеральной совокупностью. Совокупность случайно отобранных из генеральной совокупности объектов называется выборочной совокупностью. Число объектов в совокупности называется ее объемом. На практике сведения о законе распределения случайной величины получают независимыми многократными повторениями опыта. На основе полученной информации из полученной выборки можно вычислить приблизительные значения для функции распределения и другие характеристики случайной величины. Выборочной или эмпирической функцией распределения случайной величины называют функцию равную частоте появления событий F (x)= nx/n.
Для построения выборочной функции распределения весь диапазон изменения случайной величины Х разбивают на ряд интервалов одинаковой ширины (от 5 до 15) и затем вычисляют количество значений случайной величины Х, попав-ших в каждый интервал.

Построение выборочной функции распределения

В табличном процессоре для построения выборочной функции распределения используется специальная функция ЧАСТОТА и инструмент пакета анализа Гистограмма . Функция ЧАСТОТА вычисляет частоты появления случайных величин в интервалах значений и выводит их как массив чисел. Функция имеет параметры:
ЧАСТОТА ( массив_данных; массив_интервалов ),
где:
массив_данных – массив или ссылка на диапазон данных, для которых вычисляются частоты;
массив_интервалов – массив или ссылка на множество интервалов, в которые группируются значения аргумента массив_данных . Количество элементов в возвращаемом массиве на единицу больше, чем в задано в параметре массив_интервалов. Дополнительный элемент содержит количество значений больших, чем максимальное значение в интервалах.
Инструмент Гистограмма служит для вычисления выборочных и интегральных частот попадания данных в указанные интервалы значений. Выходным результатом является таблица и гистограмма. Чтобы включить инструмент Гистограмма следует на ленте Данные в группе Анализ выбрать Анализ данных (Data Analysis) .
В раскрывшемся диалоговом окне Анализ данных из списка следует выбрать Гистограмма (Histogram) (рис. 1) – откроется диалоговое окно Гистограмма . Вид диалогового окна Гистограмма приведен на рис. 2.

Диалоговое окно имеет следующие параметры:
Входной интервал (Input Range) – поле, предназначенное указания адресной ссылки на диапазон, содержащий исследуемые данные;
Интервал карманов ( Bin Range )– поле, в котором может быть указана ссылка на диапазон ячеек, содержащий выбранные интервалы, в которые группируются значения аргумента Входной интервал ;
-поле Выходной диапазон ( Output Range ) предназначено для ввода адресной ссылки на верхнюю левую ячейку выходного диапазона;
-опция Интегральный процент (Comulative Percentage) устанавливает режим генерации интегральных процентных соотношений и включает в гистограмму график интегральных процентов;
— опция Вывод графика (Chart Output) устанавливает режим автоматического вывода графика на рабочий лист, содержащий входной диапазон.
Технологию построения эмпирического распределения рассмотрим на примере.
Пример . Построить эмпирическое распределение рейтинга студентов по результатам экзаменов, оцененных в баллах для следующей произвольной выборки: 48, 51, 64, 62, 55, 71, 74, 79, 80, 86, 91, 99, 83, 50. Задачу решить двумя способами: с применением функции ЧАСТОТА с применением инструмента Гистограмма пакета анализа.

Решение с применением функции ЧАСТОТА
1. В ячейку A2 рабочего листа введем текст “Наблюдения”, а в диапазон A3:A16 – числа из заданной выборки (см рис. 3).

2. В ячейке B2 запишем текст “ Шкала баллов ”, а в ячейки диапазона B3:B6 – баллы, соответствующие шкале для вывода пятибалльной оценки – 50, 70, 85, 100. Это означает, что баллы диапазона 1 – 50 эквивалентны оценке “неудовлетворительно”, баллы, находящиеся в диапазоне 51 – 70 – оценке “удовлетворительно” и т.д.
3. В ячейки C2, D2 и E2 введем тексты “ Абсолютные частоты ”, “ Относительные частоты ” и “ Накопленные частоты ” соответственно. Абсолютные частоты – это частота попадания случайной величины из выборки в соответствующий интервал. Относительная частота представляет собой частное от деления значения относительной частоты на количество элементов выборки. Накопленные частоты – это сумма относительных частот.
4. Выделим диапазон C3:C7 и на ленте Формулы выберем Вставить функцию . В открывшемся окне диалога Мастер функций выберите категорию Статистические , а в списке функций – функцию ЧАСТОТА (рис. 4).

Раскроется диалоговое окно функции ЧАСТОТА .
5. Установим параметры функции:
массив_данных – установим ссылку на диапазон, содержащий выборку случайных величин (A3:A16);
массив_интервалов – установим ссылку на диапазон, содержащий шкалу для вывода оценки (B3:B6).
6. Так как функция ЧАСТОТА возвращает результат в виде массива, нажмем комбинацию клавиш Ctrl + Shift + Enter. В ячейки диапазона C3:C7 будет выведен результат – абсолютные частоты попадания случайных величин в интервалы, заданные в ячейках диапазона B3:B6 (рис. 3).
Таким образом, в результате проведенного исследования получены статистические оценки частот по случайной выборке: неудовлетворительно – 2, удовлетворительно – 4, хорошо – 5, отлично – 3.

Решение с применением инструмента Гистограмма
1. В ячейку A2 рабочего листа введем текст “Наблюдения”, а в диапазон A3:A16 – числа из заданной выборки (см. рис. 5).

2. В ячейке B2 запишите текст “ Шкала баллов ”, а в ячейки диапазона B3:B6 – баллы, соответствующие шкале для вывода пятибалльной оценки.
3. На ленте Данные в группе Анализ выберем Анализ данных – откроется диалоговое окно Анализ данных.
4. В окне диалога Анализ данных выберем из списка Гистограмма – откроется диалоговое окно Гистограмма .
5. Введите параметры в соответствующие поля диалогового окна Гистограмма :
Входной диапазон – укажем диапазон ячеек, в котором размещены результаты выборки (A3:A16);
Интервал карманов –укажем ссылку на диапазон ячеек, содержащий выбранные интервалы – шкалу для вывода оценки (B3:B6);
-установим переключатель Выходной_интервал ;
Выходной диапазон — введем адресную ссылку на верхнюю левую ячейку выходного диапазона (C2);
-установим опцию Интегральный процент ;
-установим опцию Вывод графика .
6. Кликнем на кнопке ОК. В результате на рабочий лист будет выведена таблица и диаграмма .
Как видно из полученных результатов оба рассмотренные способа дают одинаковые результаты. На основании полученных результатов выборочную функцию распределения можно записать в виде:

Ссылка на основную публикацию
ВсеИнструменты 220 Вольт
Adblock
detector