Elettracompany.com

Компьютерный справочник
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Исправленная выборочная дисперсия формула

Выборочная несмещенная дисперсия

Приветствую посетителей блога statanaliz.info. В данной статье рассмотрим, что такое «выборочная несмещенная дисперсия».

Понятие о сплошном и выборочном наблюдении

С точки зрения охвата объекта исследования, статистический анализ можно разделить на два вида: сплошной и выборочный. Сплошной статанализ предполагает изучение генеральной совокупности данных, то есть всего явления во всем его многообразии без распространения выводов на другие элементы, не входящие в анализируемую совокупность. Из названия данного типа явствует, что наблюдению подвергаются тотально все элементы. Результат анализа распространяется на всю генеральную совокупность без каких-либо допущений и поправок на ошибку. Данный тип статистического исследования является наиболее полным и точным, так как дополнительные знания почерпнуть уже неоткуда – информация собрана со всех элементов объекта исследования. Это бесспорный плюс.

Отличным примером сплошного наблюдения является перепись населения. «Всесоюзная перепись населения» — красиво звучало! Кстати, советская статистика, как и наука в целом, была одной из самых лучших в мире. Денег на проведение сплошных обследований не жалели, так как при СССР статистика выполняла свою прямую функцию – исследовала реальность, без чего невозможно было строить «светлое будущее». При этом советские ученые-статистики справедливо критиковали буржуазную статистику за то, что те скрывают от народа реальное положение дел и используют статистику для промывки мозгов. Об этом, кстати, писали и сами буржуи. Более практичный пример сплошного наблюдения – опрос жителей многоэтажного дома на предмет заваривания мусоропровода. Опрашиваются все, результат дает вполне однозначный ответ об отношении жителей к мусоропроводу. Ошибки в выводах маловероятны.

Как бы там ни было, у сплошного наблюдения есть отрицательное качество: на организацию и проведение исследования могут потребоваться значительные ресурсы. Одно дело взять пробу из партии товаров, другое – проверять всю партию. Одно дело опросить тысячу прохожих на улице, совсем другое – организовать перепись населения.

В противовес сплошному придумали выборочное наблюдение. Название метода точно отражает его суть: из генеральной совокупности отбирается и анализируется только часть данных, а выводы распространяют на всю генеральную совокупность. Отбор данных происходит таким образом, чтобы выборка была репрезентативной, то есть, сохранила внутреннюю структуру и закономерности генеральной совокупности. Если это условие не соблюдено, то дальнейший анализ во многом теряет смысл.

Сам анализ выборочных данных происходит так же, как и при сплошном наблюдении (рассчитываются различные показатели, делаются прогнозы и т.д.), только с поправкой на ошибку. Это значит, что рассчитывая тот или иной показатель, мы понимаем, что при повторной выборке его значение будет другим. К примеру, провели опрос общественного мнения. Опрос показал, что за кандидата N желают проголосовать 60% опрошенных. Если провести еще один такой же опрос, даже в том же месте, то результат будет отличаться. То есть, взяв первое значение 60%, следует понимать, что с той или иной вероятностью оно могло быть, скажем, и 58%, и 62%. Точность и разброс выборочных показателей зависят от характера данных и их количества.

У выборочного наблюдения есть один существенный плюс и один минус, однако по сравнению со сплошным наблюдением крайности меняются местами. Плюс заключается в том, что для проведения выборочного обследования требуется гораздо меньше ресурсов. Минус – в том, что выборочное наблюдение всегда ошибочно. Поэтому основная задача проведения выборочного наблюдения – добиться максимальной точности при приемлемых затратах на его проведение.

Выборочная несмещенная дисперсия

И вот, стало быть, дисперсия. Дисперсия, как и доля или средняя арифметическая, также меняет свое значение от выборки к выборке, но здесь есть интересная особенность. Дисперсия ведь рассчитывается от средней величины, а она в свою очередь, тоже рассчитывается по выборке, то есть является ошибочной. Как же это обстоятельство влияет на саму дисперсию?

Если бы мы знали истинную среднюю величину (по генеральной совокупности), то ошибка дисперсии была бы связана только с нерепрезентативностью, то есть с тем, что данные в выборке оказались бы ближе или дальше от средней, чем в целом по генеральной совокупности. При этом при многократном повторении данные стремились бы к своему реальному расположению относительно средней.

Выборочный показатель, который при многократном повторении выборки стремится к своему теоретическому значению, называется несмещенной оценкой. Почему оценкой? Потому что мы не знаем реальное значение показателя (по генеральной совокупности), и с помощью выборочного наблюдения пытаемся его оценить. Оценка показателя – это есть его характеристика, рассчитанная по выборке.

Теперь смотрим внимательно на выборочную среднюю. Выборочная средняя – это несмещенная оценка математического ожидания, так как средняя из выборочных средних стремится к своему теоретическому значению по генеральной совокупности. Где она расположена? Правильно, в центре выборки! Средняя всегда находится в центре значений, по которым рассчитана – на то она и средняя. А раз выборочная средняя находится в центре выборки, то из этого следует, что сумма квадратов расстояний от каждого значения выборки до выборочной средней всегда меньше, чем до любой другой точки, в том числе и до генеральной средней. Это ключевой момент. А раз так, то дисперсия в каждой выборке будет занижена. Средняя из заниженных дисперсий также даст заниженное значение. То есть при многократном повторении эксперимента выборочная дисперсия не будет стремиться к своему истинному значению (как выборочная средняя), а будет смещена относительно истинного значения по генеральной совокупности.

Отклонение выборочной средней от генеральной показано на рисунке.

Несмещенность оценки – одна из важных характеристик статистического показателя. Смещенная оценка показателя заранее говорит о тенденции к ошибке. Поэтому показатели стараются оценивать таким образом, чтобы их оценки были несмещенными (как у средней арифметической). Чтобы решить проблему смещенности выборочной дисперсии, в ее расчет вносят корректировку – умножают на n/(n-1), либо сразу при расчете в знаменатель ставят не n, а n-1. Получается так.

Выборочная смещенная дисперсия:

Выборочная несмещенная дисперсия:

Под выборочной дисперсией понимают, как правило, именно несмещенный вариант.

Теперь посмотрим на практическую сторону отличия смещенной и несмещенной дисперсии. Соотношение между выборочной и генеральной дисперсией составляет n/n-1. Несложно догадаться, что с ростом n (объема выборки) данное выражение стремится к 1, то есть разница между значениями выборочной и генеральной дисперсиями уменьшается.

Так, в выборке из 11 наблюдений относительная разница составляет 11/10 = 10%. При 21 наблюдениях, отличие сокращается до 5%, при 31 наблюдении – до 3,3%, при 51 – до 2%, при 101 – до 1%. Короче, при достаточно большой выборке данных (50 и выше наблюдений) относительная разница между смещенной и несмещенной дисперсией практически исчезает. Оценка параметра, когда с ростом выборки его отклонение от теоретического значения уменьшается, называется асимптотически несмещенной оценкой.

При переходе к среднеквадратичном отклонению по выборке (корень из выборочной дисперсии) разница становится еще меньше.

Таким образом, эффект смещенной дисперсии проявляется в небольших выборках. В больших выборках можно использовать генеральную дисперсию, что как бы не усложняет и не упрощает жизнь. Вручную сейчас никто не считает. Все легко посчитать в Excel. Но понимать различие в терминологии и в сути показателей все же следует.

Из данной статьи неплохо бы усвоить следующее.

1. Формула генеральной дисперсии в выборке дает смещенную оценку.

Читать еще:  Флешка защищена от записи как исправить

2. В знаменателе несмещенной оценки n-1 вместо n.

3. При большом объеме выборки (от 100 наблюдений) разница между смещенной и несмещенной дисперсиями практически исчезает.

4. Стандартное отклонение по выборке – это корень из выборочной дисперсии.

Выборочная дисперсия. Исправленная дисперсия

Оценка параметров генеральной совокупности

Выборочное среднее

Пусть имеется случайная выборка объема n, представленная вариационным рядом <(xj, nj)>, где xj — варианты, nj — частоты, j = 1, 2, …, m. Если мы имеем дело с интервальным вариационным рядом, то xj — середины интервалов.

Выборочное среднее значение определяется по формуле

(3.1)

Если выборка не сгруппирована, то выборочная средняя определяется по формуле

(3.2)

Выборочное среднее является случайной величиной. Её математическое ожидание равно генеральной средней, т.е. выборочное среднее является несмещенной оценкой генеральной средней.

Если у генеральной совокупности генеральная средняя равна a и среднеквадратическое отклонение равно σ, то среднеквадратическое отклонение выборочной средней для повторной выборки вычисляется по формуле

. (3.3)

Среднеквадратическое отклонение выборочной средней для бесповторной выборки вычисляется по формуле

. (3.4)

где N — объем генеральной совокупности.

Для вычисления выборочной средней для не сгруппированной выборки в программе Excel можно воспользоваться следующей функцией (которая вычисляет среднее арифметическое):

Число1, число2, . — это от 1 до 30 аргументов, для которых вычисляется среднее.

  • Аргументы должны быть либо числами, либо именами, массивами или ссылками, содержащими числа.
  • Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются.

Если выборка представлена вариационным рядом, то для вычисления выборочного среднего можно воспользоваться функцией СУММПРОИЗВЕД(массив1;массив2;…), которая вычисляет сумму произведений соответствующих элементов массивов массив1, массив2 и т.д.

Пример 3.1. Найти выборочное среднее для выборки из 10 числовых значений, записанных в ячейках А2:А11 (см. рис. 3.1).

Решение. Введите в ячейку А12 формулу =СРЗНАЧ(А2:А11). Получим значение 1,9.

Пример 3.2. Найти выборочное среднее для выборки, представленной вариационным рядом из 10 числовых значений вариант, записанных в ячейках С2:С11, и 10 значений частот, записанных в ячейках D2:D11 .

Решение. Введите в ячейку C12 формулу

Получим значение 3,571429.

Выборочная дисперсия. Исправленная дисперсия

Выборочная дисперсия s 2 для сгруппированной в вариационный ряд выборки определяется по формуле

(3.5)

Исправленная дисперсия вычисляется по формуле

(3.6)

Если выборка не сгруппирована, то выборочная дисперсия s 2 определяется по формуле

, (3.7)

а исправленная дисперсия — по формуле

(3.8)

Исправленная дисперсия является несмещенной оценкой генеральной дисперсии, т.е. математическое ожидание исправленной дисперсии равно генеральной дисперсии.

В программе Excel для вычисления выборочной дисперсии для выборки, не сгруппированной в вариационный ряд, предназначена функция

Число1, число2. — от 1 до 30 числовых аргументов, соответствующих выборке (числа или диапазоны ячеек).

ДИСПР предполагает, что аргументы представляют всю генеральную совокупность. Если данные представляют только выборку из генеральной совокупности, то дисперсию следует вычислять, используя функцию ДИСП.

Формула для ДИСПР имеет вид (3.7).

Для вычисления исправленной дисперсии предназначена функция

Формула для ДИСП имеет вид (3.8).

Обратите внимание на имена этих функций, можно подумать, что ДИСПР() вычисляет исправленную дисперсию, а ДИСП() — выборочную, тогда как на самом деле функция ДИСП() вычисляет исправленную дисперсию, а ДИСПР() — выборочную.

Дисперсия: генеральная, выборочная, исправленная

Генеральная дисперсия

Пусть нам дана генеральная совокупность относительно случайной величины $X$. Для начала напомним следующее определение:

Генеральная совокупность — совокупность случайно отобранных объектов данного вида, над которыми проводят наблюдения с целью получения конкретных значений случайной величины, проводимых в неизменных условиях при изучении одной случайной величины данного вида.

Генеральная дисперсия — среднее арифметическое квадратов отклонений значений вариант генеральной совокупности от их среднего значения.

Пусть значения вариант $x_1, x_2,dots ,x_k$ имеют, соответственно, частоты $n_1, n_2,dots ,n_k$. Тогда генеральная дисперсия вычисляется по формуле:

Рассмотрим частный случай. Пусть все варианты $x_1, x_2,dots ,x_k$ различны. В этом случае $n_1, n_2,dots ,n_k=1$. Получаем, что в этом случае генеральная дисперсия вычисляется по формуле:

С этим понятием также связано понятие генерального среднего квадратического отклонения.

Попробуй обратиться за помощью к преподавателям

Генеральное среднее квадратическое отклонение — квадратный корень из генеральной дисперсии:

Выборочная дисперсия

Пусть нам дана выборочная совокупность относительно случайной величины $X$. Для начала напомним следующее определение:

Выборочная совокупность — часть отобранных объектов из генеральной совокупности.

Выборочная дисперсия — среднее арифметическое значений вариант выборочной совокупности.

Пусть значения вариант $x_1, x_2,dots ,x_k$ имеют, соответственно, частоты $n_1, n_2,dots ,n_k$. Тогда выборочная дисперсия вычисляется по формуле:

Рассмотрим частный случай. Пусть все варианты $x_1, x_2,dots ,x_k$ различны. В этом случае $n_1, n_2,dots ,n_k=1$. Получаем, что в этом случае выборочная дисперсия вычисляется по формуле:

Задай вопрос специалистам и получи
ответ уже через 15 минут!

С этим понятием также связано понятие выборочного среднего квадратического отклонения.

Выборочное среднее квадратическое отклонение — квадратный корень из генеральной дисперсии:

Исправленная дисперсия

Для нахождения исправленной дисперсии $S^2$ необходимо умножить выборочную дисперсию на дробь $frac$, то есть

С этим понятием также связано понятие исправленного среднего квадратического отклонения, которое находится по формуле:

. В случае, когда значение вариант не являются дискретными, а представляют из себя интервалы, то в формулах для вычисления генеральной или выборочной дисперсий за значение $x_i$ принимается значение середины интервала, которому принадлежит $x_i.$

Пример задачи на нахождение дисперсии и среднего квадратического отклонения

Выборочная совокупность задана следующей таблицей распределения:

Найдем для нее выборочную дисперсию, выборочное среднее квадратическое отклонение, исправленную дисперсию и исправленное среднее квадратическое отклонение.

Для решения этой задачи для начала сделаем расчетную таблицу:

Величина $overline$ (среднее выборочное) в таблице находится по формуле:

Найдем выборочную дисперсию по формуле:

Выборочное среднее квадратическое отклонение:

Исправленное среднее квадратическое отклонение:

Так и не нашли ответ
на свой вопрос?

Просто напиши с чем тебе
нужна помощь

Дисперсия и стандартное отклонение в EXCEL

Вычислим в MS EXCEL дисперсию и стандартное отклонение выборки. Также вычислим дисперсию случайной величины, если известно ее распределение.

Сначала рассмотрим дисперсию , затем стандартное отклонение .

Дисперсия выборки

Дисперсия выборки ( выборочная дисперсия, sample variance ) характеризует разброс значений в массиве относительно среднего .

Все 3 формулы математически эквивалентны.

Из первой формулы видно, что дисперсия выборки это сумма квадратов отклонений каждого значения в массиве от среднего , деленная на размер выборки минус 1.

В MS EXCEL 2007 и более ранних версиях для вычисления дисперсии выборки используется функция ДИСП() , англ. название VAR, т.е. VARiance. С версии MS EXCEL 2010 рекомендуется использовать ее аналог ДИСП.В() , англ. название VARS, т.е. Sample VARiance. Кроме того, начиная с версии MS EXCEL 2010 присутствует функция ДИСП.Г(), англ. название VARP, т.е. Population VARiance, которая вычисляет дисперсию для генеральной совокупности . Все отличие сводится к знаменателю: вместо n-1 как у ДИСП.В() , у ДИСП.Г() в знаменателе просто n. До MS EXCEL 2010 для вычисления дисперсии генеральной совокупности использовалась функция ДИСПР() .

Дисперсию выборки можно также вычислить непосредственно по нижеуказанным формулам (см. файл примера ) =КВАДРОТКЛ(Выборка)/(СЧЁТ(Выборка)-1) =(СУММКВ(Выборка)-СЧЁТ(Выборка)*СРЗНАЧ(Выборка)^2)/ (СЧЁТ(Выборка)-1) – обычная формула =СУММ((Выборка -СРЗНАЧ(Выборка))^2)/ (СЧЁТ(Выборка)-1 ) – формула массива

Дисперсия выборки равна 0, только в том случае, если все значения равны между собой и, соответственно, равны среднему значению . Обычно, чем больше величина дисперсии , тем больше разброс значений в массиве.

Читать еще:  Исправление текста в пдф онлайн

Дисперсия выборки является точечной оценкой дисперсии распределения случайной величины, из которой была сделана выборка . О построении доверительных интервалов при оценке дисперсии можно прочитать в статье Доверительный интервал для оценки дисперсии в MS EXCEL .

Дисперсия случайной величины

Чтобы вычислить дисперсию случайной величины, необходимо знать ее функцию распределения .

Для дисперсии случайной величины Х часто используют обозначение Var(Х). Дисперсия равна математическому ожиданию квадрата отклонения от среднего E(X): Var(Х)=E[(X-E(X)) 2 ]

Если случайная величина имеет дискретное распределение , то дисперсия вычисляется по формуле:

где x i – значение, которое может принимать случайная величина, а μ – среднее значение ( математическое ожидание случайной величины ), р(x) – вероятность, что случайная величина примет значение х.

Если случайная величина имеет непрерывное распределение , то дисперсия вычисляется по формуле:

Для распределений, представленных в MS EXCEL , дисперсию можно вычислить аналитически, как функцию от параметров распределения. Например, для Биномиального распределения дисперсия равна произведению его параметров: n*p*q.

Примечание : Дисперсия, является вторым центральным моментом , обозначается D[X], VAR(х), V(x). Второй центральный момент — числовая характеристика распределения случайной величины, которая является мерой разброса случайной величины относительно математического ожидания .

Примечание : О распределениях в MS EXCEL можно прочитать в статье Распределения случайной величины в MS EXCEL .

Размерность дисперсии соответствует квадрату единицы измерения исходных значений. Например, если значения в выборке представляют собой измерения веса детали (в кг), то размерность дисперсии будет кг 2 . Это бывает сложно интерпретировать, поэтому для характеристики разброса значений чаще используют величину равную квадратному корню из дисперсиистандартное отклонение .

Некоторые свойства дисперсии :

Var(Х+a)=Var(Х), где Х — случайная величина, а — константа.

Var(Х)=E[(X-E(X)) 2 ]=E[X 2 -2*X*E(X)+(E(X)) 2 ]=E(X 2 )-E(2*X*E(X))+(E(X)) 2 =E(X 2 )-2*E(X)*E(X)+(E(X)) 2 =E(X 2 )-(E(X)) 2

Это свойство дисперсии используется в статье про линейную регрессию .

Var(Х+Y)=Var(Х) + Var(Y) + 2*Cov(Х;Y), где Х и Y — случайные величины, Cov(Х;Y) — ковариация этих случайных величин.

Если случайные величины независимы (independent), то их ковариация равна 0, и, следовательно, Var(Х+Y)=Var(Х)+Var(Y). Это свойство дисперсии используется при выводе стандартной ошибки среднего .

Покажем, что для независимых величин Var(Х-Y)=Var(Х+Y). Действительно, Var(Х-Y)= Var(Х-Y)= Var(Х+(-Y))= Var(Х)+Var(-Y)= Var(Х)+Var(-Y)= Var(Х)+(-1) 2 Var(Y)= Var(Х)+Var(Y)= Var(Х+Y). Это свойство дисперсии используется для построения доверительного интервала для разницы 2х средних .

Стандартное отклонение выборки

Стандартное отклонение выборки — это мера того, насколько широко разбросаны значения в выборке относительно их среднего .

По определению, стандартное отклонение равно квадратному корню из дисперсии :

Стандартное отклонение не учитывает величину значений в выборке , а только степень рассеивания значений вокруг их среднего . Чтобы проиллюстрировать это приведем пример.

Вычислим стандартное отклонение для 2-х выборок: (1; 5; 9) и (1001; 1005; 1009). В обоих случаях, s=4. Очевидно, что отношение величины стандартного отклонения к значениям массива у выборок существенно отличается. Для таких случаев используется Коэффициент вариации (Coefficient of Variation, CV) — отношение Стандартного отклонения к среднему арифметическому , выраженного в процентах.

В MS EXCEL 2007 и более ранних версиях для вычисления Стандартного отклонения выборки используется функция =СТАНДОТКЛОН() , англ. название STDEV, т.е. STandard DEViation. С версии MS EXCEL 2010 рекомендуется использовать ее аналог =СТАНДОТКЛОН.В() , англ. название STDEV.S, т.е. Sample STandard DEViation.

Кроме того, начиная с версии MS EXCEL 2010 присутствует функция СТАНДОТКЛОН.Г() , англ. название STDEV.P, т.е. Population STandard DEViation, которая вычисляет стандартное отклонение для генеральной совокупности . Все отличие сводится к знаменателю: вместо n-1 как у СТАНДОТКЛОН.В() , у СТАНДОТКЛОН.Г() в знаменателе просто n.

Стандартное отклонение можно также вычислить непосредственно по нижеуказанным формулам (см. файл примера ) =КОРЕНЬ(КВАДРОТКЛ(Выборка)/(СЧЁТ(Выборка)-1)) =КОРЕНЬ((СУММКВ(Выборка)-СЧЁТ(Выборка)*СРЗНАЧ(Выборка)^2)/(СЧЁТ(Выборка)-1))

Другие меры разброса

Функция КВАДРОТКЛ() вычисляет с умму квадратов отклонений значений от их среднего . Эта функция вернет тот же результат, что и формула =ДИСП.Г( Выборка )*СЧЁТ( Выборка ) , где Выборка — ссылка на диапазон, содержащий массив значений выборки ( именованный диапазон ). Вычисления в функции КВАДРОТКЛ() производятся по формуле:

Функция СРОТКЛ() является также мерой разброса множества данных. Функция СРОТКЛ() вычисляет среднее абсолютных значений отклонений значений от среднего . Эта функция вернет тот же результат, что и формула =СУММПРОИЗВ(ABS(Выборка-СРЗНАЧ(Выборка)))/СЧЁТ(Выборка) , где Выборка — ссылка на диапазон, содержащий массив значений выборки.

Вычисления в функции СРОТКЛ () производятся по формуле:

CFA — Дисперсия и стандартное отклонение.

Рассмотрим дисперсию и стандартное отклонение, — две наиболее широко используемые меры дисперсии для анализа финансовых данных, — в рамках изучения количественных методов по программе CFA.

Среднее абсолютное отклонение позволяет решить проблему, заключающуюся в том, что сумма отклонений от среднего равна нулю. Для этого при расчете среднего используется абсолютное значение отклонений.

Второй подход к расчету отклонений состоит в их возведении в квадрат.

Дисперсия и стандартное отклонение, основанные на квадрате отклонений, являются двумя наиболее широко используемыми мерами дисперсии:

  • Дисперсия определяется как среднее квадратов отклонений от среднего значения.
  • Стандартное отклонение — это положительный квадратный корень дисперсии.

Далее обсуждается расчет и использования дисперсии и стандартного отклонения.

Дисперсия генеральной совокупности.

Если нам известен каждый элемент генеральной совокупности, мы можем вычислить дисперсию генеральной совокупности или просто дисперсию (англ. ‘population variance’).

Она обозначается символом σ 2 [сигма] и представляет собой среднее арифметическое квадратов отклонений от среднего значения.

Формула дисперсии генеральной совокупности.

(mathbf< sigma^2 = < sum_^ ( X_i — mu )^2 over N > >) (формула 11),

где μ [мю] — это среднее генеральной совокупности, а N — размер генеральной совокупности.

Зная среднее значение μ, мы можем использовать Формулу 11 для вычисления суммы квадратов отклонений от среднего с учетом всех N элементов в генеральной совокупности, а затем для определения среднего квадратов отклонений путем деления этой суммы на N.

Независимо от того, является ли отклонение от среднего положительным или отрицательным, возведение в квадрат этой разности дает положительное число.

Таким образом, дисперсия решает проблему отрицательных отклонений от среднего значения, устраняя их посредством операции возведения в квадрат этих отклонений.

Рассмотрим пример.

Прибыль в процентах от выручки для оптовых клубов BJ’s Wholesale Club, Costco и Walmart за 2012 год составляла 0.9%, 1.6% и 3.5% соответственно. Мы рассчитали среднюю прибыль в процентах от выручки как 2.0%.

Следовательно, дисперсия прибыли в процентах от выручки составляет:

(1/3)[(0.9 — 2.0) 2 + (1.6 — 2.0) 2 + (3.5 — 2.0) 2 ]
= (1/3)(-1.1 2 + -0.4 2 + 1.5 2 )
= (1/3)(1.21 + 0.16 + 2.25) = (1/3)(3.62) = 1.21.

Стандартное отклонение генеральной совокупности.

Поскольку дисперсия измеряется в квадратах, нам нужен способ вернуться к исходным единицам. Мы можем решить эту проблему, используя стандартное отклонение, т.е. квадратный корень из дисперсии.

Стандартное отклонение легче интерпретировать, чем дисперсию, поскольку стандартное отклонение выражается в той же единице измерения, что и наблюдения.

Формула стандартного отклонения генеральной совокупности.

Стандартное отклонение генеральной совокупности (или просто стандартное отклонение, а также среднеквадратическое отклонение, от англ. ‘population standard deviation’), определяемое как положительный квадратный корень из дисперсии генеральной совокупности, составляет:

(mathbf< sigma = sqrt^ ( X_i — mu )^2 over N> >) (формула 12),

где μ [мю] — это среднее генеральной совокупности, а N — размер генеральной совокупности.

Используя пример прибыли в процентах от выручки для оптовых клубов BJ’s Wholesale Club, Costco и Walmart за 2012 год, в соответствии с Формулой 12, мы вычислим дисперсию 1.21, а затем возьмем квадратный корень: ( sqrt <1.21>) = 1.10.

Как дисперсия, так и стандартное отклонение являются примерами параметров распределения. В последующих чтениях мы введем понятие дисперсии и стандартного отклонения как меры риска.

Читать еще:  Выборочные средние и исправленные выборочные дисперсии

Занимаясь инвестициями, мы часто не знаем среднего значения интересующей совокупности, обычно потому, что мы не можем практически идентифицировать или провести измерения для каждого элемента генеральной совокупности.

Поэтому мы рассчитываем среднее значение по генеральной совокупности и среднее выборки, взятой из совокупности, и вычисляем выборочную дисперсию или стандартное отклонение выборки, используя формулы, немного отличающиеся от Формул 11 и 12.

Мы обсудим эти вычисления далее.

Однако в инвестициях у нас иногда есть определенная группа, которую мы можем считать генеральной совокупностью. Для четко определенных групп наблюдений мы используем Формулы 11 и 12, как в следующем примере.

Пример расчета стандартного отклонения для генеральной совокупности.

В Таблице 20 представлен годовой оборот портфеля из 12 фондов акций США, которые вошли в список Forbes Magazine Honor Roll 2013 года.

Журнал Forbes ежегодно выбирает американские взаимные фонды, отвечающие определенным критериям для своего почетного списка Honor Roll.

  • сохранение капитала (эффективность на медвежьем рынке),
  • непрерывность управления (у фонда должен управлять менеджер непрерывно, в течение не менее 6 лет), диверсификация портфелей,
  • доступность (дисквалификация фондов, которые закрыты для новых инвесторов), и
  • долгосрочные показатели эффективности после уплаты налогов.

Оборачиваемость или оборот портфеля, показатель торговой активности, является меньшим значением из стоимости продаж или покупок за год, деленным на среднюю чистую стоимость активов за год. Количество и состав списка Forbes Honor Roll меняются из года в год.

Годовой оборот портфеля (%)

Bruce Fund (BRUFX)

CGM Focus Fund (CGMFX)

Hotchkis And Wiley Small Cap Value A Fund (HWSAX)

Aegis Value Fund (AVALX)

Delafield Fund (DEFIX)

Homestead Small Company Stock Fund (HSCSX)

Robeco Boston Partners Small Cap Value II Fund (BPSCX)

Hotchkis And Wiley Mid Cap Value A Fund (HWMAX)

T Rowe Price Small Cap Value Fund (PRSVX)

Guggenheim Mid Cap Value Fund Class A (SEVAX)

Wells Fargo Advantage Small Cap Value Fund (SSMVX)

Stratton Small-Cap Value Fund (STSCX)

Основываясь на данных из таблицы 20, сделайте следующее:

  1. Рассчитайте среднее по совокупности для оборота портфеля за период, используя данные для 12 фондов из Honor Roll.
  2. Рассчитайте дисперсию и стандартное отклонение совокупности для оборота портфеля.
  3. Объясните использование формул в этом примере.

Решение для части 1:

μ = (10 + 360 + 37 + 20 + 49 + 1 + 32 + 72 + 9 + 19 + 16 + 11)/12
= 636 /12 = 53%.

Решение для части 2:

Установив, что μ = 53%, мы можем вычислить дисперсию

( sigma^2 = < sum_^ ( X_i — mu )^2 over N > ), сначала рассчитав числитель, а затем разделив результат на N = 12.

Числитель (сумма квадратов отклонений от среднего) равен:

(10 — 53) 2 + (360 — 53) 2 + (37 — 53) 2 + (20 — 53) 2 +
(49 — 53) 2 + (1 — 53) 2 + (32 — 53) 2 + (72 — 53) 2 +
(9 — 53) 2 + (19 — 53) 2 + (16 — 53) 2 + (11 — 53) 2 = 107,190

Таким образом, σ 2 = 107,190/12 = 8,932.50.

Для расчета стандартного отклонения находим квадратный корень:

Единицей измерения дисперсии является процент в квадрате, поэтому единицей измерения стандартного отклонения также является процент.

Решение для части 3:

Если генеральная совокупность четко определена как фонды Forbes Honor Roll за один конкретный год (2013 г.), и если под оборотом портфеля понимается конкретный одногодичный период, о котором отчитывается Forbes, то применение формул генеральной совокупности для дисперсии и стандартного отклонения уместно.

Результаты 8,932.50 и 94.51 представляют собой, соответственно, перекрестную дисперсию и стандартное отклонение годового оборота портфеля для фондов Forbes Honor Roll за 2013 год.

Фактически, мы не могли должным образом использовать фонды Honor Roll для оценки дисперсии оборота портфеля (например) любой другой по-разному определенной генеральной совокупности, потому что фонды Honor Roll не являются случайной выборкой из какой-либо большей генеральной совокупности взаимных фондов США.

Выборочная дисперсия.

Во многих случаях в управлении инвестициями подгруппа или выборка из генеральной совокупности — это все, что мы можем наблюдать. Когда мы имеем дело с выборками, сводные показатели называются статистикой.

Статистика, которая измеряет дисперсию по выборке, называется выборочной дисперсией или дисперсией выборки (англ. ‘sample variance’).

В приведенном ниже обсуждении обратите внимание на использование латинских букв вместо греческих для обозначения объема выборки.

Формула выборочной дисперсии.

(mathbf< s^2 = < sum_^ ( X_i — overline X )^2 over n-1 > >) (формула 13),

где ( overline X ) — среднее значение выборки, а n — количество наблюдений в выборке.

Формула 13 предписывает нам предпринять следующие шаги для вычисления выборочной дисперсии:

  1. Рассчитать выборочное среднее значение, ( overline X ).
  2. Рассчитать квадратичное отклонение каждого наблюдения от среднего значения по выборке, ( ( X_i — overline X )^2 )
  3. Найти сумму квадратов отклонений от среднего: ( sum_^ ( X_i — overline X )^2 ).
  4. Разделить сумму квадратов отклонений от среднего на (n — 1).

Мы проиллюстрируем расчет выборочной дисперсии и выборочного стандартного отклонения на примере ниже.

Отличие выборочной дисперсии от дисперсии генеральной совокупности.

Мы используем обозначение s 2 для выборочной дисперсии, чтобы отличить ее от дисперсии генеральной совокупности σ 2 .

Формула для выборочной дисперсии почти такая же, как и для дисперсии генеральной совокупности, за исключением использования среднего значения выборки ( overline X ) вместо среднего значения генеральной совокупности μ и другого делителя.

В случае дисперсии генеральной совокупности мы делим числитель на размер совокупности N. Однако для дисперсии выборки мы делим ее на размер выборки минус 1 или n — 1. Используя n — 1 (а не n) в качестве делителя мы улучшаем статистические свойства выборочной дисперсии.

В статистических терминах выборочная дисперсия, определенная в Формуле 13, является несмещенной оценкой (англ. ‘unbiased estimator ‘) дисперсии генеральной совокупности σ 2 .

Мы обсудим эту концепцию далее в чтении о выборке.

Величина n — 1 также называется числом степеней свободы (англ. ‘number of degrees of freedom’) при оценке дисперсии генеральной совокупности. Чтобы оценить дисперсию s 2 , мы должны сначала вычислить среднее. После того как мы вычислили среднее значение выборки, существует только n — 1 независимых отклонений от него.

Стандартное отклонение выборки.

Для стандартного отклонения генеральной совокупности мы аналогичным образом можем вычислить стандартное отклонение выборки, взяв квадратный корень из положительной дисперсии выборки.

Формула стандартного отклонения выборки.

Стандартное отклонение выборки (выборочное стандартное отклонение, выборочное среднеквадратическое отклонение, англ. ‘sample standard deviation’), обозначается символом s и рассчитывается следующим образом:

(mathbf< s = sqrt< sum_^ ( X_i — overline X )^2 over n-1 > >) (формула 14),

где ( overline X ) — среднее значение выборки, а n — количество наблюдений в выборке.

Чтобы рассчитать стандартное отклонение выборки, мы сначала вычисляем дисперсию выборки, используя приведенные выше шаги. Затем мы берем квадратный корень из выборочной дисперсии.

Пример, приведенный ниже, иллюстрирует расчет выборочной дисперсии и стандартного отклонения выборки для двух взаимных фондов, представленных ранее.

Пример расчета выборочной дисперсии и стандартного отклонения выборки.

После расчета геометрических и арифметических средних доходностей двух взаимных фондов в Примере (1) мы вычислили две меры дисперсии для этих фондов, размах и среднее абсолютное отклонение доходности (см. Пример расчета размаха и среднего абсолютного отклонения для оценки риска).

Теперь мы вычислим выборочную дисперсию и стандартное отклонение выборки для доходности тех же двух фондов.

Фонд Selected
American Shares
(SLASX)

Ссылка на основную публикацию
ВсеИнструменты 220 Вольт
Adblock
detector
×
×