Главная

Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






ОСНОВНЫЕ ВИДЫ РАСПРЕДЕЛЕНИЯ И ФУНКЦИИ EXCEL, ПОЗВОЛЯЮЩИЕ ПРОВОДИТЬ СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ


 

По виду гистограммы и полученным числовым характеристикам выборки делается предположение о теоретическом виде распределения исследуемого признака. Если это удается, то можно найти оценки числовых характеристик и сделать выводы о параметрах генеральной совокупности. Если закон распределения невозможно установить, то подбирается кривая, наилучшим образом сглаживающая данные статистического ряда. Распределения делятся на дискретные и непрерывные.

Дискретные распределения описываются конечные набором чисел и соответствующими им частотами. Например, оценки, которые может получить студент на экзамене, описываются множеством (2, 3, 4, 5). Поэтому случайная величина Х – получить определенную оценку на экзамене будет иметь дискретное распределение

Непрерывные распределения описывают случайные величины с непрерывной областью значений. Для непрерывных распределений вероятность сопоставляется не с отдельным значением, а интервалом чисел. Непрерывные распределения в теории вероятностей задаются функцией плотности распределения f(x), которую называют плотность вероятности или функцией распределения F(x).

НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ

Чаще других в статистических исследованиях применяется нормальное распределение. Теоретическим основанием к его применению служит центральная предельная теорема Ляпунова. Оно имеет два параметра: среднее (a) и стандартное отклонение (s). В дальнейшем будем использовать сокращенную запись для обозначения этого распределения X ~ N(a, s).

Таким образом, в нормальном распределении 2 параметра – a и s. Соответственно, число степеней свободы будет вычисляться:

число степеней свободы = количество групп – 2 – 1

Синтаксис функции:

Р(Х < x) = НОРМРАСП(х; среднее; стандартное_отклонение; интегральная)

F(X) = Р(Х < x) – функция распределения.

Значение функции распределения случайной величины Х, распределенной по нормальному закону распределения, получится, если аргумент Интегральная равен ИСТИНА (1). Если аргумент интегральная имеет значение ЛОЖЬ (0), то получится значение плотности вероятности нормального распределения (f(x)).

Графики плотности распределения и функции распределения случайной величины X ~ N(65; 2,5) построенные в Excel изображены на рисунке для значений случайной величины, изменяющихся на [60; 70] с шагом 0,5.

Вероятность попадания случайной величины Х в интервал (c, d) определяется по формуле:

Р(c < X < d) = P(X < d) – P(X < c) = НОРМРАСП(d; 65; 2,5; 1) – НОРМРАСП(c; 65; 2,5; 1). (2.6)

Если случайная величина нормально распределена и имеет среднее арифметическое равное нулю и среднее квадратическое отклонение равное единице, то ее называют стандартизованной, а для вычисления вероятности попадания в интервал таких случайных величин в Excel существует функция:

НОРМСТРАСП(х) = Р(Х < х) = 0,5 + Ф(х),

которая возвращает интегральное стандартное распределение.

Ф(х) называют интегральной функцией Лапласа. Для ее вычисления используются специальные таблицы.

При статистических исследованиях оценок довольно часто приходится решать обратную задачу: находить значение варианты (х) по заданной вероятности. Для этого в Excel имеются обратные функции, позволяющие ее решить:

НОРМОБР (вероятность; а; s) и НОРМСТОБР (вероятность).

 

РАСПРЕДЕЛЕНИЯ, СВЯЗАННЫЕ С НОРМАЛЬНЫМ РАСПРЕДЕЛЕНИЕМ

Несмотря на широкое распространение нормального распределения, в некоторых случаях при построении статистических моделей возникает необходимость в использовании других распределений. Приведем примеры некоторых функций в Excel.

ЛОГНОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ

Свидетельством близости распределения к логнормальному является значительная ассиметрия, обусловленная ограничением Х>0. Например, может использоваться для описания распределения доходов банковских вкладов, месячной заработной платы, посевных площадей и т.д.

Функция ЛОГНОРМРАСП(х; среднее; стандартное_откл) используется для анализа данных, которые были логарифмически преобразованы.

Возвращает интегральное логарифмическое нормальное распределение для х, где ln(x) является нормально распределенным с параметрами среднее и стандартное_откл.

ХИ-КВАДРАТ РАСПРЕДЕЛЕНИЕ

Чаще всего это распределение используется для определения критического значения статистики с заданным уровнем значимости a(q = c2a), для которого выполняется равенство Р(c2 ³ c2a) = a.

Синтаксис: ХИ2РАСП(x; степени_свободы) = Р(Х > х)

x – значение, для которого требуется вычислить распределение.

степени_свободы – число слагаемых минус число линейных связей между элементами совокупности.

Если задано значение вероятности, то функция ХИ2ОБР позволяет найти значение x, для которого справедливо равенство

ХИ2РАСП(x, степень_свободы) = р.

В функции ХИ2ОБР для поиска применяется метод итераций. Если поиск не закончится после 100 итераций, функция возвращает сообщение об ошибке #Н/Д.

РАСПРЕДЕЛЕНИЕ СТЬЮДЕНТА (t)

Это распределение имеет большое значение для статистических выводов. Функция СТЬЮДРАСП возвращает вероятностную меру «хвостов» распределения.

Ее синтаксис:

СТЬЮДРАСП(x; степени_свободы; хвосты)= Р(Х > x)

x – численное значение, для которого требуется вычислить распределение;

степени_свободы – целое, указывающее число степеней свободы;

хвосты – число возвращаемых хвостов распределения.

Если «хвосты» = 1, то функция СТЬЮДРАСП возвращает одностороннее распределение (вероятность правого хвоста).

Если «хвосты» = 2, то функция СТЬЮДРАСП возвращает двустороннее распределение.

При этом значение х не должно быть отрицательным.

Так как функция симметричная относительно нуля, то справедливо следующее равенства:

СТЬЮДРАСП(x; степени_свободы;2) = 2·СТЬЮДРАСП(x; степ_свободы; 1),

Р(–хtх)=1 – СТЬЮДРАСП(x; степени_свободы; 2).

Функция СТЬЮДРАСПОБР(вероятность; степени_свободы) является обратной для распределения Стьюдента и соответствует положительному значению х, для которого задана вероятность суммы двух «хвостов».

РАСПРЕДЕЛЕНИЕ ФИШЕРА

Эту функцию можно использовать, чтобы определить, имеют ли два множества данных различные степени разброса результатов. Например, можно проанализировать результаты тестирования старшеклассников и определить, различается ли разброс результатов для мальчиков и девочек.

Синтаксис: FРАСП(x; степени_свободы1; степени_свободы2) = Р(Х > x)

x – значение, для которого вычисляется функция;

степени_свободы1 – число степеней свободы числителя;

степени_свободы2 – число степеней свободы знаменателя.

Обратное значение для F-распределения вероятностей возвращает функция FРАСПОБР.

Если p = FРАСП(x; ...), то FРАСПОБР(p; ...) = x.



Последнее изменение этой страницы: 2016-06-10

headinsider.info. Все права принадлежат авторам данных материалов.