Главная

Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






Дескриптивная (описательная) статистика


Дескриптивная (описательная) статистика

Статистические ряды данных

Пример 1.1. При обследовании 50 семей получены данные о количестве детей, которые имеют БИНОМРАСП() с числом испытаний равным 10 и вероятностью успеха 0,3 (сгенерировать с помощью пакета Анализа данных). Определите средний размер семьи. Охарактеризуйте колеблемость размера семьи с помощью показателя вариации. Постройте гистограмму и функцию распределения.

Данные для решения примера задают изначально в виде таблиц и их надо поместить на лист Excel; или можно воспользоваться инструментом Анализа данных Генерация случайных чисел.

Генерация случайных чисел позволяет быстро получить нужное количество значений одной или нескольких вариант, имеющих одно из распределений: Равномерное, Нормальное, Бернулли, Биномиальное, Пуассона и другие.

Анализ данных – Генерация случайных чисел

Анализ данных – Описательная статистика. Включить опцию Итоговая Статистика

Встроенные функции использовать, если не нужны все результаты Описательной статистики или для автоматического пересчета результатов (Анализ данных требует обновления).

Анализ данных – Гистограмма

Графическое изображение частотного распределения называется гистограммой. Гистограмма показывает зависимость частоты встречаемости признака от соответствующего значения или интервала группировки. Часто гистограмма используется для сопоставления эмпирического распределения признака с нормальным (для проверки гипотезы о том, что значения данного признака распределены по нормальному закону – очень важному в теории вероятностей типу распределения).

Гистограмма также показывает моду распределения. Чтобы при помощи гистограммы определить моду, надо найти на ней самый высокий столбик. Он соответствует тому значению признака, которое встречается чаще других, т.е. моде. В зависимости от характера распределения наибольшую высоту могут иметь несколько столбиков. Так, распределение часто бывает бимодальным. Если мода имеет только одно значение, распределение называется унимодальным .

Определение числа групп (в Excel это значение называется карманом, а список всех границ интервалов – интервал карманов). Чтобы Excel разбивал выборку, заполнять поле Интервал карманов не надо.

Включите Интегральный процент и Вывод графика.

Можно вычислить число разбиений самостоятельно. Если в основании группировки лежит количественный признак, то число групп определяют по формуле Стерджесса:

n = log2N + 1,

где n – число групп, N – число единиц совокупности.

Величина равных интервалов определяется по формуле:

h = (XmaxXmin) / n.

Правила округления интервалов:

- если интервал имеет один знак ДО запятой, то полученное значение округляется до десятых;

- если величина интервала имеет два знака ДО запятой, то полученное значение округляется до целых;

- если интервал трех, четырех и более значимое число, то интервал принимают кратным 50 или 100.

Описание результатов

Описательная статистика содержит три результата средней характеристики исследования числа детей в пятидесяти семьях: Среднее, Моду и Медиану.

Мода – наиболее часто встречающееся значение признака в данной совокупности объектов.

Медиана – это «серединное» значение признака в том смысле, что у половины объектов значения этого признака меньше медианы, а у другой половины объектов – больше медианы.

Найдем значение коэффициента вариации:

Vx = ×100% = ×100% = 54,63%.

Коэффициент вариации позволяет судить об однородности совокупности:

– < 17% – абсолютно однородная;

– 17–33%% – достаточно однородная;

– 33–40%% – недостаточно однородная;

– 40–60%% – это говорит о большой колеблемости совокупности.

Таким образом, совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному).

Для рассматриваемой выборки можно сделать вывод, что изучаемая совокупность семей является неоднородной. Поэтому можно в качестве среднего использовать моду или медиану/

Стандартное отклонение – наиболее широко используемая характеристика изменения данных – измеряется в тех же единицах, что и исходные данные.

Стандартная ошибка является характеристикой достоверности среднего выборочного значения и используется в статистических исследованиях.

Эксцесс и Ассиметрия позволяют сделать вывод о незначительных отклонениях гистограммы частостей от нормально распределенной случайной величины.

Эталоном этих величин являются нормальное распределение, для которого Ассиметрия равна нулю, а центральный момент четвертого порядка равен трем.

Ассиметрия имеет ненулевое значение. Это означает, что гистограмма не симметрична по отношению к среднему значению выборки и имеет скос вправо (при отрицательной ассиметрии) или влево (при положительной). Соответственно, количество семей, имеющих менее трех детей больше (меньше), чем семей количество детей в которых больше трех.

Если эксцесс отрицательный, то значение гистограммы в точке х ниже аналогичного нормального распределения, иначе – выше.

 

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

СТАТИСТИЧЕСКИЕ ОЦЕНКИ

Имеется случайная величина Х, закон распределения которой известен и зависит от параметров qi. Требуется на основании наблюдаемых данных оценить значения этих параметров.

Числовые характеристики генеральной совокупности, как правило, неизвестны.

Их называют параметрами генеральной совокупности (среднее, дисперсия, среднее квадратическое отклонение, доля признака генеральной совокупности объема N).

Из генеральной совокупности извлекается выборка объема n. По данным выборки рассчитывают числовые характеристики, которые называют статистиками (выборочное среднее, выборочная дисперсия и выборочное среднее квадратическое отклонение). Статистики, полученные по различным выборкам, могут отличаться друг от друга, поэтому они являются только оценками неизвестных параметров генеральной совокупности и обозначают q* = q(х1, …, хn).

Обозначим через х1, х2,…, хn выбранные значения наблюдаемой случайной величины (СВ) Х. Пусть на основе данных выборки получена статистика q* = q(х1, …, хn), которая является оценкой параметра q. Наблюдаемые значения хi – случайные величины, каждая из которых распределена по тому же закону, что и случайная величина Х. Поэтому q* тоже является величиной случайной, закон распределения которой зависит от распределения СВ Х и объема выборки n. Для того чтобы q* имела практическую ценность, она должна обладать свойствами несмещенности, состоятельности и эффективности.

Несмещенной называют оценку, для которой выполняется условие:

М(q*)=q. (2.1)

Состоятельной называется оценка, удовлетворяющая условию:

. (2.2)

Для выполнения условия 2.2 достаточно, чтобы:

. (2.3)

Эффективной считается оценка, которая при заданном объеме выборки имеет наименьшую возможную дисперсию.

Выборочная средняя является несмещенной и состоятельной оценкой генеральной средней и вычисляется по формуле (1.1).

Выборочная дисперсия, найденная по формуле (1.2), является смещенной оценкой для дисперсии генеральной совокупности.

Вводится понятие исправленной выборочной дисперсии, которая является несмещенной оценкой генеральной дисперсии и вычисляется по формуле:

. (2.4)

Исправленное выборочное среднеквадратическое отклонение будет равно:

. (2.5)

Теоретическое обоснование использования этих выборочных оценок для определения характеристик генеральной совокупности дают закон больших чисел и предельные теоремы.

НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ

Чаще других в статистических исследованиях применяется нормальное распределение. Теоретическим основанием к его применению служит центральная предельная теорема Ляпунова. Оно имеет два параметра: среднее (a) и стандартное отклонение (s). В дальнейшем будем использовать сокращенную запись для обозначения этого распределения X ~ N(a, s).

Таким образом, в нормальном распределении 2 параметра – a и s. Соответственно, число степеней свободы будет вычисляться:

число степеней свободы = количество групп – 2 – 1

Синтаксис функции:

Р(Х < x) = НОРМРАСП(х; среднее; стандартное_отклонение; интегральная)

F(X) = Р(Х < x) – функция распределения.

Значение функции распределения случайной величины Х, распределенной по нормальному закону распределения, получится, если аргумент Интегральная равен ИСТИНА (1). Если аргумент интегральная имеет значение ЛОЖЬ (0), то получится значение плотности вероятности нормального распределения (f(x)).

Графики плотности распределения и функции распределения случайной величины X ~ N(65; 2,5) построенные в Excel изображены на рисунке для значений случайной величины, изменяющихся на [60; 70] с шагом 0,5.

Вероятность попадания случайной величины Х в интервал (c, d) определяется по формуле:

Р(c < X < d) = P(X < d) – P(X < c) = НОРМРАСП(d; 65; 2,5; 1) – НОРМРАСП(c; 65; 2,5; 1). (2.6)

Если случайная величина нормально распределена и имеет среднее арифметическое равное нулю и среднее квадратическое отклонение равное единице, то ее называют стандартизованной, а для вычисления вероятности попадания в интервал таких случайных величин в Excel существует функция:

НОРМСТРАСП(х) = Р(Х < х) = 0,5 + Ф(х),

которая возвращает интегральное стандартное распределение.

Ф(х) называют интегральной функцией Лапласа. Для ее вычисления используются специальные таблицы.

При статистических исследованиях оценок довольно часто приходится решать обратную задачу: находить значение варианты (х) по заданной вероятности. Для этого в Excel имеются обратные функции, позволяющие ее решить:

НОРМОБР (вероятность; а; s) и НОРМСТОБР (вероятность).

 

ЛОГНОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ

Свидетельством близости распределения к логнормальному является значительная ассиметрия, обусловленная ограничением Х>0. Например, может использоваться для описания распределения доходов банковских вкладов, месячной заработной платы, посевных площадей и т.д.

Функция ЛОГНОРМРАСП(х; среднее; стандартное_откл) используется для анализа данных, которые были логарифмически преобразованы.

Возвращает интегральное логарифмическое нормальное распределение для х, где ln(x) является нормально распределенным с параметрами среднее и стандартное_откл.

ХИ-КВАДРАТ РАСПРЕДЕЛЕНИЕ

Чаще всего это распределение используется для определения критического значения статистики с заданным уровнем значимости a(q = c2a), для которого выполняется равенство Р(c2 ³ c2a) = a.

Синтаксис: ХИ2РАСП(x; степени_свободы) = Р(Х > х)

x – значение, для которого требуется вычислить распределение.

степени_свободы – число слагаемых минус число линейных связей между элементами совокупности.

Если задано значение вероятности, то функция ХИ2ОБР позволяет найти значение x, для которого справедливо равенство

ХИ2РАСП(x, степень_свободы) = р.

В функции ХИ2ОБР для поиска применяется метод итераций. Если поиск не закончится после 100 итераций, функция возвращает сообщение об ошибке #Н/Д.

РАСПРЕДЕЛЕНИЕ СТЬЮДЕНТА (t)

Это распределение имеет большое значение для статистических выводов. Функция СТЬЮДРАСП возвращает вероятностную меру «хвостов» распределения.

Ее синтаксис:

СТЬЮДРАСП(x; степени_свободы; хвосты)= Р(Х > x)

x – численное значение, для которого требуется вычислить распределение;

степени_свободы – целое, указывающее число степеней свободы;

хвосты – число возвращаемых хвостов распределения.

Если «хвосты» = 1, то функция СТЬЮДРАСП возвращает одностороннее распределение (вероятность правого хвоста).

Если «хвосты» = 2, то функция СТЬЮДРАСП возвращает двустороннее распределение.

При этом значение х не должно быть отрицательным.

Так как функция симметричная относительно нуля, то справедливо следующее равенства:

СТЬЮДРАСП(x; степени_свободы;2) = 2·СТЬЮДРАСП(x; степ_свободы; 1),

Р(–хtх)=1 – СТЬЮДРАСП(x; степени_свободы; 2).

Функция СТЬЮДРАСПОБР(вероятность; степени_свободы) является обратной для распределения Стьюдента и соответствует положительному значению х, для которого задана вероятность суммы двух «хвостов».

РАСПРЕДЕЛЕНИЕ ФИШЕРА

Эту функцию можно использовать, чтобы определить, имеют ли два множества данных различные степени разброса результатов. Например, можно проанализировать результаты тестирования старшеклассников и определить, различается ли разброс результатов для мальчиков и девочек.

Синтаксис: FРАСП(x; степени_свободы1; степени_свободы2) = Р(Х > x)

x – значение, для которого вычисляется функция;

степени_свободы1 – число степеней свободы числителя;

степени_свободы2 – число степеней свободы знаменателя.

Обратное значение для F-распределения вероятностей возвращает функция FРАСПОБР.

Если p = FРАСП(x; ...), то FРАСПОБР(p; ...) = x.

БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ

Распределение используется для моделирования случайной величины с конечным числом испытанной. В каждом испытании случайная величина может принимать только два значения: успех или неуспех (0 или 1). Вероятность успеха постоянна и не зависит от результатов других испытаний. Биномиальное распределение описывает общее число успехов при указанном числе испытаний. Данное распределение требует указать два параметра: число испытаний (n) и вероятность успеха (р).

Пример 2.1. Группа из 20 студентов сдает экзамен. Вероятность сдать экзамен по данным прошлых лет равна 0,3. Отобрано 5 человек. Составьте закон распределения случайной величины Х – числа студентов, сдавших экзамен.

В ячейку В7 помещена функция БИНОМРАСП(А7; $B$1; $B$2; 0) (рис 2.3.).

Скопируйте формулу для остальных ячеек столбца В, как показано на рис. 2.2. Чтобы получить данные столбца С, надо в качестве аргумента интегральная поставить единицу.

С помощью функции БИНОМРАСП можно получить только вероятности равные числу успеха k (интегральная равна нулю) или не большие k (интегральная равна единицы). Для вычисления других вероятностей воспользуйтесь значениями столбцов В и С. Значения в столбцах D, E, F находятся по формулам:

D7 = C7 – B7; E7 = 1 – C7; F7 = 1 – E7.

Диаграмма биномиального распределения построена по ячейкам В7:В12.

В качестве обратной функции к БИНОМРАСП в Excel рассматривается функция КРИТБИНОМ. Ее синтаксис:

КРИТБИНОМ(число_испытаний; вероятность_успеха; альфа) = Р(Х <= x).

КРИТБИНОМ(B1;B2;C10) = 3

РАСПРЕДЕЛЕНИЕ ПУАССОНА

Обычное применение распределения Пуассона состоит в предсказании количества событий, происходящих за определенное время, например: количество машин, появляющихся за 1 минуту на станции техобслуживания.

Синтаксис: ПУАССОН(x; среднее; интегральная)

x – количество событий,

среднее – ожидаемое численное значение,

интегральная – логическое значение, определяющее форму возвращаемого распре-деления вероятностей.

Если аргумент «интегральная» имеет значение ИСТИНА, то функция ПУАССОН возвращает интегральное распределение Пуассона, то есть вероятность того, что число случайных событий будет от 0 до x включительно.

Если этот аргумент имеет значение ЛОЖЬ, то вычисляется значение функции плотности распределения Пуассона, то есть вероятность того, что событий появится равно x раз.

ИНТЕРВАЛЬНЫЕ ОЦЕНКИ

Величина оценки q*, найденная по выборке, является лишь приближенным значением неизвестного параметра. Вопрос о точности оценки в математической статистике устанавливается с помощью соотношения:

Р(|qq*| < Dg) = g, (2.7)

где g – доверительная вероятность или надежность интервальной оценки (принимает значения 90%, 91%,…99%, 99,9%);

Dg – предельная ошибка (точность) оценки. Для случайной величины, имеющей нормальное распределение

Dg = tg s(q). (2.8)

Значение tg вычисляется с помощью функции Лапласа, если s задано в условии по формуле 2 Ф(tg) = g.

Если стандартное отклонение находится по выборке, то рассматривают два случая:

1) n < 30 используется функция Стьюдента:

tg = СТЬЮДРАСПОБР(1 – g; n – 1)

2) n ³ 30 используется функция Лапласа 2 Ф(tg) = g.

Если раскрыть модуль в уравнении (2.7), то получим неравенство:

Р(|–| <) = g, (2.7)

q* – Dg < q < q* + Dg.

Числа q1 = q* – Dg и q2 = q* + Dg. называют доверительными границами, а интервал (q1, q2) – доверительным интервалом или интервальной оценкой параметра.

Границы доверительного интервала симметричны относительно точечной оценки q*. Поэтому точность оценки Dg иногда называют половиной длины доверительного интервала.

Так как q* величина случайная, то границы доверительного интервала могут меняться, кроме того, они будут меняться с изменением доверительной вероятности, поэтому соотношение (2.7) следует читать так: «со статистической надежностью 100% доверительный интервал (q1, q2) содержит параметр генеральной совокупности».

Рассмотрим на примерах, как строятся доверительные интервалы для математического ожидания, дисперсии и среднего квадратического отклонения нормально распределенного количественного признака Х.

ОСНОВНЫЕ ПОНЯТИЯ СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ

Подлежащая проверке гипотеза называется основной (нулевой) обозначают ее Н0. Содержание гипотезы записывается после двоеточия (Н0: q = q 0; Н0: q > q 0; Н0: q < q 0).

Каждой основной гипотезе противопоставляется альтернативная (конкурирующая) гипотеза Н1 (Н1: q ¹ q 0; Н1: q < q 0; Н1: q > 0). Как правило, основной гипотезе можно противопоставить несколько альтернативных гипотез. Если выборочные данные противоречат гипотезе Н0, то гипотеза отклоняется, в противном случае принимается.

Статистическая проверка гипотез, основанная на результатах выборки, связана с риском, принять ложное решение. Если по выборочным данным основная гипотеза отвергнута, в то время как для генеральной совокупности она справедлива, то говорят об ошибке первого рода. Вероятность допустить такую ошибку принято называть уровнем значимости и обозначать a (10%, 9%, …, 1%).

Рассматривается и ошибка второго рода, когда основная гипотеза принимается, в действительности же верной оказывается альтернативная гипотеза. В таком случае говорят об ошибке второго рода, а вероятность допустить эту ошибку обозначают b, величину 1– b называют мощностью критерия.

Поскольку ошибки первого и второго рода исключить невозможно, то в каждом конкретном случае пытаются минимизировать потери от этих ошибок. Увеличение объема выборки является одним из таких путей.

ОБЩАЯ СХЕМА ПРОВЕРКИ ГИПОТЕЗЫ

Проверка гипотезы с помощью уровня значимости.

1. Формулируется нулевая гипотеза и альтернативная ей.

2. Выбирается уровень значимости.

3. Определяется критическая область и область принятия гипотезы.

4. Выбирают критерий, и находят его расчетное значение по выборочным данным.

5. Вычисляют критические точки.

6. Принимается решение.

Другим способом проверки гипотезы является вывод р-значения (значения вероятности). В этом случае не указывается уровень значимости и не принимается решения об отбрасывании нулевой гипотезы. Вместо этого проверяем насколько правдоподобно, что полученная оценка соответствует значению генеральной совокупности. При левостороннем или правостороннем критерии рассчитываются вероятности попадания статистики q в критическую область. Если применяется двусторонний критерий, то оценивается разность между выборочным средним и предполагаемым средним совокупности по модулю. Если р-значение мало, то выборочное среднее значительно отличается от среднего совокупности.

2.4.4 ПРОВЕРКА ГИПОТЕЗЫ О МАТЕМАТИЧЕСКОМ ОЖИДАНИИ (m0) НОРМАЛЬНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ ПРИ ИЗВЕСТНОЙ ДИСПЕРСИИ

Пусть генеральная совокупность имеет нормальное распределение, причем ее математическое ожидание равно m0, а дисперсия равна s2. По выборочным данным найдено m = . Есть основания утверждать, что m = m0?

Н0: m = m0

Н1: m > m0 (или Н1: m < m0; или Н1: m ¹ m0)

На рисунке. приведены возможные варианты проверки нулевой гипотезы. Результаты проверки включают в себя решение о принятии нулевой или альтернативной гипотез, основанные на уровне значимости альфа и р-значении.

Пример 2.4. Клиенты банка в среднем снимают со своего счета 100$ при среднем квадратическом отклонении s = 50$. Если выплаты отдельным клиентам независимы, то, сколько денег должно быть зарезервировано в банке на выплаты клиентам, чтобы их хватило на 100 человек с вероятностью 0,95? Каков при этом будет остаток денег, гарантированный с той же надежностью, если для выплат зарезервировано 16 000$?

На каждого клиента банк резервирует сумму в 160$. По выборочным данным эта сумма составляет 100$.

Проверим гипотезу, может ли банк снизить свои резервы, то есть основная гипотеза может быть записана Н0: 100$ = 160$.

В качестве альтернативной гипотезы рассмотрим ситуацию: «банк сможет обеспечить клиентов, если расчетная сумма выплат для каждого клиента будет снижена до 100$», тогда Н1: m = 100 < m0 = 160$.

Принимается гипотеза Н1, что означает: банк может снизить сумму резервов до 10 000$. Используя р-значения можно сделать вывод: если альтернативная гипотеза верна (в среднем клиент берет 100$ и меньше), то с вероятностью 100% случайная величина m ~ N(100$, 50$).

С надежностью 95% можно гарантировать, что у банка имеется остаток более 6 000$.

СЛУЧАЙ РАВНЫХ ДИСПЕРСИЙ.

Пример 3.1. На заводе проводится эксперимент по оценке новой технологии сборки устройств. Рабочие делятся на две группы; одна обучается новой технологии, другая –стандартной. В конце обучения измеряется время (в минутах), необходимое рабочему для сборки устройства. Результаты приведены в диапазоне А1:В10. Можно ли сделать вывод, исходя из данных выборок, что время сборки по новой технологии меньше, чем по стандартной.

На листе Excel постройте графики для выборок Стандартная и Новая. Разброс (дисперсии равны)данных практически одинаковый, этот вывод можно сделать, изучив амплитуды колебания графиков. Маркеры графика Новая расположены ниже, поэтому можно предположить, что среднее время сбора устройств по новой технологии меньше.

 

Проверим равенство дисперсий с помощью инструмента Двухвыборочный F-тест для дисперсии.

Двухвыборочный F-тест для дисперсии  
     
Стандартная Новая
Среднее 35,22 31,56
Дисперсия 24,44 20,03
Наблюдения 9,00 9,00
df 8,00 8,00
F 1,22  
P(F<=f) одностороннее 0,39  
F критическое одностороннее 3,44  

 

F < Fкр Þ Дисперсии одинаковые.

Выдвигаем гипотезу: «Среднее время сборки по новой технологии не изменилось». Эту гипотезу можно записать в виде:

Н0: mнmст = 0.

Н1: mстmн > 0.

Н1 альтернативная гипотеза, утверждающая «Новая технология сокращает время сборки». Необходимо проверить левосторонний критерий для основной гипотезы.

 

Двухвыборочный t-тест с одинаковыми дисперсиями
     
Стандартная Новая
Среднее 35,222 31,556
Дисперсия 24,444 20,028
Наблюдения
Объединенная дисперсия 22,236  
Гипотетическая разность средних 0,000  
df  
t-статистика 1,649  
P(T<=t) одностороннее 0,059  
t критическое одностороннее 1,746  
P(T<=t) двустороннее 0,119  
t критическое двустороннее 2,120  

 

Описание полученных результатов сравнения средних двух выборок.

Объединенная дисперсия–взвешенное среднее выборочных дисперсий, со степенями свободы каждой дисперсии в качестве весов (8). Она является оценкой общей дисперсии двух выборок и используется для определения стандартной ошибки разности средних.

df – число степеней свободы критерия (18 – 2).

t-статистика вычисляется как отношение разности средних к стандартной ошибке.

Р(Т <= t) одностороннее является односторонним р-значением, если t < 0; если t > 0, то р = 1 –Р(Т <= t). Двустороннее р-значение равно удвоенному одностороннему р-значению.

Найденное расчетное значение t-статистика = 1,649 и t-критическое равное 1,746 сравниваем с учетом, что рассматривалась правосторонняя критическая область, делаем вывод: «Н0 принимается». С 5% уровнем значимости мы не можем отвергнуть предположение о равенстве средних значений выборки.

Если бы рассматривалась левосторонняя гипотеза, то:

tкр = – t-критическое одностороннее.

Можно построить доверительный интервал для разности средних значений выборок.

95% доверительный интервал
     
Разность средних 3,667 Разность средних Стандартной и Новой выборок
Стандартная ошибка 2,2229166 (Разность средних – Гипотетическая разность средних) / t-статистика
t 2,120 t критическое двустороннее
Половина длины 4,7123726 t * Стандартная ошибка
Лев.граница -1,046 Разность средних – Половина длины
Прав.граница 8,379 Разность средних + Половина длины

 

Среднее разности находится как разность E3 – F3,

t – статистика для разности равна t критическому двустороннему (Е14),

стандартная ошибка найдена делением (I3 –E8)/ Е10.

Половина длины равна произведению t на стандартную ошибку.

Доверительный интервал для разности средних значений равен (–1,046; 8,379) с вероятностью 95%.

СЛУЧАЙ РАЗНЫХ ДИСПЕРСИЙ

В данном случае не предполагается равенство дисперсий выборок, но сохраняется требование их нормальности и независимости.

Для принятия решения в таких случаях надо использовать Двухвыборочный t-тест с различными дисперсиями.

Пример 3.2. Для производства нового продукта предлагается две схемы размещения рабочих. Шесть случайно отобранных рабочих собирают изделие по схеме А, а другие восемь–по схеме В. Можно ли сделать вывод с 5% уровнем значимости, что время сборки различаются в схемах, при условии, что они нормальные.

Построим диаграммы данных выборок и сравним среднее время сборки и разброс.

 

Сравнивая графики для схем А и В можно сделать вывод, что разброс данных в схеме А больше, однако среднее время сборки меньше.

Выдвинем гипотезу: «Размещение рабочих не влияет на время сборки изделий:

Н0: mА = mВ,

Н1: mА ¹ mВ.

В качестве альтернативной гипотезы выдвинем предположение:«время сборки изделий по схеме А и В не равны».

Для проверки этой гипотезы следует применить двусторонний критерий. Инструкции по использованию t-теста те же, что и в примере 4.1.

Двувыборочный t-тест с различными дисперсиями
     
Схема А Схема В
Среднее 7,6 9,2
Дисперсия 5,552 1,814
Наблюдения
Гипотетическая разность средних  
df  
t-статистика -1,491  
P(T<=t ) одностороннее 0,090  
t критическое одностороннее 1,895  
P(T<=t) двустороннее 0,180  
t критическое двустороннее 2,365  

Сравнивая расчетное значение t-статистики и t-критическое двустороннее можно сделать вывод, что принимается гипотеза Н0, то есть размещение рабочих не влияет на время сборки изделий.

Используя р-значение 0,180 (18%) можно сделать вывод, что с вероятностью 18% можно получить выборку со средним, отличающимся на 1,6 мин в любом направлении. Доверительный интервал для разности средних составил (–4,138; 0,938).

95% доверительный интервал
   
Средняя выборки -1,600
Стандартная ошибка 1,073
t 2,365
Половина длины 2,538
Лев.граница -4,138
Прав.граница 0,938

 

 

ПАРНЫЙ ВЫБОРОЧНЫЙ КРИТЕРИЙ

Критерий используется в случае, когда одна и та же группа наблюдается дважды. Обычно это происходит при измерении характеристик до и после эксперимента.

Например, студенты могут тестироваться дважды до и после курса по некоторой дисциплине. Можно использовать критерий и для других естественных пар наблюдений.

Пример 3.3. Исследователь хочет определить, имеется ли разница в успешности автомобильных сделок при их проведении продавцами женского и мужского пола. Для этого были выбраны восемь продавщиц и определена комиссия, заработанная каждой в прошедшем году. Так как опытность влияет на размер комиссии, то исследователь записала и стаж работы для каждой из восьми женщин (столбцы А и В). Для проверки предположения были взяты продавцы с тем же стажем работы, что и женщины; значения комиссий мужчин приведены в столбце С. Можем ли мы с уровнем значимости 5% утверждать, что женщины имеют существенно другие показатели, по сравнению с продавцами мужчинами?

 

Нулевая гипотеза состоит в том, что разность средних совокупностей равна нулю. Однако по результатам выборок получено среднее значение разности и она равна 2,25 тыс. рублей. Тогда в качестве альтернативной гипотезы рассмотрим утверждение, что продавцы различных полов имеют различные показатели. Для проверки гипотез применим Двухвыборочный парный t-тест для средних. Результаты применения этого критерия практически ничем не отличаются от предыдущих результатов (пример 4.1, пример 4.2), только в ячейке G7 содержится коэффициент корреляции.

Принимая решение, для данного теста мы вынуждены принять гипотезу о равенстве средних значений комиссии у продавцов мужчин и женщин. Об этом говорят значения t и tкр: –2,365 < 1,895 < 2,365.

В случае проверки с гипотезы с помощью р-значения (р » 14%) можно с вероятностью 14% получить выборку с разностью меньшей чем –2,25 тыс. рублей или большей, чем 2,25 тыс. рублей.

В диапазоне J1:K7 представлены вычисления 95% доверительного интервала для разности средних выборок.

 

АНАЛИЗ ДИСПЕРСИЙ

F-распределение может быть использовано для проверки нулевой гипотезы о равенстве дисперсий двух выборок. Критерий предполагает, что выборки из генеральной совокупности независимы и нормально распределены.

Двусторонний критерий применяется в случае, если альтернативная гипотеза состоит в том, что дисперсии выборок различны. Для этого составляется отношение дисперсий, которое сравнивается с единицей.

Если альтернативная гипотеза проверяет утверждение о том, что дисперсия одной выборки строго больше дисперсии другой выборки, применяется односторонний критерий.

Напомним, что заданный уровень значимости альфа для двустороннего критерия делится пополам.

В примере 3.2. проверялась гипотеза о равенстве средних значений выборок, представляющих две схемы размещения рабочих мест. При этом предполагалось, что дисперсии этих выборок не равны. Воспользуемся данными этого примера и проверим гипотезу о равенстве дисперсий. Применим двусторонний F-тест для 10% уровня значимости (5% на каждый хвост распределения) для проверки нулевой гипотезы о равенстве дисперсий. В качестве альтернативной гипотезы рассматривается утверждение, что дисперсии не равны. На рисунке приведены данные F-теста.

Значение F-статистики записано в ячейке Е8 и равно 3,060. В ячейке Е9 приведен р-значение, которое является правосторонней вероятностью получить значение большее или равное F-статистике. Критическое значение для правосторонней области находится в ячейке Е10 и равно 3,972. такое же значение будет иметь правая граница двусторонней области с уровнем значимости 10%. Так как F = 3,060 меньше Fкр = 3,972, мы не можем отвергнуть нулевую гипотезу равенства дисперсий.

Можно не использовать двувыборочный F-тест для проверки гипотезы о равенстве дисперсий, а воспользоваться функцией FРАСПОБР(вероятность; степенисвоб1; степенисвоб2), т.е. Fкр = FРАСПОБР(0,05; 5; 7)=3,972.

КРИТЕРИЙ КОЛМОГОРОВА–СМИРНОВА

Этот критерий является альтернативой критерию ХИ-квадрат. Его применение не требует вычисления ожидаемых частот и может использоваться для малых выборок. Данные должны представлять случайную выборку и обязательно должна быть сформулирована гипотеза о распределении генеральной совокупности. Нулевая гипотеза утверждает, что генеральная совокупность имеет выбранное распределение с определенным уровнем значимости.

Применение критерия Колмогорова-Смирнова основано на оценке разности функции накопленных частот F*(х) и функции распределения F(х), найденной в предположении, что нулевая гипотеза верна. Статистика критерия вычисляется по формуле:

,

где ,

F*(xi) – функция накопленных частот д



Последнее изменение этой страницы: 2016-06-10

headinsider.info. Все права принадлежат авторам данных материалов.