Главная

Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






ОЦЕНКА СРЕДНЕГО ПО ДВУМ ВЫБОРКАМ


При анализе экономических показателей довольно часто приходится сравнивать две генеральные совокупности. Например, можно сравнить два варианта инвестирования по размерам средних дивидендов, качество знаний студентов двух университетов–по среднему баллу на комплексном тестовом экзамене. Если дисперсии известны, то можно использовать Двухвыборочный z-тест для средних. Кроме этого существуют три варианта Двухвыборочных t-тестов. Эти три средства допускают следующие условия: равные дисперсии генерального распределения, дисперсии выборок не равны, а также представление двух выборок до и после наблюдения по одному и тому же субъекту.

Запуск инструментов выполняется действия в Анализе данных.

Для выполнения таких проверок инструментами анализа Excel требуется наличие двух выборок, оценка полагаемой разницы между средними значениями выборок и альфа–уровень значимости. Все перечисленные критерии предполагают, что рассматриваемые совокупности нормально распределены, и выборки получены случайно.

СЛУЧАЙ РАВНЫХ ДИСПЕРСИЙ.

Пример 3.1. На заводе проводится эксперимент по оценке новой технологии сборки устройств. Рабочие делятся на две группы; одна обучается новой технологии, другая –стандартной. В конце обучения измеряется время (в минутах), необходимое рабочему для сборки устройства. Результаты приведены в диапазоне А1:В10. Можно ли сделать вывод, исходя из данных выборок, что время сборки по новой технологии меньше, чем по стандартной.

На листе Excel постройте графики для выборок Стандартная и Новая. Разброс (дисперсии равны)данных практически одинаковый, этот вывод можно сделать, изучив амплитуды колебания графиков. Маркеры графика Новая расположены ниже, поэтому можно предположить, что среднее время сбора устройств по новой технологии меньше.

 

Проверим равенство дисперсий с помощью инструмента Двухвыборочный F-тест для дисперсии.

Двухвыборочный F-тест для дисперсии  
     
Стандартная Новая
Среднее 35,22 31,56
Дисперсия 24,44 20,03
Наблюдения 9,00 9,00
df 8,00 8,00
F 1,22  
P(F<=f) одностороннее 0,39  
F критическое одностороннее 3,44  

 

F < Fкр Þ Дисперсии одинаковые.

Выдвигаем гипотезу: «Среднее время сборки по новой технологии не изменилось». Эту гипотезу можно записать в виде:

Н0: mнmст = 0.

Н1: mстmн > 0.

Н1 альтернативная гипотеза, утверждающая «Новая технология сокращает время сборки». Необходимо проверить левосторонний критерий для основной гипотезы.

 

Двухвыборочный t-тест с одинаковыми дисперсиями
     
Стандартная Новая
Среднее 35,222 31,556
Дисперсия 24,444 20,028
Наблюдения
Объединенная дисперсия 22,236  
Гипотетическая разность средних 0,000  
df  
t-статистика 1,649  
P(T<=t) одностороннее 0,059  
t критическое одностороннее 1,746  
P(T<=t) двустороннее 0,119  
t критическое двустороннее 2,120  

 

Описание полученных результатов сравнения средних двух выборок.

Объединенная дисперсия–взвешенное среднее выборочных дисперсий, со степенями свободы каждой дисперсии в качестве весов (8). Она является оценкой общей дисперсии двух выборок и используется для определения стандартной ошибки разности средних.

df – число степеней свободы критерия (18 – 2).

t-статистика вычисляется как отношение разности средних к стандартной ошибке.

Р(Т <= t) одностороннее является односторонним р-значением, если t < 0; если t > 0, то р = 1 –Р(Т <= t). Двустороннее р-значение равно удвоенному одностороннему р-значению.

Найденное расчетное значение t-статистика = 1,649 и t-критическое равное 1,746 сравниваем с учетом, что рассматривалась правосторонняя критическая область, делаем вывод: «Н0 принимается». С 5% уровнем значимости мы не можем отвергнуть предположение о равенстве средних значений выборки.

Если бы рассматривалась левосторонняя гипотеза, то:

tкр = – t-критическое одностороннее.

Можно построить доверительный интервал для разности средних значений выборок.

95% доверительный интервал
     
Разность средних 3,667 Разность средних Стандартной и Новой выборок
Стандартная ошибка 2,2229166 (Разность средних – Гипотетическая разность средних) / t-статистика
t 2,120 t критическое двустороннее
Половина длины 4,7123726 t * Стандартная ошибка
Лев.граница -1,046 Разность средних – Половина длины
Прав.граница 8,379 Разность средних + Половина длины

 

Среднее разности находится как разность E3 – F3,

t – статистика для разности равна t критическому двустороннему (Е14),

стандартная ошибка найдена делением (I3 –E8)/ Е10.

Половина длины равна произведению t на стандартную ошибку.

Доверительный интервал для разности средних значений равен (–1,046; 8,379) с вероятностью 95%.

СЛУЧАЙ РАЗНЫХ ДИСПЕРСИЙ

В данном случае не предполагается равенство дисперсий выборок, но сохраняется требование их нормальности и независимости.

Для принятия решения в таких случаях надо использовать Двухвыборочный t-тест с различными дисперсиями.

Пример 3.2. Для производства нового продукта предлагается две схемы размещения рабочих. Шесть случайно отобранных рабочих собирают изделие по схеме А, а другие восемь–по схеме В. Можно ли сделать вывод с 5% уровнем значимости, что время сборки различаются в схемах, при условии, что они нормальные.

Построим диаграммы данных выборок и сравним среднее время сборки и разброс.

 

Сравнивая графики для схем А и В можно сделать вывод, что разброс данных в схеме А больше, однако среднее время сборки меньше.

Выдвинем гипотезу: «Размещение рабочих не влияет на время сборки изделий:

Н0: mА = mВ,

Н1: mА ¹ mВ.

В качестве альтернативной гипотезы выдвинем предположение:«время сборки изделий по схеме А и В не равны».

Для проверки этой гипотезы следует применить двусторонний критерий. Инструкции по использованию t-теста те же, что и в примере 4.1.

Двувыборочный t-тест с различными дисперсиями
     
Схема А Схема В
Среднее 7,6 9,2
Дисперсия 5,552 1,814
Наблюдения
Гипотетическая разность средних  
df  
t-статистика -1,491  
P(T<=t ) одностороннее 0,090  
t критическое одностороннее 1,895  
P(T<=t) двустороннее 0,180  
t критическое двустороннее 2,365  

Сравнивая расчетное значение t-статистики и t-критическое двустороннее можно сделать вывод, что принимается гипотеза Н0, то есть размещение рабочих не влияет на время сборки изделий.

Используя р-значение 0,180 (18%) можно сделать вывод, что с вероятностью 18% можно получить выборку со средним, отличающимся на 1,6 мин в любом направлении. Доверительный интервал для разности средних составил (–4,138; 0,938).

95% доверительный интервал
   
Средняя выборки -1,600
Стандартная ошибка 1,073
t 2,365
Половина длины 2,538
Лев.граница -4,138
Прав.граница 0,938

 

 

ПАРНЫЙ ВЫБОРОЧНЫЙ КРИТЕРИЙ

Критерий используется в случае, когда одна и та же группа наблюдается дважды. Обычно это происходит при измерении характеристик до и после эксперимента.

Например, студенты могут тестироваться дважды до и после курса по некоторой дисциплине. Можно использовать критерий и для других естественных пар наблюдений.

Пример 3.3. Исследователь хочет определить, имеется ли разница в успешности автомобильных сделок при их проведении продавцами женского и мужского пола. Для этого были выбраны восемь продавщиц и определена комиссия, заработанная каждой в прошедшем году. Так как опытность влияет на размер комиссии, то исследователь записала и стаж работы для каждой из восьми женщин (столбцы А и В). Для проверки предположения были взяты продавцы с тем же стажем работы, что и женщины; значения комиссий мужчин приведены в столбце С. Можем ли мы с уровнем значимости 5% утверждать, что женщины имеют существенно другие показатели, по сравнению с продавцами мужчинами?

 

Нулевая гипотеза состоит в том, что разность средних совокупностей равна нулю. Однако по результатам выборок получено среднее значение разности и она равна 2,25 тыс. рублей. Тогда в качестве альтернативной гипотезы рассмотрим утверждение, что продавцы различных полов имеют различные показатели. Для проверки гипотез применим Двухвыборочный парный t-тест для средних. Результаты применения этого критерия практически ничем не отличаются от предыдущих результатов (пример 4.1, пример 4.2), только в ячейке G7 содержится коэффициент корреляции.

Принимая решение, для данного теста мы вынуждены принять гипотезу о равенстве средних значений комиссии у продавцов мужчин и женщин. Об этом говорят значения t и tкр: –2,365 < 1,895 < 2,365.

В случае проверки с гипотезы с помощью р-значения (р » 14%) можно с вероятностью 14% получить выборку с разностью меньшей чем –2,25 тыс. рублей или большей, чем 2,25 тыс. рублей.

В диапазоне J1:K7 представлены вычисления 95% доверительного интервала для разности средних выборок.

 

АНАЛИЗ ДИСПЕРСИЙ

F-распределение может быть использовано для проверки нулевой гипотезы о равенстве дисперсий двух выборок. Критерий предполагает, что выборки из генеральной совокупности независимы и нормально распределены.

Двусторонний критерий применяется в случае, если альтернативная гипотеза состоит в том, что дисперсии выборок различны. Для этого составляется отношение дисперсий, которое сравнивается с единицей.

Если альтернативная гипотеза проверяет утверждение о том, что дисперсия одной выборки строго больше дисперсии другой выборки, применяется односторонний критерий.

Напомним, что заданный уровень значимости альфа для двустороннего критерия делится пополам.

В примере 3.2. проверялась гипотеза о равенстве средних значений выборок, представляющих две схемы размещения рабочих мест. При этом предполагалось, что дисперсии этих выборок не равны. Воспользуемся данными этого примера и проверим гипотезу о равенстве дисперсий. Применим двусторонний F-тест для 10% уровня значимости (5% на каждый хвост распределения) для проверки нулевой гипотезы о равенстве дисперсий. В качестве альтернативной гипотезы рассматривается утверждение, что дисперсии не равны. На рисунке приведены данные F-теста.

Значение F-статистики записано в ячейке Е8 и равно 3,060. В ячейке Е9 приведен р-значение, которое является правосторонней вероятностью получить значение большее или равное F-статистике. Критическое значение для правосторонней области находится в ячейке Е10 и равно 3,972. такое же значение будет иметь правая граница двусторонней области с уровнем значимости 10%. Так как F = 3,060 меньше Fкр = 3,972, мы не можем отвергнуть нулевую гипотезу равенства дисперсий.

Можно не использовать двувыборочный F-тест для проверки гипотезы о равенстве дисперсий, а воспользоваться функцией FРАСПОБР(вероятность; степенисвоб1; степенисвоб2), т.е. Fкр = FРАСПОБР(0,05; 5; 7)=3,972.



Последнее изменение этой страницы: 2016-06-10

headinsider.info. Все права принадлежат авторам данных материалов.