Главная

Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






Критерий по асимметрии и эксцессу


Некоторые признаки при объединении объектов в группы дают распределения, значительно отличающиеся от нормального.

Асимметрия представляет собой числовое отображение степени отклонения графика распределения показателей от симметричного графика распределения.

В тех случаях, когда какие-нибудь причины благоприятствуют появлению значений признака, отличающихся от средней величины в сторону уменьшения или увеличения, образуются асимметричные распределения.

При асимметрии эмпирическое распределение имеет увеличенные (против симметричного расположения) частоты в левой или правой части.

 

 

· Асимметрия симметричного распределения равно 0

· Если асимметрия больше 0, то чаще в распределении встречаются значения меньше среднего. Такая асимметрия называется положительной или левосторонней.

· Если асимметрия меньше 0, то в распределении чаще встречаются значения больше среднего. Такая асимметрия называется отрицательной или правосторонней.

 

 

 

Эксцесс — показатель остроты пика графика распределения.

· Эксцесс симметричного распределения равно 0

· Если эксцесс больше 0, то график называется островершинным.

· Если эксцесс меньше 0, то график называется плосковершинным.

 

В тех случаях, когда какие-нибудь причины благоприятствуют преимущественному появлению и средних, и крайних значений признака, образуются положительные эксцессивные распределения, имеющие вид острой пирамиды с расширенным основанием. При отрицательном эксцессе в центре распределения имеется не вершина, а впадина, причем распределение становится двумодальным, а вариационная кривая – двувершинной.

Для выяснения достоверности того, что изучаемое распределение отличается от нормального именно в сторону асимметрии или эксцесса, применяют обычный в статистике метод сравнения показателей с их ошибками репрезентативности.

Показатели асимметрии и эксцесса с их ошибками репрезентативности определяются по следующим формулам:

; ; ;

; ; ,

где А – показатель асимметрии;

– сумма кубов отклонений от средней арифметической (центральных отклонений);

s3 – стандартное отклонение, возведенное в третью степень;

Е – показатель эксцесса;

– сумма четвертых степеней центральных отклонений;

s4 – четвертая степень стандартного отклонения;

n – общее число данных в эмпирическом распределении;

sA, sE – ошибки репрезентативности показателей асимметрии и эксцесса;

tA, tE – критерии достоверности выборочных показателей асимметрии и эксцесса.

Показатели асимметрии и эксцесса свидетельствуют о достоверном отличии эмпирического распределения от нормального в том случае, если они превышают свою ошибку репрезентативности в три и более раз.

Артефакты

Артефакты (или выбросы) - такие записанные значения признака, которые резко отличаются от всех других значений признака в группе. Проверка артефактов должна проводиться всегда перед началом обработки полученных первичных данных. Если подтвердится, что резко выделяющееся значение (например, записанное значение роста 263 см) действительно не может относиться к объектам данной группы, и попало в записи вследствие ошибок внимания, следует такой артефакт исключить из обработки. Проверка артефактов может производиться по критерию, равному нормированному отклонению выпада.

Проверка выбросов может производиться по критерию, равному нормированному отклонению выброса:

,

где:

Т – критерий выброса;

– выделяющееся значение признака (или очень большое или очень малое);

μ, s – средняя и стандартное отклонение, рассчитанные для группы, включающей артефакт;

Tst – стандартные значения критерия выбросов, определяемых по таблице 1.

 

Таблица 1 – Стандартные значения критерия выбросов (Tst)

n Tst n Tst n Tst n Tst
2,0 16 – 20 2,4 47 – 66 2,8 125 – 174 3,2
3 – 4 2,1 21 – 28 2,5 67 – 84 2,9 175 – 349 3,3
5 – 9 2,2 29 – 34 2,6 85 – 104 3,0 350 – 599 3,4
10 – 15 2,3 35 – 46 2,7 105 – 124 3,1 600 – 1500 3,5

 

Если Т ≥ Tst, то анализируемое значение признака является выбросом. Альтернатива Т < Tst не позволяет исключить из анализа значение признака.

 

Артефакты могут являться следствием ошибки в ходе эксперимента, неправильной записи результата, сбоя измерительных приборов и т.д. Проверка на наличие выбросов желательна при предварительном анализе полученных данных, так как их наличие может существенно повлиять на конечные выводы об исследуемой совокупности. В принципе, если исследователь знает границы возможных результатов и какие-то полученные значения сильно выбиваются из этих границ, он может исключить их из анализа, не проводя дополнительной проверки вышеописанным способом

 

Стоит заметить, что иногда исследователя могут интересовать и сами выбросы как периодически возникающие аномальные явления, конечно, если они не являются следствием ошибки.

Выводы:

· Описательная статистика позволяет обобщать первичные результаты, полученные при наблюдении или в ходе эксперимента. Процедуры здесь сводятся к:

ü группировке данных по их значениям

ü построению распределения их частот

ü выявлению центральных тенденций распределения (например, среднего значения)

ü оценке разброса данных по отношению к найденной центральной тенденции.

 

· Когда совокупность подчиняется нормальному распределению, она исчерпывающе описывается параметрами распределения — средним и стандартным отклонением. Когда же распределение сильно отличается от нормального, более информативны медиана и перцентили.

· Проверкой распределения на принадлежность нормальному закону может служить построение графика, значения коэффициентов асимметрии и эксцесса, критерии нормальности, например Шапиро-Уилка или Колмогорова-Смирнова.

· От типа распределения признака зависит дальнейший ход исследования и работа с данными эксперимента.

 

Лекция 3

Сравнение групп

Постановка задачи

Часто возникает задача сравнить группы между собой. Такая задача может возникнуть, если необходимо выявить какой метод лечения более эффективный или, при изучении воздействия нового препарата, поставить эксперимент, сравнив препарат с аналогом, или исследовать эффективность препарата, поставив эксперимент с плацебо и т.д.

В подобных исследованиях одна из групп испытуемых принимается за контрольную – например, группа, которую лечили эталонным методом лечения или давали препарат плацебо вместо испытуемого лекарства, другая группа – экспериментальная. Сравнив между собой исследуемые показатели, исследователь делает вывод согласно цели эксперимента.

Нулевая гипотеза

Результатом исследования обычно является утверждение, имеющее жизненно важное значение, например, какой самый лучший метод лечения рака, каковы самые распространенные побочные эффекты определенного вида хирургического вмешательства, каков коэффициент выживаемости после определенного лечения и действительно ли новое экспериментальное лекарство увеличивает продолжительность жизни.

Однако, прежде чем получить результат (утверждение), необходимо правильно планировать ход исследования, одним из важных этапов является формулировка исходного утверждения, правильность которого и проверяется в ходе исследования. Такое утверждение называется гипотезой.

Гипо́теза (др.-греч. ὑπόθεσις — предположение) — утверждение, предполагающее доказательство.

Проверка гипотезы — это статистическая процедура, предназначенная для проверки утверждения.

После того как исследователь определил переменную и параметр, влияние на которую того или иного фактора проверяется в исследовании, он формулирует нулевую гипотезу.

Нулева́я гипо́теза —гипотеза, которая проверяется на согласованность с имеющимися выборочными (эмпирическими) данными.

Нулевая гипотеза - это предположение, что исследуемые факторы не оказывают никакого влияния на измеряемую величину признака и полученные различия (между группами исследуемых объектов) случайны.

 

В качестве нулевой гипотезыможет выступать гипотеза обратная утверждению о том, что значения признака распределены по нормальному закону распределения, или гипотеза о том, что различия между группами статистически не значимы или случайны и т.п. Часто в качестве нулевой гипотезы выступают гипотезы об отсутствии взаимосвязи или корреляции между исследуемыми переменными, об отсутствии различий (однородности) в распределениях (параметрах распределений) двух и/или более выборках.

Например, сравнивая различающиеся средние значения артериального давления при применении двух разных анестетиков, мы выдвигаем нулевую гипотезу о том, что полученные различия не значительны или случайны и анестетики воздействуют на измеряемый параметр организма в среднем одинаково

Альтернативная гипотеза обратна нулевой гипотезе. В исследовании обычно формулируется именно нулевая гипотеза, т.е., то, что мы хотим опровергнуть.

 

Статистическая значимость результатов

Уровень значимости

Получив результат, исследователь делает вывод о том, значим ли полученный результат с точки зрения статистического анализа. Другими словами он делает вывод о статистической значимости полученного результата.

Для того, чтобы сделать вывод о наличии или отсутствии статистической значимости используется так называемый критерий значимости.Под критерием значимости понимается некое числовое значение, позволяющее судить о значимости различий между сравниваемыми группами. Более подробно о критерии значимости будет рассказано далее.

Полученное числовое значение критерия значимости указывает на то, принимается или отвергается нулевая гипотеза.

Однако, вывод во многом зависит и от того с какой вероятностью мы можем получить наблюдаемые результаты при верности нулевой гипотезы.

Исследователь в подавляющем большинстве случаев работает с выборочными данными и в силу этого абсолютно избежать ошибок в статистических исследованиях и выводах на их основе невозможно. Статистические методы позволяют оценить вероятность возникновения подобных ошибок.

Другими словами, мы допускаем наличие ошибки, и максимальную вероятность ее возникновения устанавливаем сами. Если эта вероятность мала, то мы отвергаем нулевую гипотезу и заключаем что результаты эксперимента статистически значимы.

 

Максимальную приемлемую вероятность отвергнуть верную нулевую гипотезу называют уровнем значимости и обозначают α.

 

Обычно принимают α = 0,05 (5%). Это, разумеется, еще не означает что мы доказали действие именно изучаемых факторов (это вопрос прежде всего планирования эксперимента), но, во всяком случае, маловероятно, что результат обусловлен случайностью.

Если в ходе исследования мы получили результат, который отвергает нулевую гипотезу, при уровне значимости 5%, то можно сказать следующее:

если бы нулевая гипотеза была справедлива, то вероятность получить наблюдаемые результаты была бы меньше 5%.

В принятой системе обозначений это записывается как Р < 0,05. Р есть вероятность ошибочно отвергнуть нулевую гипотезу.

Отсюда мы заключаем, что гипотеза об отсутствии влияния препарата, например, на давление, вряд ли справедлива, то есть различия статистически значимы (при 5% уровне значимости). Разумеется, этот вывод по сути своей носит вероятностный характер. Не исключено, что мы ошибочно признаем неэффективный препарат эффективным, то есть найдем различия там, где их нет. Однако мы можем утверждать, что вероятность подобной ошибки не превышает 5%.

Ошибки первого и второго рода

Исходя из последнего утверждения, различают ошибки первого и второго рода.

Если мы ошибочно отклоняем верную нулевую гипотезу, например, находим различия там, где их нет, то это называется ошибкой I рода.

Максимальная приемлемая вероятность ошибки I рода и есть уровень значимости. Обычно α принимают равной 0,05 (то есть 5%), однако можно взять и какой-нибудь другой уровень значимости, например 0,1 или 0,01.

Если мы не отклоняем нулевую гипотезу, когда она не верна, то есть не находим различий там, где они есть, то это — ошибка II рода.

 

Методы анализа различий

Дисперсионный анализ

 

Проведем гипотетический эксперимент (Гланц С. «Медико-биологическая статистика»). Однажды в небольшом городке (200 жителей) ученые исследовали влияние диеты на сердечный выброс. Случайным образом отобрали 28 человек, каждый из которых согласился участвовать в исследовании. После этого они опять таки случайным образом были разделены на 4 группы по 7 человеке каждой.

 

 

Члены первой (контрольной) группы продолжали питаться как обычно, члены второй группы стали есть только макароны, третьей группы — мясо, четвертой — фрукты. Члены наших экспериментальных групп изображены заштрихованными кружками. Через месяц у всех участников эксперимента измерили сердечный выброс.

Анализ данных мы начинаем с формулировки нулевой гипотезы. В данном случае она заключается в том, что ни одна из диет НЕ влияет на сердечный выброс

Как видно из рисунка, группы все же различаются по средней величине сердечного выброса. Вопрос можно поставить так: какова вероятность получить такие различия, извлекая случайные выборки из нормально распределенной совокупности? Прежде чем ответить на этот вопрос нам надо получить показатель, характеризующий величину различий.

 

 

 

Из рисунков видно, что группы различаются между собой. Рисунок в рамке – результаты исследования из примера. Рисунки снизу – возможные результаты эксперимента

Для определения значимости различий между группами необходимо ввести критерий, который указывает на это различие. В дисперсионном анализе этим критерием является критерий Фишера или критерий F:

 

 

 

 

И числитель, и знаменатель этого отношения — это оценки одной и той же величины — дисперсии совокупности σ2, поэтому если различий между группами нет, то значение F должно быть близко к 1

Если F значительно превышает 1, нулевую гипотезу следует отвергнуть. Если же значение F близко к 1, нулевую гипотезу следует принять. Осталось понять, начиная с какой именно величины F следует отвергать нулевую гипотезу.

 

Критическое значение F

Если извлекать случайные выборки из нормально распределенной совокупности, значение F будет меняться от опыта к опыту.

Значение критерия, начиная с которого мы отвергаем нулевую гипотезу, называетсякритическим значением.

 

Вероятность ошибочно отвергнуть верную нулевую гипотезу, то есть найти различия там, где их нет, обозначается Р.

 

Как правило, считают достаточным, чтобы эта вероятность не превышала 5%. (Максимальная приемлемая вероятность ошибочно отвергнуть нулевую гипотезу называется уровнем значимости и обозначается α). Почему бы не повысить критическое значение F тем самым, уменьшая эту вероятность? Однако в этом случае возрастет риск ошибочно принять неверную нулевую гипотезу (то есть не найти различий там, где они есть). Критическое значение F однозначно определяется уровнем значимости (обычно 0,05 или 0,01) и еще двумя параметрами, которые называются внутригрупповым и межгрупповым числом степеней свободы и обозначаются греческой буквой ν («ню»).

Степени свободы - числа, показывающие количество элементов варьирования, которые могут принимать произвольные значения, не изменяющие заданных характеристик. Степени свободы пришлось ввести из практического опыта вычислений. Дело в том, что в выборке у нас n данных, скажем 10, но когда мы с ними начинаем манипулировать, то между этими десятью значениями (в ряду) оказывается 9 промежутков, то есть (n-1).

Межгрупповое число степеней свободы — это число групп минус единица νмеж = m – 1. Внутригрупповое число степеней свободы — это произведение числа групп на численность каждой из групп минус единица νвну = m (n – 1). В примере с исследованием диеты межгрупповое число степеней свободы равно 4 – 1 = 3, а внутригрупповое 4 (7 – 1) = 24. Вычислить критическое значение F довольно сложно, поэтому пользуются таблицами критических значений F для разных α, νмеж и νвну.

 

На основании значения уровня значимости и степеней свободы определяется величина критического значения критерия Фишера Fкр (значение критерия, начиная с которого мы отвергаем нулевую гипотезу).

Для определения статистической значимости различий между группами сравниваются между собой F и Fкр, а также P и α, если

F > Fкр и P < α,

то нулевая гипотеза отвергается и различия между группами статистически значимы, в противном случае различия – случайны или незначимы.

Следует учитывать, что даже при обнаруженной статистической значимости различий исследователь может ошибаться, но допустимая вероятность ошибки равна уровню значимости (т.е. незначительна). Т.е. если оказалось, что P столь велико, что превышает уровень значимости, то различия признаются статистически незначимыми, правда в этом случае возможно возникновение ошибки второго рода, т.е. не выявление различия там, где оно есть.

Пример таблицы результатов дисперсионного анализа в MS Excel

 

Дисперсионный анализ, в котором проверяется влияние одного фактора, называется однофакторным. При изучении влияния более чем одного фактора используют многофакторный дисперсионный анализ.

Ø Общая последовательность действий:

1. Формирование исследуемых групп (например, первая группа принимает препарат, вторая - плацебо);

2. Формирование таблиц результатов измерения (снимаются исследуемые показатели первой группы и показатели второй группы);

3. Выполняется первичный анализ полученных данных (описательная статистика);

4. Если данные в обеих группах распределены по нормальному закону распределения (или близкому к таковому), то выбирается метод анализа, в нашем случае – дисперсионный анализ

5. Выбирается значение уровня значимости (в зависимости от строгости исследования:0,1 или 0,05 или 0,01). Следует помнить об ошибках I и II рода;

6. Формулируется нулевая гипотеза (различие между группами незначимо или является следствием случайности)

7. Рассчитывается критерий Фишера F и вероятность ошибочного результата P (вероятность ошибочно отвергнуть верную нулевую гипотезу, то есть найти различия там, где их нет)

8. На основании значения уровня значимости и степеней свободы определяется величина критического значения критерия Фишера Fкр (значение критерия, начиная с которого мы отвергаем нулевую гипотезу). Сравниваются между собой F и Fкр, а также P и α, если F > Fкр и P < α,то нулевая гипотеза отвергается и различия между группами статистически значимы, в противном случае различия – случайны или незначимы. Следует учитывать, что даже при обнаруженной статистической значимости различий исследователь может ошибаться, но допустимая вероятность равна уровню значимости (т.е. незначительна).

Пример исследования



Последнее изменение этой страницы: 2016-06-10

headinsider.info. Все права принадлежат авторам данных материалов.