Главная

Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА


Когда все сугдее, сменяясь каждый час, В нестройный, резким хор сливается вкр^г нас, Кто звуки мерные в порядке размещает, Чьей речи верный ритм и.ивиклен и тверд, "Кто единичное искусно обобщав Объединяя все в торжественный аккорд?

Пте. Фауст

Тщательное, скрупулезное выполнение эксперимента, несом­ненно, является главным условием успеха исследования. Это об­щее правило, и планирование эксперимента не относится к ис­ключениям.

Однако нам не безразлично, как обработать полученные дан­ные. Мы хотим извлечь из них всю информацию И сделать соот­ветствующие выводы. Как всегда, мы находимся между Сцил- лой и Харибдой. С одной стороны, не извлечь из эксперимента все, что из него следует, — значит пренебречь нелегким трудом экспериментатора. С другой стороны, сделать утверждения, не следующие из экспериментальных данных, — значит создавать иллюзии, заниматься самообманом (и обманом тоже, хотя и не­вольным).

Статистические методы обработки результатов позволяют нам не перейти разумной меры риска. Поэтому мы отводим эту главу для ifx рассмотрения [1—8].

9.1. Метод наименьших квадратов

Статистики разработали много разнообразных методов обра­ботки результатов эксперимента. Но, пожалуй, ни один из них не может конкурировать по популярности, по широте приложе­ний с методом наименьших квадратов (МНК), который был раз­вит усилиями Лежандра и Гаусса более 150 лет назад.

Давайте попробуем разобраться в этом методе. Начнем с про- того случая: один фактор, линейная модель. Интересующая нас функция отклика (которую мы будем также называть уравнением регрессии) имеет вид

У = ъо + ЬА-

Это хорошо известное вам уравнение прямой линии. Наша цель — вычисление неизвестных коэффициентов Ь0 и bv Мы провели экс­перимент, чтобы использовать при вычислениях его результаты. Как это сделать наилучшим образом?

Если бы все экспериментальные точки лежали строго на пря­мой линии, то для каждой из них было бы справедливо равенство

у> -К—Vi,=°.

где 4=4, 2, N ~ номер опыта. Тогда не было бы никакой

проблемы. На практике это равенство нарушается и вместо него

приходится писать yt — =

где — разность между экспериментальным и вычисленным до уравнению регрессии значениями у в г-й экспериментальной точке. Эту величину иногда называют невязкой.

Действительно, невязка возникает по двум причинам: из-за ошибки эксперимента и из-за непригодности модели. Причем эти причины смешаны и мы не можем, не получив дополнительной информации, сказать, какая из них преобладает.

Можно постулировать, что модель пригодна. Тогда невязка будет порождаться только ошибкой опыта. (Еще можно, конечно, постулировать, что ошибка опыта равна нулю. Тогда невязка будет связана только с пригодностью модели, и пригодной будет такая модель, для которой все невязки равны нулю.)

Обычно оценивают независимо опщбку опыта (помните преды­дущую главу?) и проверяют пригодность модели.

Конечно,-мы хотим найти такие коэффициенты регрессии, при которых невязки будут минимальны. Это требование можно записать по-разному. В зависимости от этого мы будем получать разные оценки коэффициентов. Вот одна из возможных записей

n

min>

<=i

которая приводит к методу наименьших квадратов.

N

Возможен и метод наименьших кубов 2 1 = min, так как

i=i

условие, которое мы выбираем, произвольно.

Беда заключается в том, что он хуже МНК с другой точки зрения: мы будем получать оценки коэффициентов со значительно меньшей точностью. Да и в вычислительном отношении этот путь сложнее.

Существует и метод, в котором минимизируется сумма модулей (абсолютных величин) невязок. Но этот путь связан с дополни­тельными вычислительными трудностями. Условие МНК — это удачный компромисс.

В последнее время были предложены другие подходы. Можно, например, минимизировать модуль максимальной невязки. Это записывается такз

min max | |.

»

Предложений можно сделать сколько угодно, но мы не будем более на них останавливаться и перейдем непосредственно к МНК.

Когда мы ставим эксперимент, то обычно стремимся провести больше (во всяком случае не меньше) опытов, чем число неизвест­ных коэффициентов. Поэтому система линейных уравнений

lt = y(~bo-bi*u

оказывается переопределенной и часто противоречивой (т. е. она может иметь бесконечно много решений или может не иметь реше­ний). Переопределенность возникает, когда число уравнений больше числа неизвестных; противоречивость—когда некоторые из уравнений несовместимы друг с другом.

Только если все экспериментальные точки лежат на прямой, тО система становится определенной и имеет единственное реше­ние.

МНК обладает тем замечательным свойством, что он делает определенной любую произвольную систему уравнений. Он де­лает число уравнений равным числу неизвестных коэффициентов.

Наше уравнение "регрессии имеет вид

У = ьо +

В нем два неизвестных коэффициента. Значит, применяя МНК, мы получим два уравнения.

Давайте попробуем их получить.

Мы писали

n »=i

Это соотношение можно записать иначе

я я

и—2 8=2 (у( — К — bixiif=min- >=i »=i

Вы, конечно, помните из курса математики, что минимум некоторой функции, если он существует, достигается при одно­временном равенстве нулю частных производных по всем неиз­вестным, т. е.

дЪ0и' дЬг и-

Вот откуда берутся наши уравнения для определения коэф­фициентов. Теперь, как говорится, дело техники:

n n

—2 2 (Vt ~bo — bixu) = °> —2 2 (у, — Ь0- \хи) хи --= »=1 «=1

Для вычислений удобно раскрыть скобки и провести простые преобразования, которые дают

n n nn n

лч+2 у^ 2 xiA+2 ж?А=2 у<хи •

i=l i=l t=l 1=1 1=1

Таблица 9.1 Условия и результаты опытов
Номер опыта я, у
  Vl
X12 fa
  xu Vi
N x\n Vn

Окончательные формулы для вычисления коэффициентов ре­грессии, которые удобно находить с помощью определителей, имеют вид

n n n n.

60 =

2 Vi 2 я1<2У{Хи 2Хи

»=1 i=i

^2 2 *«
»=1 \ i' =i
n n N
N 2 Vixu — 2 Vi
»==1 i= 1 i=i
n /' N Y
    xu
i=l \t=i }

 

Посмотрим теперь, как вы­числяются суммы, входящие в эти формулы.

Результаты эксперимента представляются следующей матрицей (табл. 9.1). Для выполнения вычислений ее расширяют так, как представлено в табл. 9.2.

Вы, конечно, заметили, что в этой таблице сделано больше вычислений, чем требуется для расчета Ь0 и Ьг. Эти «лишние» дан­ные нужны для проверки правильности расчетов.

Возможны два способа проверки. Первый из условия

n n n n

2 (хи+У=2 хЬ + 2 2 у<хи + 2 УЬ

»=1 »=i i=i »■=1

которое хорошо вам известно еще из школьной математики. (Оно должно выполняться не только для сумм, но и в каждой строчке таблицы.) Второй способ использует условие у = Ъ0-\-Ъ1х1. Подставляя в это соотношение у и % из последней строки таблицы и один из коэффициентов, можно найти другой коэффициент и сравнить с расчетным.

Вторая из проверок является наиболее полной, наиболее жест­кой. Она проверяет не только вычисления сумм, но и вычисления коэффициентов.


Таблица 9.2

Расчетная таблица для вычислений коэффициентов регрессии

Номер опыта ж, У х! ух, У! х, + у  
1 2 Х11 я 12 Vl Уъ ,,2 Х11 ■А х12 У Iх и У 2Х12 у\ У\ Хп + У1 х12 Н~ У 2 ( {хп +Уг)г (xi2 + УгТ
  хи Уг ■Л хи Vtxli У\ хи + Vt {Xu+Vi?
N 2 xiN N i=1 VN N 2 у{ «=i г2 х\N N «=1 Vnx\n N 2 Vixu »•=1 VN N »=1 X\N + VN (xl N + VNY 2 (xu + y.r »=1
Среднее значение ХХ У          

 

На практике используют обе проверки, чтобы в случае ошибок в таблице не считать зря коэффициенты.

Имейте в виду: никакая проверка не гарантирует вас от оши­бок в записи исходных данных. Будьте внимательны!

Имейте в виду: никакие результаты вычислений нельзя ни ис­пользовать, ни даже обсуждать, пока они не проверены. Иначе вы рискуете впасть в заблуждение и, в лучшем случае, потерять время.

Ну вот мы и научились вычислять коэффициенты. Давайте на­несем исходные данные и полученное уравнение на график (рис. 25).

Выделим для удобства рассмотрения несколько эксперимен­тальных точек и отрезок нашего уравнения в большем масштабе (рис. 26).

Мы выбрали пять экспериментальных точек, которые прону­меровали цифрами 1, 2, 3, 4, 5. Четвертая точка оказалась лежа­щей на линии. МНК состоит в том, чтобы минимизировать сумму квадратов отрезков, характеризующих расхождение между экс­периментальными точками и полученным уравнением. Мы мини­мизировали сумму квадратов пунктирных отрезков.

Если бы наше уравнение регрессии имело вид

х1=Ъо+Ъ1 У'

то мы минимизировали бы сумму сплошных отрезков.

Во всех формулах тогда пришлось бы % и у поменять местами и коэффициенты получились бы другими (если, конечно, не все невязки равны нулю).

Ю Заказ М 588

Мы находим невязки по оси у, поэтому и минимизируется сумма квадратов вертикальных отрезков. Обе линии совпадут только в том случае, если все невязки равны нулю, т. е. если все экспери­ментальные точки лежат точно на прямой линии.

Рис. 26. Линейное уравнение регрессии (фрагмент)

Теперь мы можем узнать, какая же получилась сумма квад­ратов невязок. Будем называть ее остаточной суммой квадратов.

y=B*tlx Рис. 25. Линейное уравнение регрессии

 

Из рисунков видно, что для этого надо вычислить по уравне­нию значения у в условиях каждого опыта. Будем называть такое значение предсказанным и обозначать у. Затем надо найти все невязки (отрезки), возвести их в квадрат и сложить (табл. 9.3).

Таблица 9.3

Расчет остаточной суммы квадратов

Номер опыта У а ду=у—а Д у*
Ул. Si Afi Av\
Уг ь   Aj/l
i Ь Ь AV<  
N VN SN AV*  

 

S*1

п

Величина 2 и есть остаточная сумма квадратов, которую 1=1

мы раньше обозначили 2 МНК гарантирует, что эта величина минимально возможная.

Итак, мы научились находить наилучшие в смысле МНК оценки коэффициентов линейного уравнения для одного фактора. Это, конечно, полезно, но нас интересую^ многофакторные задачи.

Обобщение на многофакторный случай не связано с какими- либо принципиальными трудностями. Правда, вычисления зна­чительно усложняются и требуют привлечения аппарата алгебры матриц. Рассмотрим его в следующей главе. А пока мы восполь­зуемся тем, что наши матрицы планирования ортогональны. Если вы забыли это понятие, то обратитесь к стр. 84 и повторите его. Далее будем рассматривать только этот случай, который позво­ляет резко упростить вычисления, что составляет одно из преиму­ществ планирования эксперимента.

Можно показать, что для любого числа факторов коэффициенты будут вычисляться по формуле

n

2 у*хз*

В этой формуле 7=0, 1, 2 . . . , к — номер фактора. Ноль записан для вычисления bQ. Действительно, посмотрите на формулы для вычисления коэффициентов регрессии на стр. 144. В первой формуле

n

2 хиi=i

в силу симметричности плана. Поэтому после сокращения фор­мулы приобретают вид

n n

,2 у* 2 y>Xit

7 ___ » = 1 7 __ »=1_____

°0 --- /у » °1---- n >

t=i

где

i=i

что совпадает с написанным выше.

Так как каждый фактор (кроме х0) варьируется на двух уров­нях +1 и —1, то вычисления сводятся к приписыванию столбцу у знаков соответствующего фактору столбца и алгебраическому сложению полученных значений. Деление результата на число опытов в матрице планирования дает искомый коэффициент. Это очень простая формула, но вам необходимо научиться пользо­ваться ею безошибочно.

При вычислениях линейных моделей по дробным репликам никаких особенностей не появляется. Все точно так же. Допол-


10»
нительные трудности возникают, если мы хотим найти коэффи­циенты неполного квадратного уравнения (если нас интересуют эффекты взаимодействия). Тогда уравнение регрессии будет иметь вид

У = ъо + bixi + Ь2х2 + ... + Ъкхк + МА +

х1хг • • • Н~ кхкхк'

Конечно, можно интересоваться не всеми эффектами взаимодейст­вия, а только определенными. В полном факторном эксперименте можно оценить все взаимодействия. Для дробных реплик это не так.

Если вы построили полуреплику 24-1 с определяющим кон­трастом 1=ж1ж2ж3ж4, то раздельных оценок Ь12 и bSi получить нельзя, так как имеет место соотношение ххх2ъх4. В этом можно легко убедиться, если выписать столбцы интересующих нас эф­фектов. А это необходимо для вычисления коэффициентов. В на­шем случае столбец ххх2 совпадает со столбцом xsx4.

Формулу для вычислений коэффициентов можно записать так:

n

V ViXuiXj(

£ _J=i_________

V*J — N

Здесь и, 7=1,2, . . ., к — номера факторов,

Обратите внимание, что в силу ортогональности эффекты взаи­модействия оцениваются независимо от линейных эффектов.

9.2. Регрессионный анализ

До сих пор мы пользовались МНК как вычислительным прие­мом. Нам нигде не приходилось вспоминать о статистике. Но, как только мы начинаем проверять какие-либо гипотезы о пригод­ности модели или о значимости коэффициентов, приходится вспо­минать о статистике. И с этого момента МНК превращается в ре­грессионный анализ.

А регрессионный анализ, как всякий статистический метод, применим при определенных предположениях, постулатах.

Первый постулат. Параметр оптимизации у есть случайная величина с нормальным законом распределения. Дисперсия вос­производимости, которую мы научились находить в седьмой главе, — одна из характеристик этого закона распределения.

В данном случае, как и по отношению к любым другим посту­латам, нас интересуют два вопроса: как проверить его выполни­мость и к чему приводят его нарушения?

При наличии большого экспериментального материала (де­сятки параллельных опытов) гипотезу о нормальном распреде­лении можно проверить стандартными статистическими тестами (например, ^-критерием). К сожалению, экспериментатор редко располагает такими данными, поэтому приходится принимать этот постулат на веру. (Кроме тех случаев, когда заведомо из­вестно, что это не так и требуется специальное рассмотрение. Мы не будем на них останавливаться.)

В том, что у — случайная величина, обычно сомневаться не приходится.

Какие последствия связаны, по вашему мнению, с нарушением первого постулата?

При нарушении нормальности мы лишаемся возможности уста­новления вероятностей, с которыми справедливы те или иные вы­сказывания. В этом таится большая опасность. Мы рискуем за­гипнотизировать себя численными оценками и вероятностями, за которыми ничего не стоит. Это даже хуже волюнтаризма. Вот почему надо очень внимательно относиться к возможным на­рушениям предпосылок.

Второй постулат. Дисперсия у не зависит от абсолютной ве­личины у. С этим требованием мы уже встречались в восьмой главе.

Выполнимость этого постулата проверяется с помощью кри­териев однородности дисперсий в разных точках факторного про­странства. Нарушение этого постулата недопустимо. Если одно­родность дисперсий все же отсутствует, то необходимо такое пре­образование у, которое делает дисперсии однородными. Увы, его не всегда легко найти. Довольно часто помогает логарифми­ческое преобразование, с которого обычно начинают поиски.

Третий постулат. Значения факторов суть неслучайные вели­чины. Это несколько неожиданное утверждение практически озна­чает, что установление каждого фактора на заданный уровень и его поддержание существенно точнее, чем ошибка воспроизво­димости.

Нарушение этого постулата приводит к трудностям при реали­зации матрицы планирования. Поэтому оно обычно легко обнару­живается экспериментатором.

Существует еще четвертый постулат, налагающий ограничения на взаимосвязь между значениями факторов. У нас он выпол­няется автоматически в силу ортогональности матрицы планиро­вания.

Если с постулатами все в порядке, то можно проверять стати­стические гипотезы.

9.3. Проверка адекватности модели

Первый вопрос, который нас интересует после вычисления коэф­фициентов модели, это проверка ее пригодности. Мы будем назы­вать такую проверку проверкой адекватности модели.


Ниже (рис. 27, а, б) приведены два рисунка с одинаковым расположением экспериментальных точек и, следовательно, оди­наковым разбросом относительно линии регрессии, но с различ­
ным средним разбросом в точках (с различной дисперсией вос­производимости). Разброс в точках показан, как это иногда делается, отрезками прямых, составляющих доверительный интер­вал, равный ±2s{y}. Модель можно считать адекватной только в первом случае.

В данном случае разброс в точках такого же порядка, что и разброс относительно линии. Поэтому можно предполагать, что построенная модель пригодна. (Дальше мы выясним, как прове­рить это количественно.) Во втором случае опыты «слишком» точны. Требуется более сложная модель, чтобы точность ее пред­сказания была сравнима с точностью эксперимента.

Рис. 27. Проверка адекватности

 

Это качественные соображения, а нам нужна количественная мера.

Для характеристики среднего разброса относительно линии регрессии вполне подходит остаточная сумма квадратов. Не­удобство состоит в том, что она зависит от числа коэффициентов в уравнении: введите столько коэффициентов, сколько вы провели независимых опытов, и получите остаточную сумму, равную нулю. Поэтому предпочитают относить ее на один «свободный» опыт. Число таких опытов называется числом степеней свободы (/).

Числом степеней свободы в статистике называется разность между числом опытов и числом коэффициентов (констант), кото­рые уже, вычислены по результатам этих опытов независимо друг от друга.

Если, например, вы провели полный факторный эксперимент 28 и -нашли линейное уравнение регрессии, то число степеней свободы

f = N — (А + 1) = 8 — (3 + 1) = 4.

Остаточная сумма квадратов, деленная на число стеценей сво­боды, называется остаточной дисперсией, или дисперсией адек­ватности

n 2

»=1

S2 : »*

tse

Рассмотрим пример. Требуется найти число степеней сво­боды для в следующем случае: план 24-1 и четыре параллель­ных опыта в нулевой точке для вычисления ошибки опыта; модель линейная.

Один из возможных ответов — семь степеней свободы — ос­нован на следующих предположениях. Вероятно, вы рассуждали так. Проделано 12 опытов: 24-1=8 плюс 4 нулевых. В уравнение входит 5 коэффициентов. Следовательно, /=12—5=7. Здесь не учтено, что параллельные опыты нельзя считать самостоятель­ными, так как они дублируют друг друга. Поэтому" они все дают одну степень свободы. Другой неправильный ответ — 4 степени свободы. Этот неправильный ответ получился, вероятно, из сле­дующего рассуждения. Проделано 12 опытов: восемь по матрице планирования и четыре нулевых. Так как все нулевые опыты тож- жественны, то они дают одну степень свободы. Число коэффи­циентов в модели равно пяти. Следовательно, /=9—5=4. Вы не обратили внимание на то, что опыты в нулевой точке не исполь­зуются при вычислении коэффициентов и- не могут поэтому вхо­дить в число степеней свободы.

Правильный ответ — три степени свободы. Действительно, мы провели 12 опытов, но четыре опыта в нулевой точке были проведены для других целей и в вычислении коэффициентов не участвовали, поэтому они не входят в число степеней свободы. (А если бы входили — такие случаи возможны, то давали бы не четыре, а только одну степень свободы.) Число коэффициентов модели — пять. Следовательно,

/ = 8-5 = 3.

Запомните правило: в планировании эксперимента число сте­пеней свободы для дисперсии адекватности равно числу различ­ных опытов, результаты которых используются при подсчете коэффициентов регрессии, минус число определяемых коэффи­циентов. Вам еще представится случай поупражняться в опре­делении числа степеней свободы для дисперсии адекватности.

Для проверки гипотезы об адекватности можно использовать F-критерий (этот критерий уже использовался для сравнения двух дисперсий)


 

Величину, стоящую в числителе этой формулы, мы только что на­учились считать, а знаменатель — старый знакомый (см. гл. 8) — это дисперсия воспроизводимости со своим числом степеней свободы.

Удобство использования критерия Фишера состоит в том, что проверку гипотезы можно свести к сравнению с табличным зна­чением. Фрагмент соответствующей таблицы, который может удо­влетворить ваши нужды не только в упражнениях этой книги, но и в большинстве случаев практики, приведен ниже (табл. 9.4).

Таблица 9.4

Значения .F-критерия Фишера при 5%-ном уровне значимости [2]

и   -4 24 '
164,4 199,5 215,7 224,6 230,2 234,0 244,9 249,0 254,3
18,5 19,2 19,2 19,3 19,3 19,3 19,4 19,4 19,5
10,1 9,6 9,3 9,1 9,0 8,9 8,7 8,6 8,5
7,7 6,9 6,6 6,4 6,3 6,2 5,9 5,8 5,6
6,6 5,8 5,4 5,2 5,1 5,0 4,7 4,5 4,4
6,0 5,1 4,8 4,5 4,4 4,3 4,0 3,8 3,7
5,5 4,7 4,4 4,1 4,0 3,9 3,6 3,4 3,2
5,3 4,5 4,1 3,8 3,7 3,6 3,3 3,1 2,9
5,1 4,3 3,9 3,6 3,5 3,4 3,1 2,9 2,7
5,0 4,1 3,7 3,5 3,3 3,2 2,9 2,7 2,5
И 4,8 4,0 3,6 3,4 3,2 3,1 2,8 2,6 2,4
4,8 3,9 3,5 3,3 3,1 3,0 2,7 2,5 2,3
4,7 3,8 3,4 3,2 3,0 2,9 2,6 2,4 2,2
4,6 3,7 3,3 3,1 3,0 2,9 2,5 2,3 2,1
4,5 3,7 3,3 3,1 2,9 2,8 2,5 2,3 2,1
4,5 3,6 3,2 3,0 2,9 2,7 2,4 2,2 2,0
4,5 3,6 3,2 3,0 2,8 2,7 2,4 2,2 2,0
4,4 3,6 3,2 2,9 2,8 2,7 2,3 2,1 1,9
4,4 3,5 3,1 2,9 2,7 2,6 2,3 2,1 1,9
4,4 3,5 3,1 2,9 2,7 2,6 2,3 2,1 1,9
1% 4,3 3,4 3,1 2,8.- 2,7 2,6 2,2 2,0 1,8
4,3 3,4 , 3,0 2,8 2,6 2,5 2,2 2,0 1,7
4,2 3,4 3,0 2,7 2,6 2,5 2,2 2,0 1,7
4,2 3,3 3,0 2,7 2,6 2,4 2,1 1,9 1,7
4,2 3,3 2,9 2,7 2,5 2,4 2,1 1,9 1,6
4,1 3,2 2,9 2,6 2,5 2,3 2,0 1,8 1,5
4,0 3,2 2,8 2,5 2,4 2,3 1,9 1,7 1,4
3,9 3,1 2,7 2,5 2,3 2,2 1,8 1,6 1,3
со 3,8 3,0 2,6 2,4 2,2 2,1 1,8 1,5 1,0

 

Таблица построена следующим образом. Столбцы связаны с оп­ределенным числом степеней свободы для числителя fx, строки — для знаменателя /2. На пересечении соответствующих строки и столбца стоят критические значения /^-критерия. Как правило, в технических задачах используется уровень значимости 0,05.

Если рассчитанное значение /^-критерия не превышает таблич­ного, то с соответствующей доверительной вероятностью модель можно считать адекватной. При превышении табличного значения эту приятную гипотезу приходится отвергать.

Если модель адекватна, то мы можем перейти к крутому вос­хождению. Если нет — приходится преодолевать дополнитель­ные трудности. Это мы обсудим ниже. Но во всех случаях инте­ресно проверять еще значимость отдельных коэффициентов ре­грессии.

9.4. Проверка значимости коэффициентов

Проверка значимости каждого коэффициента проводится не­зависимо.

Ее можно осуществлять двумя равноценными способами: про­веркой по ^-критерию Стьюдента или построением доверительного интервала. При использовании полного факторного эксперимента или регулярных дробных реплик доверительные интервалы для всех коэффициентов (в том числе и эффектов взаимодействия) равны друг другу.

Прежде всего надо, конечно, найти дисперсию коэффициента регрессии s'fj^}. Она определяется в нашем случае по формуле

_ Лу}

b{bj)—' если параллельные опыты отсутствуют.

Из формулы видно, что дисперсии всех коэффициентов равны ДРУГ Другу, так как они зависят только от ошибки опыта и числа опытов.

Теперь легко построить доверительный интервал (

Д &,= ±ts{bj).

Здесь t — табличное значение критерия Стьюдента при числе сте­пеней свободы, с которыми определялась s2^}, и выбранном уровне значимости (обычно 0,05); — квадратичная ошибка коэф­

фициента регрессии

*{ьу> = + N/«{6;>-

Формулу для доверительного интервала можно записать в следующей эквивалентной форме:

Коэффициент значим, если его абсолютная величина больше до­верительного интервала. Доверительный интервал задается верх­ней и нижней границами Ь^.+ ДЬ^ и bj—ДЪ

Для отыскания значений ^-критерия можно воспользоваться таблицей, фрагмент из которой приведен в табл. 9.5.

Таблица построена следующим образом. Столбцы соответст­вуют различным степеням свободы и значениям критерия.

Пусть в двух разных задачах случайно оказались два численно равных коэффициента регрессии. Доверительные интервалы для них оказались различными. Из них значим только второй

Задача Ьу Дbj

1 5,3 +5,5

2 5,3 +2,6

Таблица 9.5

Значения i-критерия Стьюдента при 5%-ном уровне значимости [2]


Число степеней свободы
Число степеней свободы
Значения (-критерия
Значения 1-критерия
И 12
2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086
12,71 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228

 

 


В действительности чем уже доверительный интервал (при за­данном а), тем с большей уверенностью можно говорить о значи­мости коэффициента.

Помните рабочее правило: если абсолютная величина коэф­фициента больше, чем доверительный интервал, то коэффициент значим.

Если вам больше .нравится проверять значимость коэффи­циентов по (-критерию, то воспользуйтесь формулой

*lbj} '

Вычисленное значение ^-критерия сравнивается с табличным при заданном а и соответствующем числе степеней свободы. По­лученные выводы о значимости коэффициентов, конечно, должны совпадать с предыдущими.

Так производится проверка значимости коэффициентов.

9,5. Резюме

Итак, в этой главе вы освоили основные методы обработки экспериментальных данных, полученных при планировании экс­перимента. Вы научились не только вычислять коэффициенты ре­грессии, но й проводить статистические оценки адекватности и значимости.

Мы подробно рассмотрели метод наименьших квадратов —эф­фективный и простой способ получения оценок коэффициентов регрессии. Этд оценки приводят к минимально возможной оста­точной сумме квадратов и в этом смысле являются оптималь-


Одновременно мы установили важное требование обязательной проверки правильности вычислений и научились выполнять это требование при применении метода наименьших квадратов.

Вы узнали, что МНК становится частью регрессионного ана­лиза при проверке статистических гипотез. При этом должны выполняться следующие постулаты: 1) параметр оптимизации — случайная величина с нормальным законом распределения; 2) дисперсия параметра оптимизации не зависит от значений па­раметра оптимизации; 3) значения факторов — неслучайные ве­личины; 4) факторы не коррелированы.

Мы выяснили, как можно проверить выполнимость этих по­стулатов и к чему приводит их нарушение.

Всякая модель ценна постольку, поскольку она верно отра­жает описываемое явление. Мы выбрали подходящий статисти­ческий метод проверки адекватности модели, основанный на кри­терии Фишера, и научились им пользоваться.

Кроме проверки адекватности следует проводить проверку зна­чимости коэффициентов. Эта проверка осуществляется с помощью критерия Стьюдента. Мы рассмотрели два варианта такой про­верки: с помощью построения доверительных интервалов и не­посредственно сравнением с табличным значением критерия.

Литература

1. Е. С. Вентцелъ. Теория вероятностей. М., «Наука», 1969.

2. К. Доерфелъ. Статистика в аналитической химии. М., «Мщ>», 1969.

3. В. П. Спиридонов, А. А. Лопаткин. Математическая обработка физико- химических данных. М., изд-во МГУ, 1970.

4. Д. Худсон. Статистика для физиков. Изд. 2-е. М., «Мир»т 1970.

5. Я. Дрейпер, Г. Смит. Прикладной регрессионный анализ. М., «Стати­стика», 1973.

6. С. А. Айвазян. Статистическое исследование зависимостей. М., «Металлур­гия», 1966.

7. Ю. Нейман. Вводный курс теории вероятностей и математической стати­стики. М., «Наука», 1968.

8. Л. Яноши. Теория и практика обработки результатов измерений. М., «Мир», 1968.


Глава десятая



Последнее изменение этой страницы: 2016-07-23

headinsider.info. Все права принадлежат авторам данных материалов.