Главная

Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






ПОСТРОЕНИЕ НЕЛИНЕЙНЫХ РЕГРЕССИЙ


Можно воспользоваться командой Добавить линию тренда, так же как в случае линейного тренда (раздел 1.3): необходимо построить корреляционное поле (х, у) и выбрать одну из зависимостей на вкладке параметры: полиномиальный, логарифмический, показательный и экспоненциальный. Такой способ удобен для случая двух переменных.

Использовать инструмент Регрессия можно только для преобразованных данных. Этот способ дает много ненужной информации.

Пример 3.1.По семи территориям Южного федерального округа за 2001 год известны значения двух признаков:

Район Расходы на покупку продовольственных товаров в общих расходах, %, у Среднедневная плата одного работающего, руб., х
Ростовская обл. 68,8 45,1
Краснодарский край 61,2 59,0
Ставропольская обл. 59,9 57,2
Волгоградская обл. 56,7 61,8
Ингушская респ. 55,0 58,8
Кабардино-Балкария 54,3 47,2
№ ская 49,3 55,2

 

Задание

1. Постройте уравнения регрессии для модели:

a) линейной;

b) степенной;

c) экспоненциальной;

d) логарифмической; гиперболы.

2. Оцените каждую модель через среднюю ошибку аппроксимации и F-критерий Фишера.

Проще всего построить поле корреляции, а затем добавить линии тренда. Для полученных уравнений надо найти коэффициент аппроксимации и проверить F-критерий.

1а. Уравнение линейной регрессии: b0 = 76,88; b1 = –0,35;

ŷ = 76,88 – 0,35 х. R2 = 0,12.

Вариация результата на 12% объясняется вариацией фактора х. F-статистику найдем по формуле (1.13): F = 0,71

Так как Fнабл. = 0,71 < F0,05; 1; 5 = 6,61 , то параметры линейного уравнения и показатель тесноты связи между х и у статистически незначимы и гипотеза о линейности уравнения регрессии отклоняется. Самостоятельно вычислите величину средней ошибки аппроксимации:

.

1.b. Степенная модель у = b.

Ŷ = 190,03 х –0,298.

Подставляя в уравнение регрессии фактические значения х , получим ŷх. По этим значениям, используя формулу для индекса корреляции (1.26), получим

rху = 0,3758,

и среднюю ошибку аппроксимации:

= 0,562761 100/7 = 8,04%.

Характеристики степенной модели указывают, что она не намного лучше линейной функции описывает связь между х и у.

1с. Аналогично 1.b. для показательной модели у = х сначала нужно выполнить линеаризацию

lny = lna + x lnb

и после замены переменных Y = lny, b0 = lna, b1 = lnb рассмотрим линейное уравнение:

Y = b0 + b1x.

Используя столбцы для Y и х из предыдущей таблицы, получим коэффициенты:

b0 = 4,346921, b1 = – 0,0054

и уравнение Y = 4,346921 – 0,0054 x.

После потенцирования запишем уравнение в обычной форме:

ŷ = 77,24 0,9947х.

Для вычисления параметров b0 и b1 модели у = abх можно воспользоваться встроенной статистической функцией ЛГРФПРИБЛ.

Выполните самостоятельно и сравните результаты. Убедитесь, что значения вычисленные по формулам и полученные с помощью функции ЛГРФПРИБЛ() совпадают.

Тесноту связи оценим с помощью коэффициента корреляции rxy = 0,3589, который вычисляется по формуле (1.26). Связь между х и у небольшая. Коэффициент аппроксимации, вычисленный по формуле (3.3) = 8% говорит о повышенной ошибке приближения, но в допустимых пределах. Сравнивая, показатели степенной и показательной функций можно сделать вывод, что степенная функция чуть лучше описывает связь между х и у чем показательная.

1.d. Аналогичные расчеты надо провести и для равносторонней гиперболы у = a + b/х, которая линеаризуется заменой Х = 1/х.

Для этого уравнения в таблицу исходных значений надо добавить столбец Х = 1/х, а все остальные вычисления проведите, используя один из описанных выше способов:

b0 = 38,5; b1 = 1051,4; ŷ = 38,5 + 1051,4 1/х; xy = 0,3944; = 8,1%.

Получена наибольшая оценка тесноты связи по сравнению с линейной, степенной и показательной регрессиями, а остается в пределах допустимого значения. Это означает, что для описания зависимости расходов на покупку продовольственных товаров в общих расходах (у в %) от среднедневной заработной платы одного работающего (х в руб.) необходимо из предложенных моделей выбрать гиперболическую.

2. Введем гипотезу Н0: уравнение регрессии статистически незначимо и рассмотрим статистику (1.30):

.

Fкр = 6,61 при уровне значимости a = 0,05 (смотри пункт 1.а).

Гипотеза Н0 о статистической незначимости параметров уравнения принимается. Результат можно объяснить небольшим числом наблюдений и сравнительно невысокой теснотой гиперболической зависимости между х и у.



Последнее изменение этой страницы: 2016-06-10

headinsider.info. Все права принадлежат авторам данных материалов.