Парная линейная регрессия (с демо)
а) F-критерий Фишера при числе степеней свободы и и уровне значимости 0,05 смотреть в таблице. Расчетное значение критерия:
Если расчетное значение F- критерия больше табличного, нулевая гипотеза об отсутствии значимой связи признаков x и y отклоняется, и делается вывод о существенности этой связи.
б) Средняя ошибка аппроксимации
Оценка значимости параметров регрессии:
а) Стандартная ошибка параметра a рассчитывается по формуле
б) Стандартная ошибка коэффициента регрессии b рассчитывается по формуле
в) Стандартная ошибка коэффициента корреляции рассчитывается по формуле
t-критерий Стъюдента при числе степеней свободы и уровне значимости 0,05 смотреть в таблице.
Фактические значения t-статистики:
Если фактическое значение по абсолютной величине превышает табличное, гипотезу о несущественности параметра регрессии можно отклонить, параметр признается значимым.
Связь между F-критерием Фишера и t-критерием Стъюдента выражается равенством
Расчет доверительных интервалов для параметров регрессии:
Доверительный интервал для параметра a определяется как ;
доверительный интервал для коэффициента регрессии определяется как .
При компьютерном анализе использовать в Excel Сервис/Анализ данных/Регрессия.
Интервальный прогноз на основе линейного уравнения регрессии:
Пусть – прогнозное значение факторного признака; – точечный прогноз результативного признака. Тогда
а) средняя ошибка прогноза :
б) доверительный интервал прогноза
Практические рекомендации по выполнению расчетов
с помощью табличного редактора MS Excel
Активизация надстройки Пакет анализа
Для активизации надстройки Пакет анализа необходимо выполнить следующие действия:
1. Выбрать команду Сервис/Надстройки.
2. В появившемся диалоговом окне установить флажок Пакет анализа.
В соответствии с вариантом задания, используя статистический материал, необходимо:
1. Рассчитать параметры уравнения линейной парной регрессии .
2. Оценить тесноту связи зависимой переменной (результативного фактора) с объясняющей переменной с помощью показателей корреляции и детерминации.
3. Оценить с помощью F-критерия Фишера статистическую надежность моделирования.
4. Оценить статистическую значимость параметров регрессии и корреляции.
5. Определить среднюю ошибку аппроксимации.
6. Используя коэффициент эластичности, выполнить количественную оценку влияния объясняющего фактора на результат.
7. Выполнить точечный и интервальный прогноз результативного признака при увеличении объясняющего признака на 25% от его среднего значения (достоверность прогноза 95%).
8. На одной диаграмме изобразить поле корреляции исходных данных и прямую регрессии.
Пример
Имеются данные о годовой цене программы «Мастер делового администрирования» и числе слушателей в образовательном учреждении.
тыс. долл., y
слушателей, чел., x
I. Вводим исходные данные в документ Excel.
II. Вызываем надстройку Анализ данных в меню Сервис.
III. Выбираем инструмент Регрессия.
IV. Заполняем соответствующие позиции окна Регрессия.
V. После нажатия Ок получаем протокол решения задачи.
VI. Анализируем полученный протокол.
1) Коэффициент регрессии ;
Свободный член уравнения регрессии .
Примечание. При необходимости результаты округляются с нужной точностью. Требование по округлению можно провести изначально, задав количество знаков после запятой в меню Формат ячейки.
Уравнение парной линейной регрессии имеет вид: .
2) Коэффициент корреляции , что свидетельствует о тесной связи признаков y и x. Коэффициент детерминации . Полученное уравнение регрессии объясняет 53% вариации признака y, остальные 47% изменчивости этого признака обусловлены влиянием неучтенных в модели факторов.
3) Оценим статистическую значимость (надежность моделирования) уравнения в целом. Расчетное значение критерия Фишера указано в протоколе, . Критическое значение этого критерия можно найти с помощь статистической функции FРАСПОБР табличного редактора Еxcel.
Входными параметрами этой функции являются:
– уровень значимости (вероятность), имеется в виду вероятность ошибки отвергнуть верную гипотезу о статистической незначимости построенного уравнения регрессии. Как правило, выбирают уровень значимости, равный 0,05 или 0,01;
– число степеней свободы 1 – совпадает с количеством параметров при переменной в уравнении регрессии, для парной линейной регрессии это число равно единице;
– число степеней свободы 2 равно для парной линейной регрессии , где n – объем исходных статистических данных.
Выполняем действия Вставка/Функция, выбираем нужное.
Поскольку расчетное значение F-критерия больше табличного, равного 4,84, нулевая гипотеза об отсутствии значимой связи признаков x и y отклоняется и делается вывод о существенности этой связи.
4) Оценим статистическую значимость параметров a и b в уравнении регрессии с помощью t- критерия Стъюдента.
Расчетные значения статистики Стъюдента , . Соответствующее табличное значение можно определить через статистическую функцию СТЪЮДРАСПОБР, число степеней свободы равно .
Поскольку фактические значения по абсолютной величине превышают табличное, равное 2,2, гипотезу о несущественности параметров регрессии можно отклонить.
5) Определим среднюю ошибку аппроксимации, . Понадобится выполнение вспомогательных расчетов, оформленных в виде таблицы.