Метод наименьших квадратов (МНК) — один из методов регрессионного анализа для оценки неизвестных величин по результатам измерений, содержащим случайные ошибки. Данный метод применяется также для приближённого представления заданной функции другими (более простыми) функциями и часто оказывается полезным при обработке наблюдений.
Когда искомая величина может быть измерена непосредственно, как, например, длина отрезка или угол, то, для увеличения точности измерение производится много раз, и за окончательный результат берут арифметическое среднее из всех отдельных измерений. Это правило арифметической середины основывается на соображениях теории вероятностей; легко показать, что сумма квадратов уклонений отдельных измерений от арифметической середины будет меньше, чем сумма квадратов уклонений отдельных измерений от какой бы то ни было другой величины. Само правило арифметической середины представляет, следовательно, простейший случай метода наименьших квадратов.
При применении МНК используется подстановка в начальные уравнения неизвестных величин. При этом в правых частях уравнений получаются если не нули, то небольшие величины, сумма квадратов которых оказывается меньшей, чем сумма квадратов подобных же остатков после подстановки каких бы то ни было других значений неизвестных. Помимо этого, решение уравнений по способу наименьших квадратов даёт возможность выводить вероятные ошибки неизвестных, то есть даёт величины, по которым судят о степени точности выводов.
Двухшаговый МНК. Системы одновременных уравнений
ДМНК состоит в следующем:
составляют приведенную форму модели и определяют численные значения ее параметров обычным МНК;
выявляют эндогенные переменные, находящиеся в правой части структурного уравнения, параметры которого определяют ДМНК, и находят их расчетные значения по соответствующим уравнениям приведенной формы модели;
обычным МНК определяют параметры структурного уравнения, используя в качестве исходных данных фактические значения предопределенных переменных и расчетные значения эндогенных переменных, стоящих в правой части данного структурного уравнения.
Взвешенный МНК
Взвешивание применяется для оценивания коэффициентов модели Y = X β + ε в предположении гетероскедастичности остатков .
Случай сводится к стандартной модели множественной линейной регрессии с гомоскедастичными остатками несложным преобразованием:
Оценивание полученной модели выполняется стандартным МНК.
Доступный обобщенный МНК
В случае линейной регрессионной модели Y = X β + ε в предположении распределения остатков ε по закону N (0, σ 2 Ω) с заданной матрицей ковариаций Ω, оценка доступного обобщенного метода наименьших квадратов реализуется формулой:
При наличии в модели константы, подлежащей автоматическому оцениванию, следует дополнить матрицу X единичным столбцом.
Метод наименьших квадратов мнк может применяться для оценки параметров исходной регрессионной модели в форме
2.2. Оценка параметров линейной модели по методу наименьших квадратов (МНК)
Этот метод и многочисленные его модификации являются основными и в эконометрике. Поэтому при изучении данного курса ему нужно уделить особое внимание.
2.2.1. Критерий наименьших квадратов. Сравнение с другими возможными критериями
Запишем уравнение для отдельных наблюдений (реализаций) в парной линейной регрессии
Уравнение ( 2.6 ) выражает эмпирическую взаимосвязь между переменными модели и его можно записать только относительно конкретных наблюдений. Подчеркнем, что ошибки модели являются наблюдаемыми величинами, поскольку их можно определить исходя из наблюдений переменных модели.
В методе наименьших квадратов оценки a и b параметров модели строятся так, что бы минимизировать сумму квадратов ошибок (остатков) модели по всем наблюдениям. Таким образом, критерий (целевая функция) наименьших квадратов записывается в виде
Очевидно, правая часть выражения ( 2.7 ) является квадратичной функцией параметров a и b.
2.2.2. Вывод нормальных уравнений для оценок параметров регрессии. Решение нормальных уравнений. Варианты записи выражений для оценок параметров
Получим выражения для оптимальных в смысле минимума МНК-критерия оценок параметров модели парной линейной регрессии.
Согласно методу наименьших квадратов, необходимо минимизировать функцию двух переменных
Из курса высшей математики известно, что условием минимума функции вида ( 2.8 ) по переменным a и b является равенство нулю частных производных этой функции. Уравнения для определения оптимальных оценок получаются путем приравнивания нулю производной функции S(a,b) как функции только от a при фиксированном b и производной функции S(a,b) как функции только от b при фиксированном a.
Это приводит к следующей системе уравнений:
которую необходимо решить относительно переменных a и b. По правилам вычисления производных получим следующие выражения:
так что значения параметров a и b, минимизирующие квадратичную форму ( 2.8 ), удовлетворяют соотношениям
После несложных преобразований эту систему можно записать в виде
Система уравнений ( 2.11 ), ( 2.12 ) называется системой нормальных уравнений для коэффициентов регрессии.
Это система двух линейных уравнений с двумя неизвестными и она легко может быть решена, например, методом подстановки.
Из первого уравнения системы находим:
где , — выборочные средние наблюдений.
Подставив выражение для a во второе уравнение системы, получим
,
,
Таким образом, мы получили следующие соотношения для оценок параметров модели
,
Однако, в теоретических исследованиях и практических расчетах чаще используют другую, более удобную эквивалентную форму записи уравнений для оценок. Эта форма получается, если использовать следующие соотношения
Эти соотношения позволяют получить новую форму записи выражения для b (в отклонениях от выборочных средних значений)
которая вместе с выражением для a
которое означает, что определитель системы нормальных уравнений отличен от нуля. Действительно, этот определитель равен
Выражение для коэффициента b часто записывают также, используя понятия выборочной вариации (дисперсии) и выборочной ковариации.
Выборочная вариация определяется соотношением вида
и выборочная ковариация следующим соотношением
Используя введенные понятия, формулу ( 2.13 ) для коэффициента b можно записать в виде
Замечание относительно выборочных дисперсии и ковариации.
Напомним, что выборочная дисперсия характеризует степень разброса случайной величины относительно ее выборочного среднего значения. Выборочная ковариация характеризует степень линейной статистической взаимосвязи двух случайных величин. При определенных условиях, которые будут рассмотрены позже, выражения ( 2.16 ) и ( 2.17 ) являются несмещенными эмпирическими оценками теоретических дисперсии и ковариации.
Замечание относительно полученных оценок.
Если независимая переменная не случайная (детерминированная) величина, то ее дисперсия равна нулю, а ковариация детерминированной и случайной величин равна нулю. В этом случае выборочные дисперсия (вариация) x и выборочная ковариация величин x и y теряют смысл оценок соответствующих теоретических значений дисперсии и ковариации и должны рассматриваться только как некоторые характеристики наблюдаемых переменных, не связанные с их статистическими свойствами.
И, наконец, подчеркнем еще раз, что уравнения для оценок получены без каких либо предположений относительно характеристик случайных составляющих модели.
Интерпретация оценок параметров
Определим оценку зависимой переменной y уравнением
Уравнение ( 2.19 ) определяет эмпирическую регрессионную функцию, оценка называется прогнозом объясняемой переменной. Эта функция определяет прямую на плоскости . Эмпирический коэффициент b является частной производной ( 2.19 ) по независимой переменной x (регрессору). Следовательно можно дать следующую интерпретацию коэффициента b: изменение величины независимой переменной x на единицу при фиксированном значении параметра a приведет к изменению оценки переменной y на величину коэффициента b.
Таблица 1.1
Из диаграммы рассеяния, построенной по этим данным (рис. 2.4a ), можно предположить существование линейной зависимости между переменными y и x.
Рис. 2.4а. Диаграмма рассеяния примера 2.1
Рис. 2.4б. Линия регрессии (пример 2.1)
Оценки параметров парной линейной регрессии, вычисленные по формулам ( 2.13 ), ( 2.14 ) равны: a=4,02; b=1,29. Уравнение регрессии имеет вид
Торговое предприятие имеет несколько филиалов. Исследуем зависимость годового товарооборота отдельного филиала от: а) размера торговой площади; б) среднедневной интенсивности потока покупателей. Поскольку мы пока не умеем строить модели множественной регрессии, построим две «частные» модели парной регрессии.
Таблица 1.2
Для второй регрессии получаем следующие оценки: a=-2,0394, b=0,6846. Ее уравнение
Обобщенный метод наименьших квадратов применяется для оценки параметров линейных регрессионных моделей с __________ остатками
+: автокоррелированными и/или гетероскедастичными
-гомоскедастичными и некоррелированными
Метод наименьших квадратов (МНК) может применяться для оценки параметров исходной регрессионной модели в _________ форме.
+: линейной
-надежности среднеквадратической ошибки
-ненадежности среднеквадратической ошибки
+: ненадежности оценки
детерминации для модели в исходных показателях равен … Варианты ответов
+: 0,64
При методе наименьших квадратов параметры уравнения парной линейной регрессии определяются из условия ______ остатков .
равенства нулю суммы квадратов
+ минимизации суммы квадратов
125 Значение критерия Дарбина – Уотсона можно приблизительно рассчитать по формуле где – значение коэффициента автокорреляции остатков модели. Минимальная величина значения будет наблюдаться при ________ автокорреляции остатков.
+ положительной
126 Исходная регрессионная модель имеет вид Преобразование переменных вида используется в том случае, если ________ и оценка параметров проводится с помощью ________ метода наименьших квадратов
предпосылки МНК нарушены; традиционного
предпосылки МНК не нарушены; обобщенного
предпосылки МНК не нарушены; традиционного
+ предпосылки МНК нарушены; обобщенного
Если известно уравнение множественной регрессии построенное по результатам 50 наблюдений, для которого общая сумма квадратов отклонений равна 153, и остаточная сумма квадратов отклонений равна 3, то значение F-статистики равно …
+766,67
Тема208: Обобщенный метод наименьших квадратов (ОМНК) Пустьy– издержки производства, – объем продукции, – основные производственные фонды, – численность работников. Известно, что в уравнении дисперсии остатков пропорциональны квадрату численности работников . После применения обобщенного метода наименьших квадратов новая модель приняла вид . Тогда параметр в новом уравнении характеризует среднее изменение затрат …
на работника при увеличении производительности труда на единицу при неизменном уровне фондовооруженности труда
на единицу продукции при увеличении фондоемкости продукции на единицу при неизменном уровне трудоемкости продукции
на работника при увеличении фондовооруженности труда на единицу при неизменном уровне производительности труда
на единицу продукции при увеличении трудоемкости продукции на единицу при неизменном уровне фондоемкости продукции
Тема219: Временные ряды данных: характеристики и общие понятия Ряд, уровни которого образуются как сумма среднего уровня ряда и некоторой случайной компоненты, изображен на графике … Варианты ответов
Тема: Линеаризация нелинейных моделей регрессии Для линеаризации нелинейной функции может быть применен метод …
Варианты ответов
логарифмирования и замены переменных
обращения и замены переменных
разложения функции в ряд Тейлора
потенцирования и замены переменных
Тема: Модели стационарных и нестационарных временных рядов и их идентификация Для стационарных временных рядов y1, у2, … yt, …, yn (t = 1, …, n) автокорреляция зависит только от величины …
Варианты ответов
лага
количества уровней ряда
математического ожидания значений уровня ряда
начального значения процесса
1)Тема: Предпосылки МНК, методы их проверки Предпосылками метода наименьших квадратов (МНК) являются следующие …(не менее 2 вариантов ответа) Варианты ответов + 1 отсутствие автокорреляции в остатках 2 присутствие в эконометрической модели более чем двух факторов 3 функциональная связь между зависимой и независимой переменными + 4 гомоскедастичность остатков
2)Тема: Оценка параметров линейных уравнений регрессии Метод наименьших квадратов применим к уравнениям регрессии, …(не менее 2 вариантов ответа) Варианты ответов 1 которые отражают нелинейную зависимость между двумя экономическими показателями и не могут быть приведены к линейному виду +2 которые отражают нелинейную зависимость между двумя экономическими показателями, но могут быть приведены к линейному виду 3 нелинейного вида +4 которые отражают линейную зависимость между двумя экономическими показателями
3) Тема: Обобщенный метод наименьших квадратов (ОМНК) Обобщенный метод наименьших квадратов подразумевает … (не менее 2 вариантов ответа) Варианты ответов 1 переход от множественной регрессии к парной +2 преобразование переменных +3 введение в выражение для дисперсии остатков коэффициента пропорциональности 4 двухэтапное применение метода наименьших квадратов
2) Тема: Свойства оценок параметров эконометрической модели, получаемых при помощи МНК Несмещенность оценки характеризуется …(не менее 2 вариантов ответа) Варианты ответов 1 зависимостью от объема выборки значения математического ожидания остатков +2 равенством нулю математического ожидания остатков 3 максимальной дисперсией остатков + 4 отсутствием накопления остатков при большом числе выборочных оцениваний
111.Тема: Структура временного ряда
Автокорреляционной функцией временного ряда называется последовательность коэффициентов автокорреляции …
между трендовой, сезонной и случайной компонентами
+первого, второго, третьего и последующих порядков
факторов, формирующих уровень ряда между несколькими временными рядами
118.Тема: Обобщенный метод наименьших квадратов (ОМНК)
При оценке параметров регрессионной модели с гетероскедастичными остатками при помощи обобщенного метода наименьших квадратов (ОМНК) выдвигается предположение, что дисперсия остатков …