Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Методом наименьших квадратов оцените параметры уравнения линейной регрессии

При различных значениях а и b можно построить бесконечное число зависимостей вида yx=a+bx т.е на координатной плоскости имеется бесконечное количество прямых, нам же необходима такая зависимость, которая соответствует наблюдаемым значениям наилучшим образом. Таким образом, задача сводится к подбору наилучших коэффициентов.

Линейную функцию a+bx ищем, исходя лишь из некоторого количества имеющихся наблюдений. Для нахождения функции с наилучшим соответствием наблюдаемым значениям используем метод наименьших квадратов.

В методе наименьших квадратов требуется, чтобы εi, разность между измеренными yi и вычисленными по уравнению значениям Yi, была минимальной. Следовательно, находим коэффициенты а и b так, чтобы сумма квадратов отклонений наблюдаемых значений от значений на прямой линии регрессии оказалась наименьшей:

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Исследуя на экстремум эту функцию аргументов а и с помощью производных, можно доказать, что функция принимает минимальное значение, если коэффициенты а и b являются решениями системы:

Если разделить обе части нормальных уравнений на n, то получим:

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Учитывая, что Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии(3)

Получим Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии, отсюда Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии, подставляя значение a в первое уравнение, получим:

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

При этом b называют коэффициентом регрессии; a называют свободным членом уравнения регрессии и вычисляют по формуле: Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Полученная прямая является оценкой для теоретической линии регрессии. Имеем:

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Итак, Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессииявляется уравнением линейной регрессии.

Регрессия может быть прямой (b>0) и обратной (b 2 =4+0+1+4+16=25
Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессииxiyi=-2•0.5+0•1+1•1.5+2•2+4•3=16.5
Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессииyi=0.5+1+1.5+2+3=8

и нормальная система (2) имеет вид Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Решая эту систему, получим: b=0.425, a=1.175. Поэтому y=1.175+0.425x.

Пример 2. Имеется выборка из 10 наблюдений экономических показателей (X) и (Y).

xi180172173169175170179170167174
yi186180176171182166182172169177

Требуется найти выборочное уравнение регрессии Y на X. Построить выборочную линию регрессии Y на X.

Решение. 1. Проведем упорядочивание данных по значениям xi и yi. Получаем новую таблицу:

xi167169170170172173174175179180
yi169171166172180176177182182186

Для упрощения вычислений составим расчетную таблицу, в которую занесем необходимые численные значения.

xiyixi 2xiyi
1671692788928223
1691712856128899
1701662890028220
1701722890029240
1721802958430960
1731762992930448
1741773027630798
1751823062531850
1791823204132578
1801863240033480
∑xi=1729∑yi=1761∑xi 2 299105∑xiyi=304696
x=172.9y=176.1xi 2 =29910.5xy=30469.6

Согласно формуле (4), вычисляем коэффициента регрессии

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Таким образом, выборочное уравнение регрессии имеет вид y=-59.34+1.3804x.
Нанесем на координатной плоскости точки (xi; yi) и отметим прямую регрессии.

На рис.4 видно, как располагаются наблюдаемые значения относительно линии регрессии. Для численной оценки отклонений yi от Yi, где yi наблюдаемые, а Yi определяемые регрессией значения, составим таблицу:

xiyiYiYi-yi
167169168.055-0.945
169171170.778-0.222
170166172.1406.140
170172172.1400.140
172180174.863-5.137
173176176.2250.225
174177177.5870.587
175182178.949-3.051
179182184.3952.395
180186185.757-0.243

Значения Yi вычислены согласно уравнению регрессии.

Заметное отклонение некоторых наблюдаемых значений от линии регрессии объясняется малым числом наблюдений. При исследовании степени линейной зависимости Y от X число наблюдений учитывается. Сила зависимости определяется величиной коэффициента корреляции.

Источник

Метод наименьших квадратов регрессия

Метод наименьших квадратов (МНК) заключается в том, что сумма квадратов отклонений значений y от полученного уравнения регрессии — минимальное. Уравнение линейной регрессии имеет вид

y=ax+b

a, b – коэффициенты линейного уравнения регрессии;

x – независимая переменная;

y – зависимая переменная.

Нахождения коэффициентов уравнения линейной регрессии через метод наименьших квадратов:

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

частные производные функции приравниваем к нулю

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

отсюда получаем систему линейных уравнений

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Формулы определения коэффициентов уравнения линейной регрессии:

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Также запишем уравнение регрессии для квадратной нелинейной функции:

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Система линейных уравнений регрессии полинома n-ого порядка:

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Формула коэффициента детерминации R 2 :

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Формула средней ошибки аппроксимации для уравнения линейной регрессии (оценка качества модели):

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Чем меньше ε, тем лучше. Рекомендованный показатель ε
Формула среднеквадратической погрешности:
Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Для примера, проведём расчет для получения линейного уравнения регрессии аппроксимации функции, заданной в табличном виде:

xy
34
47
611
716
918
1122
1324
1527
1630
1933

Решение

Расчеты значений суммы, произведения x и у приведены в таблицы.

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Расчет коэффициентов линейной регрессии:

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

при этом средняя ошибка аппроксимации равна:

ε=11,168%

Получаем уравнение линейной регрессии с помощью метода наименьших квадратов:

y=1,7871x+0,79

График функции линейной зависимости y=1,7871x+0,79 и табличные значения, в виде точек

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Коэффициент корреляции равен 0,988
Коэффициента детерминации равен 0,976

Источник

Решаем уравнение простой линейной регрессии

В статье рассматривается несколько способов определения математического уравнения линии простой (парной) регрессии.

Все рассматриваемые здесь способы решения уравнения основаны на методе наименьших квадратов. Обозначим способы следующим образом:

Весь код, приведенный в статье, написан на языке python 2.7 с использованием Jupyter Notebook. Исходный код и файл с данными выборки выложен на гитхабе

Статья в большей степени ориентирована как на начинающих, так и на тех, кто уже понемногу начал осваивать изучение весьма обширного раздела в искусственном интеллекте — машинного обучения.

Для иллюстрации материала используем очень простой пример.

Условия примера

У нас есть пять значений, которые характеризуют зависимость Y от X (Таблица №1):

Таблица №1 «Условия примера»

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Будем считать, что значения Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии— это месяц года, а Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии— выручка в этом месяце. Другими словами, выручка зависит от месяца года, а Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии— единственный признак, от которого зависит выручка.

Пример так себе, как с точки зрения условной зависимости выручки от месяца года, так и с точки зрения количества значений — их очень мало. Однако такое упрощение позволит, что называется на пальцах, объяснить, не всегда с легкостью, усваиваемый новичками материал. А также простота чисел позволит без весомых трудозатрат, желающим, порешать пример на «бумаге».

Предположим, что приведенная в примере зависимость, может быть достаточно хорошо аппроксимирована математическим уравнением линии простой (парной) регрессии вида:

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

где Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии— это месяц, в котором была получена выручка, Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии— выручка, соответствующая месяцу, Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии— коэффициенты регрессии оцененной линии.

Отметим, что коэффициент Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиичасто называют угловым коэффициентом или градиентом оцененной линии; представляет собой величину, на которую изменится Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиипри изменении Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии.

Очевидно, что наша задача в примере — подобрать в уравнении такие коэффициенты Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии, при которых отклонения наших расчетных значений выручки по месяцам от истинных ответов, т.е. значений, представленных в выборке, будут минимальны.

Метод наименьших квадратов

В соответствии с методом наименьших квадратов, отклонение стоит рассчитывать, возводя его в квадрат. Подобный прием позволяет избежать взаимного погашения отклонений, в том случае, если они имеют противоположные знаки. Например, если в одном случае, отклонение составляет +5 (плюс пять), а в другом -5 (минус пять), то сумма отклонений взаимно погасится и составит 0 (ноль). Можно и не возводить отклонение в квадрат, а воспользоваться свойством модуля и тогда у нас все отклонения будут положительными и будут накапливаться. Мы не будем останавливаться на этом моменте подробно, а просто обозначим, что для удобства расчетов, принято возводить отклонение в квадрат.

Вот так выглядит формула, с помощью которой мы определим наименьшую сумму квадратов отклонений (ошибки):

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

где Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии— это функция аппроксимации истинных ответов (то есть посчитанная нами выручка),

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии— это истинные ответы (предоставленная в выборке выручка),

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии— это индекс выборки (номер месяца, в котором происходит определение отклонения)

Продифференцируем функцию, определим уравнения частных производных и будем готовы перейти к аналитическому решению. Но для начала проведем небольшой экскурс о том, что такое дифференцирование и вспомним геометрический смысл производной.

Дифференцирование

Дифференцированием называется операция по нахождению производной функции.

Для чего нужна производная? Производная функции характеризует скорость изменения функции и указывает нам ее направление. Если производная в заданной точке положительна, то функция возрастает, в обратном случае — функция убывает. И чем больше значение производной по модулю, тем выше скорость изменения значений функции, а также круче угол наклона графика функции.

Например, в условиях декартовой системы координат, значение производной в точке M(0,0) равное +25 означает, что в заданной точке, при смещении значения Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиивправо на условную единицу, значение Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиивозрастает на 25 условных единиц. На графике это выглядит, как достаточно крутой угол подъема значений Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиис заданной точки.

Другой пример. Значение производной равное -0,1 означает, что при смещении Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиина одну условную единицу, значение Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессииубывает всего лишь на 0,1 условную единицу. При этом, на графике функции, мы можем наблюдать едва заметный наклон вниз. Проводя аналогию с горой, то мы как будто очень медленно спускаемся по пологому склону с горы, в отличие от предыдущего примера, где нам приходилось брать очень крутые вершины:)

Таким образом, проведя дифференцирование функции Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиипо коэффициентам Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии, определим уравнения частных производных 1-го порядка. После определения уравнений, мы получим систему из двух уравнений, решив которую мы сможем подобрать такие значения коэффициентов Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии, при которых значения соответствующих производных в заданных точках изменяются на очень и очень малую величину, а в случае с аналитическим решением не изменяются вовсе. Другими словами, функция ошибки при найденных коэффициентах достигнет минимума, так как значения частных производных в этих точках будут равны нулю.

Итак, по правилам дифференцирования уравнение частной производной 1-го порядка по коэффициенту Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиипримет вид:

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

уравнение частной производной 1-го порядка по Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиипримет вид:

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

В итоге мы получили систему уравнений, которая имеет достаточно простое аналитическое решение:

\begin
\begin
na + b\sum\limits_^nx_i — \sum\limits_^ny_i = 0
\\
\sum\limits_^nx_i(a +b\sum\limits_^nx_i — \sum\limits_^ny_i) = 0
\end
\end

Прежде чем решать уравнение, предварительно загрузим, проверим правильность загрузки и отформатируем данные.

Загрузка и форматирование данных

Необходимо отметить, что в связи с тем, что для аналитического решения, а в дальнейшем для градиентного и стохастического градиентного спуска, мы будем применять код в двух вариациях: с использованием библиотеки NumPy и без её использования, то нам потребуется соответствующее форматирование данных (см. код).

Визуализация

Теперь, после того, как мы, во-первых, загрузили данные, во-вторых, проверили правильность загрузки и наконец отформатировали данные, проведем первую визуализацию. Часто для этого используют метод pairplot библиотеки Seaborn. В нашем примере, ввиду ограниченности цифр нет смысла применять библиотеку Seaborn. Мы воспользуемся обычной библиотекой Matplotlib и посмотрим только на диаграмму рассеяния.

График №1 «Зависимость выручки от месяца года»

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Аналитическое решение

Воспользуемся самыми обычными инструментами в python и решим систему уравнений:

\begin
\begin
na + b\sum\limits_^nx_i — \sum\limits_^ny_i = 0
\\
\sum\limits_^nx_i(a +b\sum\limits_^nx_i — \sum\limits_^ny_i) = 0
\end
\end

По правилу Крамера найдем общий определитель, а также определители по Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии по Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии, после чего, разделив определитель по Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиина общий определитель — найдем коэффициент Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии, аналогично найдем коэффициент Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии.

Вот, что у нас получилось:

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Итак, значения коэффициентов найдены, сумма квадратов отклонений установлена. Нарисуем на гистограмме рассеяния прямую линию в соответствии с найденными коэффициентами.

График №2 «Правильные и расчетные ответы»

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Можно посмотреть на график отклонений за каждый месяц. В нашем случае, какой-либо значимой практической ценности мы из него не вынесем, но удовлетворим любопытство в том, насколько хорошо, уравнение простой линейной регрессии характеризует зависимость выручки от месяца года.

График №3 «Отклонения, %»

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Не идеально, но нашу задачу мы выполнили.

Напишем функцию, которая для определения коэффициентов Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиииспользует библиотеку NumPy, точнее — напишем две функции: одну с использованием псевдообратной матрицы (не рекомендуется на практике, так как процесс вычислительно сложный и нестабильный), другую с использованием матричного уравнения.

Сравним время, которое было затрачено на определение коэффициентов Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии, в соответствии с 3-мя представленными способами.

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

На небольшом количестве данных, вперед выходит «самописная» функция, которая находит коэффициенты методом Крамера.

Теперь можно перейти к другим способам нахождения коэффициентов Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии.

Градиентный спуск

Для начала определим, что такое градиент. По-простому, градиент — это отрезок, который указывает направление максимального роста функции. По аналогии с подъемом в гору, то куда смотрит градиент, там и есть самый крутой подъем к вершине горы. Развивая пример с горой, вспоминаем, что на самом деле нам нужен самый крутой спуск, чтобы как можно быстрее достичь низины, то есть минимума — места где функция не возрастает и не убывает. В этом месте производная будет равна нулю. Следовательно, нам нужен не градиент, а антиградиент. Для нахождения антиградиента нужно всего лишь умножить градиент на -1 (минус один).

Обратим внимание на то, что функция может иметь несколько минимумов, и опустившись в один из них по предложенному далее алгоритму, мы не сможем найти другой минимум, который возможно находится ниже найденного. Расслабимся, нам это не грозит! В нашем случае мы имеем дело с единственным минимумом, так как наша функция Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиина графике представляет собой обычную параболу. А как мы все должны прекрасно знать из школьного курса математики — у параболы существует только один минимум.

После того, как мы выяснили для чего нам потребовался градиент, а также то, что градиент — это отрезок, то есть вектор с заданными координатами, которые как раз являются теми самыми коэффициентами Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиимы можем реализовать градиентный спуск.

Перед запуском, предлагаю прочитать буквально несколько предложений об алгоритме спуска:

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Мы погрузились на самое дно Марианской впадины и там обнаружили все те же значения коэффициентов Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии, что собственно и следовало ожидать.

Совершим еще одно погружение, только на этот раз, начинкой нашего глубоководного аппарата будут иные технологии, а именно библиотека NumPy.

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии
Значения коэффициентов Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиинеизменны.

Посмотрим на то, как изменялась ошибка при градиентном спуске, то есть как изменялась сумма квадратов отклонений с каждым шагом.

График №4 «Сумма квадратов отклонений при градиентном спуске»

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

На графике мы видим, что с каждым шагом ошибка уменьшается, а спустя какое-то количество итераций наблюдаем практически горизонтальную линию.

Напоследок оценим разницу во времени исполнения кода:

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Возможно мы делаем что-то не то, но опять простая «самописная» функция, которая не использует библиотеку NumPy опережает по времени выполнения расчетов функцию, использующую библиотеку NumPy.

Но мы не стоим на месте, а двигаемся в сторону изучения еще одного увлекательного способа решения уравнения простой линейной регрессии. Встречайте!

Стохастический градиентный спуск

Для того, чтобы быстрее понять принцип работы стохастического градиентного спуска, лучше определить его отличия от обычного градиентного спуска. Мы, в случае с градиентным спуском, в уравнениях производных от Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиииспользовали суммы значений всех признаков и истинных ответов, имеющихся в выборке (то есть суммы всех Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии). В стохастическом градиентном спуске мы не будем использовать все значения, имеющиеся в выборке, а вместо этого, псевдослучайным образом выберем так называемый индекс выборки и используем его значения.

Например, если индекс определился за номером 3 (три), то мы берем значения Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии, далее подставляем значения в уравнения производных и определяем новые координаты. Затем, определив координаты, мы опять псевдослучайным образом определяем индекс выборки, подставляем значения, соответствующие индексу в уравнения частных производных, по новому определяем координаты Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии т.д. до позеленения сходимости. На первый взгляд, может показаться, как это вообще может работать, однако работает. Правда стоит отметить, что не с каждым шагом уменьшается ошибка, но тенденция безусловно имеется.

Каковы преимущества стохастического градиентного спуска перед обычным? В случае, если у нас размер выборки очень велик и измеряется десятками тысяч значений, то значительно проще обработать, допустим случайную тысячу из них, нежели всю выборку. Вот в этом случае и запускается стохастический градиентный спуск. В нашем случае мы конечно же большой разницы не заметим.

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Смотрим внимательно на коэффициенты и ловим себя на вопросе «Как же так?». У нас получились другие значения коэффициентов Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Может быть стохастический градиентный спуск нашел более оптимальные параметры уравнения? Увы, нет. Достаточно посмотреть на сумму квадратов отклонений и увидеть, что при новых значениях коэффициентов, ошибка больше. Не спешим отчаиваться. Построим график изменения ошибки.

График №5 «Сумма квадратов отклонений при стохастическом градиентном спуске»

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Посмотрев на график, все становится на свои места и сейчас мы все исправим.

Итак, что же произошло? Произошло следующее. Когда мы выбираем случайным образом месяц, то именно для выбранного месяца наш алгоритм стремится уменьшить ошибку в расчете выручки. Затем выбираем другой месяц и повторяем расчет, но ошибку уменьшаем уже для второго выбранного месяца. А теперь вспомним, что у нас первые два месяца существенно отклоняются от линии уравнения простой линейной регрессии. Это значит, что когда выбирается любой из этих двух месяцев, то уменьшая ошибку каждого из них, наш алгоритм серьезно увеличивает ошибку по всей выборке. Так что же делать? Ответ простой: надо уменьшить шаг спуска. Ведь уменьшив шаг спуска, ошибка так же перестанет «скакать» то вверх, то вниз. Вернее, ошибка «скакать» не перестанет, но будет это делать не так прытко:) Проверим.

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

График №6 «Сумма квадратов отклонений при стохастическом градиентном спуске (80 тыс. шагов)»

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Значения коэффициентов улучшились, но все равно не идеальны. Гипотетически это можно поправить таким образом. Выбираем, например, на последних 1000 итерациях значения коэффициентов, с которыми была допущена минимальная ошибка. Правда нам для этого придется записывать еще и сами значения коэффициентов. Мы не будем этого делать, а лучше обратим внимание на график. Он выглядит гладким, и ошибка как будто уменьшается равномерно. На самом деле это не так. Посмотрим на первые 1000 итераций и сравним их с последними.

График №7 «Сумма квадратов отклонений SGD (первые 1000 шагов)»

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

График №8 «Сумма квадратов отклонений SGD (последние 1000 шагов)»

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

В самом начале спуска мы наблюдаем достаточно равномерное и крутое уменьшение ошибки. На последних итерациях мы видим, что ошибка ходит вокруг да около значения в 1,475 и в некоторые моменты даже равняется этому оптимальному значению, но потом все равно уходит ввысь… Повторюсь, можно записывать значения коэффициентов Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиии Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии, а потом выбрать те, при которых ошибка минимальна. Однако у нас возникла проблема посерьезнее: нам пришлось сделать 80 тыс. шагов (см. код), чтобы получить значения, близкие к оптимальным. А это, уже противоречит идее об экономии времени вычислений при стохастическом градиентном спуске относительно градиентного. Что можно поправить и улучшить? Не трудно заметить, что на первых итерациях мы уверенно идем вниз и, следовательно, нам стоит оставить большой шаг на первых итерациях и по мере продвижения вперед шаг уменьшать. Мы не будем этого делать в этой статье — она и так уже затянулась. Желающие могут и сами подумать, как это сделать, это не сложно 🙂

Теперь выполним стохастический градиентный спуск, используя библиотеку NumPy (и не будем спотыкаться о камни, которые мы выявили раннее)

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Значения получились почти такими же, как и при спуске без использования NumPy. Впрочем, это логично.

Узнаем сколько же времени занимали у нас стохастические градиентные спуски.

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии

Чем дальше в лес, тем темнее тучи: опять «самописная» формула показывает лучший результат. Все это наводит на мысли о том, что должны существовать еще более тонкие способы использования библиотеки NumPy, которые действительно ускоряют операции вычислений. В этой статье мы о них уже не узнаем. Будет о чем подумать на досуге:)

Резюмируем

Перед тем как резюмировать, хотелось бы ответить на вопрос, который скорее всего, возник у нашего дорогого читателя. Для чего, собственно, такие «мучения» со спусками, зачем нам ходить по горе вверх и вниз (преимущественно вниз), чтобы найти заветную низину, если в наших руках такой мощный и простой прибор, в виде аналитического решения, который мгновенно телепортирует нас в нужное место?

Ответ на этот вопрос лежит на поверхности. Сейчас мы разбирали очень простой пример, в котором истинный ответ Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессиизависит от одного признака Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. В жизни такое встретишь не часто, поэтому представим, что у нас признаков 2, 30, 50 или более. Добавим к этому тысячи, а то и десятки тысяч значений для каждого признака. В этом случае аналитическое решение может не выдержать испытания и дать сбой. В свою очередь градиентный спуск и его вариации будут медленно, но верно приближать нас к цели — минимуму функции. А на счет скорости не волнуйтесь — мы наверняка еще разберем способы, которые позволят нам задавать и регулировать длину шага (то есть скорость).

А теперь собственно краткое резюме.

Во-первых, надеюсь, что изложенный в статье материал, поможет начинающим «дата сайнтистам» в понимании того, как решать уравнения простой (и не только) линейной регрессии.

Во-вторых, мы рассмотрели несколько способов решения уравнения. Теперь, в зависимости от ситуации, мы можем выбрать тот, который лучше всего подходит для решения поставленной задачи.

В-третьих, мы увидели силу дополнительных настроек, а именно длины шага градиентного спуска. Этим параметром нельзя пренебрегать. Как было подмечено выше, с целью сокращения затрат на проведение вычислений, длину шага стоит изменять по ходу спуска.

В-четвертых, в нашем случае, «самописные» функции показали лучший временной результат вычислений. Вероятно, это связано с не самым профессиональным применением возможностей библиотеки NumPy. Но как бы то ни было, вывод напрашивается следующий. С одной стороны, иногда стоит подвергать сомнению устоявшиеся мнения, а с другой — не всегда стоит все усложнять — наоборот иногда эффективнее оказывается более простой способ решения задачи. А так как цель у нас была разобрать три подхода в решении уравнения простой линейной регрессии, то использование «самописных» функций нам вполне хватило.

Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии Предыдущая работа автора — «Исследуем утверждение центральной предельной теоремы с помощью экспоненциального распределения»
Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Смотреть картинку Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Картинка про Методом наименьших квадратов оцените параметры уравнения линейной регрессии. Фото Методом наименьших квадратов оцените параметры уравнения линейной регрессии Следующая работа автора — «Приводим уравнение линейной регрессии в матричный вид»

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *