Средняя абсолютная ошибка — mean absolute error

Содержание:

В процентная ошибка это проявление относительной погрешности в процентном отношении. Другими словами, это числовая ошибка, выраженная значением, которое дает относительную ошибку, впоследствии умноженную на 100.

Чтобы понять, что такое процентная ошибка, в первую очередь необходимо понять, что такое числовая ошибка, абсолютная ошибка и относительная ошибка, поскольку процентная ошибка выводится из этих двух членов.

Числовая ошибка — это ошибка, которая появляется, когда измерение проводится двусмысленным образом при использовании устройства (прямое измерение) или когда математическая формула применяется неправильно (косвенное измерение).

Все числовые ошибки могут быть выражены в абсолютном или процентном выражении. Со своей стороны, абсолютная ошибка — это ошибка, которая получается при приближении к математической величине, полученной в результате измерения элемента или ошибочного применения формулы.

Таким образом, точное математическое значение изменяется приближением. Расчет абсолютной ошибки выполняется путем вычитания приближения из точного математического значения, например:

Абсолютная ошибка = точный результат — приближение.

Единицы измерения, используемые для выражения относительной ошибки, те же, что и для числовой ошибки. Точно так же эта ошибка может давать положительное или отрицательное значение.

Относительная ошибка — это частное, полученное путем деления абсолютной ошибки на точное математическое значение.

Таким образом, процентная ошибка — это ошибка, полученная путем умножения результата относительной ошибки на 100. Другими словами, процентная ошибка — это выражение в процентах (%) относительной ошибки.

Относительная ошибка = (Абсолютная ошибка / точный результат)

Процентное значение, которое может быть отрицательным или положительным, т. Е. Может быть чрезмерно или заниженным. Это значение, в отличие от абсолютной ошибки, не представляет единиц, кроме процента (%).

Относительная ошибка = (абсолютная ошибка / точный результат) x 100%

Задача относительных и процентных ошибок — указать качество чего-либо или предоставить сравнительную ценность.

Понятие о неравноточных измерениях

_______Неравноточными измерениями называются такие, которые выполнены различным
числом приемов, приборами различной точности и т.д.
Если измерения неодинаковой точности, то для определения общей арифметической
середины пользуются формулой:

где p1, p2, p3, ……..pn — соответствующие веса неравноточных измерений l1, l2, l3,……. l n

________Весом называется число, которое выражает степень доверия к результату измерения. В тех случаях, когда неизвестны веса измеренных величин, а известны их средние
квадратические ошибки, то веса можно вычислить по формуле:

_______При неравноточных измерениях средняя квадратическая ошибка измерения, вес
которого равен единице, определяется по формуле:

где δ – разность между отдельными результатами измерений и общей арифметической
серединой.

Альтернативные определения

Проблемы могут возникнуть при вычислении значения MAPE с рядом малых знаменателей. Может возникнуть проблема сингулярности в форме «единица, деленная на ноль» и / или создание очень больших изменений абсолютной процентной ошибки, вызванных небольшим отклонением в ошибке.

В качестве альтернативы каждое фактическое значение ( A t ) ряда в исходной формуле может быть заменено средним значением всех фактических значений ( Ā t ) этого ряда. Эта альтернатива все еще используется для измерения эффективности моделей, прогнозирующих спотовые цены на электроэнергию.

Обратите внимание, что это эквивалентно делению суммы абсолютных разностей на сумму фактических значений и иногда называется WAPE (взвешенная абсолютная процентная ошибка) или wMAPE (взвешенная средняя абсолютная процентная ошибка) .

Что такое случайная погрешность

Случайная погрешность бывает статической и динамической. Динамическая погрешность возникает, когда мы имеем дело с меняющимися значениями — например, количество человек в выборке при маркетинговом исследовании. Статическая погрешность описывает ошибки при вычислении неизменных величин — вроде количества вопросов в вопроснике. Все они относятся к случайным погрешностям.

Типичный пример возникновения случайной погрешности — настроение участников маркетингового опроса. Как известно, эмоциональный настрой человека всегда влияет на его производительность. В ходе тестирования одни люди могут быть в хорошем расположении духа, а другие — в «миноре». Если настроение влияет на их ответы по заданному критерию выборки, это может искусственно завышать или занижать наблюдаемые оценки. Например, в случае с истинным значением 1 случайная погрешность может дать как -0,8, так и +0,5 к этому числу. Очень часто это случается при оценке времени ответа, например.

Случайная погрешность добавляет изменчивости данным, но не оказывает постоянного влияния на всю выборку. Вместо этого она произвольно изменяет измеряемые значения в диапазоне. В маркетинговой практике считается, что все случайные погрешности в распределении перекрывают друг друга и практически не влияют на конечный результат. Поэтому случайная погрешность считается «шумом» и в расчет не принимается. Эту погрешность нельзя устранить совсем, но можно уменьшить, просто увеличив размер выборки.

Проблемы

Хотя концепция MAPE звучит очень просто и убедительно, у нее есть серьезные недостатки в практическом применении, и существует множество исследований недостатков и вводящих в заблуждение результатов MAPE.

  • Его нельзя использовать, если есть нулевые значения (что иногда случается, например, в данных спроса), потому что будет деление на ноль.
  • Для слишком низких прогнозов процентная ошибка не может превышать 100%, но для слишком высоких прогнозов нет верхнего предела процентной ошибки.
  • MAPE налагает более серьезные штрафы на отрицательные ошибки, чем на положительные. Как следствие, когда MAPE используется для сравнения точности методов прогнозирования, он систематически выбирает метод, прогнозы которого слишком занижены. Эта малоизвестная, но серьезная проблема может быть преодолена с помощью меры точности, основанной на логарифме отношения точности (отношения прогнозируемого к фактическому значению), определяемого выражением . Этот подход приводит к превосходным статистическим свойствам и прогнозам, которые можно интерпретировать с точки зрения среднего геометрического.Ат<Fт{\ displaystyle A_ {t} <F_ {t}}бревно⁡(предсказанныйдействительный){\ displaystyle \ log \ left ({\ frac {\ text {predicted}} {\ text {actual}}} \ right)}
  • Люди часто думают, что MAPE будет оптимизирован по медиане. Но, например, нормальный журнал имеет медианное значение, в котором он оптимизирован для MAPE .еμ{\ displaystyle e ^ {\ mu}}еμ-σ2{\ Displaystyle е ^ {\ му — \ sigma ^ {2}}}

Чтобы преодолеть эти проблемы с MAPE, в литературе предлагаются некоторые другие меры:

  • Средняя абсолютная масштабированная ошибка (MASE)
  • Симметричная средняя абсолютная ошибка в процентах (sMAPE)
  • Средняя направленная точность (MDA)
  • Средняя арктангенсная абсолютная процентная ошибка (MAAPE): MAAPE — это новый показатель абсолютной процентной ошибки, который был разработан с учетом взгляда на MAPE под другим углом. По сути, MAAPE — это наклон как угол , а MAPE — это наклон как отношение .

Абсолютная и относительная погрешность

Абсолютной погрешностью или, короче, погрешностью приближенного
числа называется разность между этим числом и его точным значением (из большего числа вычитается меньшее)*.

Пример 1. На предприятии 1284 рабочих и служащих. При
округлении этого числа до 1300 абсолютная погрешность
составляет 1300 — 1284 = 16. При округлении до 1280 абсолютная погрешность составляет 1284 — 1280 = 4.

Относительной погрешностью приближенного числа называется отношение
абсолютной погрешности приближенного числа к самому этому числу.

Пример 2. В школе 197 учащихся. Округляем это число до 200. Абсолютная
погрешность составляет 200 — 197 = 3. Относительная погрешность равна 3/197 или, округленно, 3/197 = 1,5 %.

В большинстве случаев невозможно узнать точное значение приближенного числа, а значит, и точную величину погрешности.
Однако почти всегда можно установить, что погрешность (абсолютная или относительная) не превосходит некоторого числа.

Пример 3. Продавец взвешивает арбуз на чашечных весах. В наборе гирь наименьшая — 50 г. Взвешивание дало 3600 г. Это число – приближенное. Точный вес арбуза
неизвестен. Но абсолютная погрешность не
превышает 50 г. Относительная погрешность не превосходит 50/3600 ≈ 1,4%.

Число, заведомо превышающее абсолютную погрешность (или в худшем случае равное ей), называется предельной абсолютной погрешностью. Число, заведомо превышающее
относительную погрешность (или в худшем случае равное ей), называется предельной относительной погрешностью.

В примере 3 за предельную абсолютную погрешность можно взять 50 г, а за предельную относительную погрешность — 1,4 %.

Величина предельной погрешности не является вполне определенной. Так, в примере 3 можно принять за предельную абсолютную
погрешность 100 г, 150 г и вообще всякое число, большее чем 50 г. На практике берется по возможности меньшее значение
предельной погрешности. В тех случаях, когда известна точная величина погрешности, эта величина служит одновременно
предельной погрешностью. Для каждого приближенного числа должна быть известна его предельная погрешность
(абсолютная или oотносительная). Когда она прямо не указана, подразумевается что предельная абсолютная погрешность
составляет половину единицы последнего выписанного разряда. Так, если приведено приближенное число 4,78 без указания
предельной погрешности, то подразумевается, что предельная абсолютная погрешность составляет 0,005. Вследствие этого
соглашения всегда можно обойтись без указания предельной погрешности числа.

Предельная абсолютная погрешность обозначается греческой буквой Δ («дельта»); предельная относительная
погрешность — греческой буквой δ («дельта малая»). Если приближенное число обозначить буквой а, то

δ = Δ/a.

Пример 4. Длина карандаша измерена линейкой с миллиметровыми делениями. Измерение показало 17,9 см. Какова предельная
относительная погрешность этого измерения?
Здесь а = 17,9 см; можно принять Δ = 0,1 см, так как с точностью до 1 мм измерить карандаш нетрудно, a значительно уменьшить, предельную погрешность ни удастся (при навыке можно прочесть на хорошей линейке и 0,02 и даже 0,01 см, но у самого карандаша ребра могут разниться на бoльшую величину). Относительная погрешность равна 0,1/17,9.
Округляя, находим δ = 0,1/18 ≈ 0,6%.

Пример 5. Цилиндрический поршень имеет около 35 мм в диаметре. С какой точностью нужно его измерить микрометром, чтобы
предельная относительная погрешность составляла 0,05%?Решение. По условию, предельная абсолютная погрешность должна составлять 0,05% от 35 мм. Следовательно, предельная
абсолютная погрешность равна 36*(0,05/100) = 0,0175 (мм) или, усиливая, 0,02 (мм). Можно воспользоваться
формулой δ = Δ/a.
Подставляя в неё а = 35, δ = 0,0005, имеем 0,0005 = Δ/35. Значит, Δ = 35 • 0,0005 = 0,0175 (мм).

* Иначе говоря, если a есть приближенное число, а х – его точное значение, то абсолютная погрешность есть абсолютное
значение разности a – х. В некоторых руководствах абсолютной погрешностью называется сама
разность a – х (или разность х — a). Эта величина может быть положительной или отрицательной.

Ссылки

  1. Веселье, М. и. (2014). Математика — это весело. Получено из процентной ошибки: mathsisfun.com
  2. Хельменстин, А. М. (8 февраля 2017 г.). ThoughtCo. Получено из раздела «Как рассчитать процент ошибки»: thinkco.com
  3. Уртадо, А. Н., и Санчес, Ф. К. (н.э.). Технологический институт Тустла Гутьеррес. Получено из 1.2. Типы ошибок: абсолютная ошибка, относительная ошибка, процентная ошибка, ошибки округления и усечения.: Sites.google.com
  4. Айова, штат Юта. (2017). Визуализация Вселенной. Получено по формуле процента ошибок: astro.physics.uiowa.edu
  5. Леферс, М. (26 июля 2004 г.). Процент ошибки. Получено из определения: groups.molbiosci.northwestern.edu.

Связанные меры

Средняя абсолютная ошибка — это один из способов сравнения прогнозов с их окончательными результатами. Хорошо известными альтернативами являются средняя абсолютная масштабированная ошибка (MASE) и среднеквадратичная ошибка . Все они суммируют производительность таким образом, чтобы игнорировать направление завышенного или заниженного прогноза; мерой, которая делает акцент на этом, является средняя знаковая разница .

Если модель прогнозирования должна быть адаптирована с использованием выбранной меры эффективности, в том смысле, что метод наименьших квадратов связан со среднеквадратичной ошибкой , эквивалентом средней абсолютной ошибки является наименьшее абсолютное отклонение .

MAE не идентично среднеквадратичной ошибке (RMSE), хотя некоторые исследователи сообщают и интерпретируют это таким образом. MAE концептуально проще и легче интерпретируется, чем RMSE: это просто среднее абсолютное расстояние по вертикали или горизонтали между каждой точкой на диаграмме рассеяния и линией Y = X. Другими словами, MAE — это средняя абсолютная разница между X и Y. Кроме того, каждая ошибка вносит вклад в MAE пропорционально абсолютному значению ошибки. Это отличается от RMSE, который включает возведение разностей в квадрат, так что несколько больших разностей увеличивают RMSE в большей степени, чем MAE. См. Пример выше для иллюстрации этих различий.

Свойство оптимальности

Средняя абсолютная ошибка реального переменных с относительно случайной величины   X является

E ( | Икс — c | ) {\ Displaystyle Е (\ влево | Xc \ вправо |) \,}

При условии , что распределение вероятностей X таково , что приведенное выше математическое ожидание существует, то т является медианным из X тогда и только тогда , когда т является минимизантом средней абсолютной погрешности по отношению к X . В частности, m является выборкой медианы тогда и только тогда, когда m минимизирует среднее арифметическое абсолютных отклонений.

В более общем плане медиана определяется как минимум

E ( | Икс — c | — | Икс | ) , {\ Displaystyle E (| Xc | — | X |),}

как описано в разделе «Многомерная медиана» (и, в частности, в разделе «Пространственная медиана» ).

Это основанное на оптимизации определение медианы полезно при статистическом анализе данных, например, при кластеризации k- средних .

Доказательство оптимальности

Утверждение: Минимизирующий классификатор есть .
E | у — у ^ | {\ displaystyle \ mathbb {E} | y — {\ hat {y}} |} ж ^ ( Икс ) знак равно Медиана ( у | Икс знак равно Икс ) {\ displaystyle {\ hat {f}} (x) = {\ text {Median}} (y ​​| X = x)}

Доказательство:

Функции потерь для классификации :

L знак равно E | у — а | | Икс знак равно Икс знак равно ∫ — ∞ ∞ | у — а | ж Y | Икс ( у ) d у знак равно ∫ — ∞ а ( а — у ) ж Y | Икс ( у ) d у + ∫ а ∞ ( у — а ) ж Y | Икс ( у ) d у {\ Displaystyle {\ begin {align} L & = \ mathbb {E} \\ & = \ int _ {- \ infty} ^ {\ infty} | ya | f_ {Y | X } (y) \, dy \\ & = \ int _ {- \ infty} ^ {a} (ay) f_ {Y | X} (y) \, dy + \ int _ {a} ^ {\ infty} ( ya) f_ {Y | X} (y) \, dy \\\ конец {выровнено}}}

Дифференцируя WRT дает

∂ ∂ а L знак равно ∫ — ∞ а ж Y | Икс ( у ) d у + ∫ а ∞ — ж Y | Икс ( у ) d у знак равно {\ displaystyle {\ frac {\ partial} {\ partial a}} L = \ int _ {- \ infty} ^ {a} f_ {Y | X} (y) \, dy + \ int _ {a} ^ { \ infty} -f_ {Y | X} (y) \, dy = 0}

Это означает

∫ — ∞ а ж ( у ) d у знак равно ∫ а ∞ ж ( у ) d у {\ displaystyle \ int _ {- \ infty} ^ {a} f (y) \, dy = \ int _ {a} ^ {\ infty} f (y) \, dy}

Следовательно

F Y | Икс ( а ) знак равно 0,5 {\ Displaystyle F_ {Y | X} (а) = 0,5}

Что такое погрешность измерения

Любой расчет состоит из истинного и вычисляемого значения. При этом всегда должны учитываться значения ошибки или погрешности. Погрешность — это расхождение между истинным значением и вычисляемым. В маркетинге выделяют следующие виды погрешностей.

  1. Математическая погрешность. Она описывается алгебраической формулой и бывает абсолютной, относительной и приведенной. Абсолютная погрешность измерения — это разница между вычисляемым и истинным значением. Относительная погрешность вычисляется в процентном соотношении истинного значения и полученного. Вычисление погрешности приведенной схоже с относительной, указывается она также в процентах, но дает разницу между нормирующей шкалой и полученными данными, то есть между эталонными и полученными значениями.
  2. Оценочная погрешность. В маркетинге она бывает случайной и систематической. Случайная погрешность возникает из-за любых факторов, которые случайным образом влияют на измерение переменной в выборке. Систематическая погрешность вызывается факторами, которые систематически влияют на измерение переменной в выборке.

Средняя квадратическая ошибка

_______Точность результатов измерений оценивается средней квадратической ошибкой. Средняя квадратическая ошибка одного измерения вычисляется по формуле:

где – сумма квадратов вероятнейших ошибок; n – число измерений. Средняя квадратическая ошибка арифметической середины вычисляется по формуле:

_______Предельная ошибка не должна превышать утроенной средней квадратической ошибки, т.е. ε = 3 x m.

_______Иногда о точности измерений судят не по абсолютной величине средней квадратической или предельной погрешности, а по величине относительной ошибки.
___

_______Относительной ошибкой называется отношение абсолютной ошибки к значению самой измеренной величины. Относительную ошибку выражают в виде простой дроби, числитель которой — единица, а знаменатель — число, округленное до двух-трех значащих цифр с нулями. Например, относительная средняя квадратическая погрешность
измерения линии длиной:

_______l = 110 м, при m = 2 см, равна m/l = 1/5500.

_______Пример:

_______Линия измерена шесть раз. Определить ее вероятнейшую длину и оценить точность этого результата. Вычисления приведены в таблице:

Таб. 1

_______По формулам вычислены абсолютные средние квадратические ошибки, а оценивать
точность измерения длины линии необходимо по относительной ошибке. Поэтому нужно абсолютную ошибку разделить на длину линии. Для нашего примера относительная
ошибка вероятнейшего значения измеренной линии равна

Несогласие по количеству и разногласию по распределению


2 точки данных, для которых несовпадение количества равно 0, а несоответствие распределения равно 2 как для MAE, так и для RMSE

MAE можно выразить как сумму двух компонентов: несогласия количества и несогласия распределения. Количественное несоответствие — это абсолютное значение средней ошибки, определяемое по формуле:

M E знак равно ∑ я знак равно 1 п у я — Икс я п . {\ displaystyle \ mathrm {ME} = {\ frac {\ sum _ {i = 1} ^ {n} y_ {i} -x_ {i}} {n}}.}

Несогласие в распределении — это MAE минус несогласие по количеству.

Также возможно определить типы различий, посмотрев на график. Количественная разница существует, когда среднее значение X не равно среднему значению Y. Разница в размещении существует тогда и только тогда, когда точки находятся по обе стороны от линии идентичности.
( Икс , у ) {\ Displaystyle (х, у)}

Оценка точности измерений

_______Точность результатов многократных измерений одной и той же величины оценивают
в такой последовательности:

_______1. Находят вероятнейшее (наиболее точное для данных условий) значение
измеренной величины по формуле арифметической середины х = [l]/n._______2. Вычисляют отклонения для каждого значения измеренной величины от
значения арифметической средины. Контроль вычислений: = 0;_______3. По формуле вычисляют среднюю квадратическую ошибку одного измерения._______4. По формуле вычисляют среднюю квадратическую ошибку арифметической
средины._______5. Если измеряют линейную величину, то подсчитывают относительную
среднюю квадратическую ошибку каждого измерения и арифметической
средины.

_______6. При необходимости подсчитывают предельную ошибку одного измерения,
которая может служить допустимым значением погрешностей аналогичных
измерений.

Математическая погрешность: формула для каждого типа

Если определение погрешности можно провести точным путем, она считается математической. Зачем нужно вычисление этого значения в маркетинге?

Погрешности возникают настолько часто, что популярной практикой в исследованиях является включение значения погрешности в окончательные результаты. Для этого используются формулы. Математическая погрешность — это значение, которое отражает разницу между выборкой и фактическим результатом. Если при расчетах учитывалась  погрешность, в тексте исследования указывается что-то вроде: «Абсолютная погрешность для этих данных составляет 3,25%». Погрешность можно вычислить с любыми цифрами: количество человек, участвующих в опросе, погрешность суммы, затраченной на маркетинговый бюджет, и так далее.

Формулы погрешностей вычисляются следующим образом.

Формула дает разницу между измеренным и реальным значением.

Формула абсолютной погрешности

Относительная погрешность: формула

Формула использует значение абсолютной погрешности и вычисляется в процентах по отношению к фактическому  значению.

Формула относительной погрешности

Приведенная погрешность: формула

Формула также использует значение абсолютной погрешности. В чем измеряется приведенная погрешность? Тоже в процентах, но в качестве «эталона» используется не реальное значение, а единица измерения любой нормирующей шкалы. Например, для обычной линейки это значение равно 1 мм.

Формула приведенной погрешности

Классификация ошибок измерений

_______Измерения в геодезии рассматриваются с двух точек зрения: количественной, выражающей числовое значение измеренной величины, и качественной, характеризующей
ее точность. Из практики известно, что даже при самой тщательной и аккуратной работе многократные (повторные) измерения не дают одинаковых результатов. Это указывает на
то, что получаемые результаты не являются точным значением измеряемой величины, а несколько отклоняются от него. Значение отклонения характеризует точность измерений.

_______При геодезических измерениях неизбежны ошибки. Эти ошибки бывают грубые,
систематические и случайные.

_______ К грубым ошибкам относятся просчеты в измерениях по причине невнимательности
наблюдателя или неисправности прибора, и они полностью должны быть исключены. Это
достигается путем повторного измерения.

_______Систематические ошибки происходят от известного источника, имеют
определенный знак и величину и их можно учесть при измерениях и вычислениях.

_______Случайные ошибки обусловлены разными причинами и полностью исключить их из
измерений нельзя. Поэтому возникают две задачи: как из результатов измерений получить
наиболее точную величину и как оценить точность полученных результатов измерений.
Эти задачи решаются с помощью теории ошибок измерений
_______

_______В основу теории ошибок положены следующие свойства случайных ошибок:_______1. Малые ошибки встречаются чаще, а большие реже._______2. Ошибки не превышают известного предела._______3. Положительные и отрицательные ошибки, одинаковые по абсолютной величине,
одинаково часто встречаются._______4. Сумма ошибок, деленная на число измерений, стремится к нулю при большом числе
измерений.

_______По источнику происхождения различают ошибки приборов, внешние и личные.
Ошибки приборов обусловлены их несовершенством, например погрешность угла,
измеренного теодолитом, неточным приведением в вертикальное положение оси его
вращения.

_______Внешние ошибки происходят из-за влияния внешней среды, в которой протекают
измерения, например погрешность в отсчете по нивелирной рейке из-за изменения
температуры воздуха на пути светового луча (рефракция) или нагрева нивелира
солнечными лучами.

_______Личные ошибки связаны с особенностями наблюдателя, например, разные наблюдатели
по-разному наводят зрительную трубу на визирную цель. Так как грубые погрешности
должны быть исключены из результатов измерений, а систематические исключены
или ослаблены до минимально допустимого предела, то проектирование измерений с
необходимой точностью и оценку результатов выполненных измерений производят,
основываясь на свойствах случайных погрешностей.

MAPE в задачах регрессии

Средняя абсолютная процентная ошибка обычно используется в качестве функции потерь для задач регрессии и при оценке модели из-за ее очень интуитивной интерпретации с точки зрения относительной ошибки.

Определение

Рассмотрим стандартную настройку регрессии , в которой данные полностью описывается случайной пары со значениями в и п IID копии из . Регрессионные модели направлены на нахождение хорошей модели для пары, которая является измеримой функцией г от до такого , что близко к Y .
Zзнак равно(Икс,Y){\ Displaystyle Z = (X, Y)}рd×р{\ Displaystyle \ mathbb {R} ^ {d} \ times \ mathbb {R}}(Икс1,Y1),…,(Иксп,Yп){\ displaystyle (X_ {1}, Y_ {1}), …, (X_ {n}, Y_ {n})}(Икс,Y){\ displaystyle (X, Y)} рd{\ Displaystyle \ mathbb {R} ^ {d}}р{\ Displaystyle \ mathbb {R}}грамм(Икс){\ displaystyle g (X)}

В настройке классической регрессии близость к Y измеряется с помощью риска L 2 , также называемого среднеквадратической ошибкой (MSE). В контексте регрессии MAPE близость к Y измеряется с помощью MAPE, и цель регрессии MAPE состоит в том, чтобы найти такую ​​модель , которая:
грамм(Икс){\ displaystyle g (X)}грамм(Икс){\ displaystyle g (X)}граммКАРТА{\ displaystyle g _ {\ text {MAPE}}}

граммКАРТА(Икс)знак равноаргумент⁡минграмм∈граммE|грамм(Икс)-YY||Иксзнак равноИкс{\ displaystyle g _ {\ text {MAPE}} (x) = \ arg \ min _ {g \ in {\ mathcal {G}}} \ mathbb {E} \ left }

где — класс рассматриваемых моделей (например, линейные модели).
грамм{\ Displaystyle {\ mathcal {G}}}

На практике

На практике можно оценить с помощью стратегии минимизации эмпирического риска , приводящей к
граммКАРТА(Икс){\ displaystyle g _ {\ text {MAPE}} (х)}

грамм^КАРТА(Икс)знак равноаргумент⁡минграмм∈грамм∑язнак равно1п|грамм(Икся)-YяYя|{\ displaystyle {\ widehat {g}} _ {\ text {MAPE}} (x) = \ arg \ min _ {g \ in {\ mathcal {G}}} \ sum _ {i = 1} ^ {n } \ left | {\ frac {g (X_ {i}) — Y_ {i}} {Y_ {i}}} \ right |}

С практической точки зрения использование MAPE в качестве функции качества для регрессионной модели эквивалентно выполнению регрессии взвешенной средней абсолютной ошибки (MAE), также известной как квантильная регрессия . Это свойство тривиально, поскольку

грамм^КАРТА(Икс)знак равноаргумент⁡минграмм∈грамм∑язнак равно1пω(Yя)|грамм(Икся)-Yя| с участием ω(Yя)знак равно|1Yя|{\ displaystyle {\ widehat {g}} _ {\ text {MAPE}} (x) = \ arg \ min _ {g \ in {\ mathcal {G}}} \ sum _ {i = 1} ^ {n } \ omega (Y_ {i}) \ left | g (X_ {i}) — Y_ {i} \ right | {\ mbox {with}} \ omega (Y_ {i}) = \ left | {\ frac { 1} {Y_ {i}}} \ right |}

Как следствие, использование MAPE очень просто на практике, например, с использованием существующих библиотек для квантильной регрессии, позволяющей использовать веса.

Последовательность

Использование MAPE в качестве функции потерь для регрессионного анализа возможно как с практической, так и с теоретической точки зрения, поскольку можно доказать существование оптимальной модели и согласованность минимизации эмпирического риска.

Рейтинг
( Пока оценок нет )
Понравилась статья? Поделиться с друзьями:
Мастер по всему
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: