Eroare absolută medie - Mean absolute error

În statistici , eroarea absolută medie ( MAE ) este o măsură a erorilor dintre observațiile asociate care exprimă același fenomen. Exemplele de Y față de X includ comparații dintre predicție față de observat, timp ulterior față de timpul inițial și o tehnică de măsurare versus o tehnică alternativă de măsurare. MAE se calculează ca:

Este astfel o medie aritmetică a erorilor absolute , unde este predicția și valoarea reală. Rețineți că formulările alternative pot include frecvențe relative ca factori de greutate. Eroarea absolută medie utilizează aceeași scară cu datele măsurate. Aceasta este cunoscută ca o măsură de precizie dependentă de scală și, prin urmare, nu poate fi utilizată pentru a face comparații între serii folosind scale diferite. Eroarea absolută medie este o măsură obișnuită a erorii de prognoză în analiza seriilor temporale , uneori utilizată în confuzie cu definiția mai standard a deviației absolute medii . Aceeași confuzie există mai general.

Dezacord de cantitate și dezacord de alocare

2 puncte de date pentru care dezacordul cantitar este 0 și dezacordul de alocare este 2 atât pentru MAE, cât și pentru RMSE

Este posibil să se exprime MAE ca suma a două componente: Dezacord cantitar și Dezacord alocare. Dezacordul de cantitate este valoarea absolută a erorii medii dată de:

Dezacordul de alocare este MAE minus Dezacordul de cantitate.

Este, de asemenea, posibil să se identifice tipurile de diferență, uitându-se la un complot. Diferența de cantitate există atunci când media valorilor X nu este egală cu media valorilor Y. Diferența de alocare există dacă și numai dacă punctele se află pe ambele părți ale liniei de identitate.

Măsuri conexe

Eroarea absolută medie este una dintre numeroasele modalități de a compara previziunile cu eventualele lor rezultate. Alternative bine stabilite sunt eroarea medie scalată absolută (MASE) și media erorii pătrate . Toate acestea rezumă performanța în moduri care ignoră direcția de supra- sau sub-predicție; o măsură care pune accentul pe aceasta este diferența medie semnată .

În cazul în care un model de predicție trebuie să fie montat folosind o măsură de performanță selectată, în sensul că abordarea celor mai mici pătrate este legată de eroarea pătrată medie , echivalentul pentru eroarea absolută medie este abaterile minime absolute .

MAE nu este identic cu eroarea pătrată medie-rădăcină (RMSE), deși unii cercetători o raportează și o interpretează astfel. MAE este mai simplu din punct de vedere conceptual și, de asemenea, mai ușor de interpretat decât RMSE: este pur și simplu distanța absolută medie verticală sau orizontală dintre fiecare punct dintr-un grafic scatter și linia Y = X. Cu alte cuvinte, MAE este diferența absolută medie între X și Y. Mai mult, fiecare eroare contribuie la MAE proporțional cu valoarea absolută a erorii. Acest lucru este în contrast cu RMSE care implică echilibrarea diferențelor, astfel încât câteva diferențe mari vor crește RMSE într-un grad mai mare decât MAE. Vedeți exemplul de mai sus pentru o ilustrare a acestor diferențe.

Proprietatea de optimitate

Eroarea absolută medie a unei variabile reale c în raport cu variabila aleatoare   X este

Cu condiția ca distribuția probabilității X este astfel încât există speranța de mai sus, atunci m este o medie de X dacă și numai dacă m este o Minimizer a erorii medii absolute în ceea ce privește X . În special, m este o mostră mediană dacă și numai dacă m minimizează media aritmetică a abaterilor absolute.

Mai general, o mediană este definită ca minim de

așa cum sa discutat la mediana multivariată (și în mod specific la mediana spațială ).

Această definiție bazată pe optimizare a medianei este utilă în analiza datelor statistice, de exemplu, în gruparea k- mediane .

Dovadă a optimității

Enunț: Clasificatorul care minimizează este .

Dovadă:

Funcțiile de pierdere pentru clasificare sunt

Diferențierea wrt a

Asta înseamnă

Prin urmare

Vezi si

Referințe