Gama medie - Mid-range

În statistici , gama medie sau extremă medie este o măsură a tendinței centrale a unui eșantion (statistici) definită ca media aritmetică a valorilor maxime și minime ale setului de date :

Intervalul mediu este strâns legat de interval , o măsură a dispersiei statistice definită ca diferența dintre valorile maxime și minime. Cele două măsuri sunt complementare în sensul că, dacă se cunoaște gama medie și gama, se pot găsi valorile maxime și minime ale eșantionului.

Intervalul mediu este rar utilizat în analiza statistică practică, deoarece lipsește eficiența ca estimator pentru majoritatea distribuțiilor de interes, deoarece ignoră toate punctele intermediare și lipsește robustețea , deoarece valorile aberante îl modifică semnificativ. Într-adevăr, este una dintre cele mai puțin eficiente și mai puțin robuste statistici. Cu toate acestea, găsește o anumită utilizare în cazuri speciale: este estimatorul maxim eficient pentru centrul unei distribuții uniforme, robustețea adreselor de nivel mediu tăiat și, ca estimator L , este ușor de înțeles și calculat.

Robusteţe

Intervalul mediu este extrem de sensibil la valori aberante și ignoră toate punctele de date, cu excepția a două. Prin urmare, este o statistică foarte non- robustă , având un punct de defalcare 0, ceea ce înseamnă că o singură observație o poate schimba în mod arbitrar. Mai mult, este puternic influențat de valori aberante: creșterea maximului eșantionului sau scăderea minimului eșantionului cu x modifică intervalul mediu cu în timp ce modifică media eșantionului, care are, de asemenea, punctul de defalcare de 0, doar cu statistici practice, cu excepția cazului în care sunt deja tratate valorile aberante

O gamă medie tăiată este cunoscută sub numele de midsummary -n% midrange tuns este median% și (100−n)% percentile și este mai robust, având unpunct de defalcareden%. În mijlocul acestora se aflămidhinge, care este suma medie de 25%. Medianapoate fi interpretat ca fiind complet bordurate (50%)mijlocul lunii gama; acest lucru este în acord cu convenția că mediana unui număr par de puncte este media celor două puncte de mijloc.

Aceste intervale medii decupate sunt de asemenea de interes ca statistici descriptive sau ca L-estimatori ai localizării centrale sau a asimetriei : diferențele medii, cum ar fi midhinge minus mediana, dau măsuri de asimetrie în diferite puncte din coadă.

Eficienţă

În ciuda dezavantajelor sale, în unele cazuri este util: gama medie este un estimator extrem de eficient al μ, având în vedere un eșantion mic de o distribuție suficient de platykurtică , dar este ineficient pentru distribuțiile mezokurtice , cum ar fi cea normală.

De exemplu, pentru o distribuție uniformă continuă cu maxim și minim necunoscut, intervalul mediu este estimatorul UMVU pentru medie. Probă maximă și minimă a eșantionului, împreună cu mărimea eșantionului, sunt o statistică suficientă pentru maximul populației și minimul - distribuirea altor probe, condiționată de un anumit maxim și minim, este doar distribuția uniformă între maxim și minim și , astfel , adăugați fara informatii. A se vedea problema tancurilor germane pentru discuții suplimentare. Astfel, gama medie, care este un estimator imparțial și suficient al mediei populației, este de fapt UMVU: utilizarea eșantionului mediu adaugă doar zgomot pe baza distribuției neinformative a punctelor din acest interval.

În schimb, pentru distribuția normală, media eșantionului este estimatorul UMVU al mediei. Astfel, pentru distribuțiile platykurtice, care deseori pot fi considerate între o distribuție uniformă și o distribuție normală, informativitatea punctelor de eșantionare medii față de valorile extrema variază de la „egal” pentru normal la „neinformativ” pentru uniform, și pentru distribuții diferite , una sau alta (sau o combinație a acestora) poate fi cea mai eficientă. Un analog robust este trimeanul , care mediază midhing-ul (25% mid-range tăiat) și mediana.

Eșantioane mici

Pentru eșantioane mici ( n de la 4 la 20) extrase dintr-o distribuție suficient de platyurtică ( exces de kurtoză negativă , definit ca γ 2 = (μ 4 / (μ 2 ) ²) - 3), intervalul mediu este un estimator eficient al media μ . Tabelul următor rezumă datele empirice comparând trei estimatori ai mediei pentru distribuția kurtozei variate; media modificată este trunchiat medie , în cazul în care sunt eliminate maxim și minim.

Curtoza în exces (γ 2 ) Cel mai eficient estimator al μ
−1,2 până la −0,8 Midrange
−0,8 până la 2,0 Rău
2,0 la 6,0 Medie modificată

Pentru n = 1 sau 2, gama medie și media sunt egale (și coincid cu mediana) și sunt cele mai eficiente pentru toate distribuțiile. Pentru n = 3, media modificată este mediana și, în schimb, media este cea mai eficientă măsură a tendinței centrale pentru valorile γ 2 de la 2,0 la 6,0, precum și de la -0,8 la 2,0.

Proprietăți de eșantionare

Pentru un eșantion de mărime n din distribuția normală standard , gama medie M este imparțială și are o varianță dată de:

Pentru un eșantion de mărime n din distribuția Laplace standard , gama medie M este imparțială și are o varianță dată de:

și, în special, varianța nu scade la zero pe măsură ce mărimea eșantionului crește.

Pentru un eșantion de mărime n dintr- o distribuție uniformă centrată pe zero , gama medie M este imparțială, nM are o distribuție asimptotică care este o distribuție Laplace .

Deviere

În timp ce media unui set de valori minimizează suma pătratelor abaterilor și mediana minimizează abaterea absolută medie , gama medie minimizează abaterea maximă (definită ca ): este o soluție la o problemă variațională.

Vezi si

Referințe