Median - Median

Găsirea medianei în seturi de date cu un număr impar și par de valori

În statistici și teoria probabilității , mediana este valoarea care separă jumătatea superioară de jumătatea inferioară a unui eșantion de date , a unei populații sau a unei distribuții de probabilitate . Pentru un set de date , se poate considera că este „valoarea de mijloc”. Caracteristica de bază a medianei în descrierea datelor în comparație cu media (adesea descrisă simplu ca „medie”) este că nu este distorsionată de o mică proporție de valori extrem de mari sau mici și, prin urmare, oferă o reprezentare mai bună a unui „tipic”. "valoare. Venitul mediu , de exemplu, poate fi o modalitate mai bună de a sugera ce înseamnă un venit „tipic”, deoarece distribuția veniturilor poate fi foarte înclinată. Mediana are o importanță centrală în statistici solide , deoarece este cea mai rezistentă statistică , având un punct de defalcare de 50%: atâta timp cât nu mai mult de jumătate din date sunt contaminate, mediana nu este un rezultat arbitrar mare sau mic.

Set de date finite de numere

Mediana unei liste finite de numere este numărul „mijlociu”, atunci când acele numere sunt listate în ordine de la cel mai mic la cel mai mare.

Dacă setul de date are un număr impar de observații, este selectat cel din mijloc. De exemplu, următoarea listă de șapte numere,

1, 3, 3, 6 , 7, 8, 9

are mediana de 6 , care este a patra valoare.

În general, pentru un set de elemente, acest lucru poate fi scris ca:

Un set dintr-un număr par de observații nu are o valoare medie distinctă, iar mediana este de obicei definită ca fiind media aritmetică a celor două valori medii. De exemplu, setul de date

1, 2, 3, 4, 5 , 6, 8, 9

are o valoare mediană de 4,5 , adică . (În termeni mai tehnici, aceasta interpretează mediana ca fiind gama medie complet tăiată ). Cu această convenție, mediana poate fi definită după cum urmează (pentru un număr par de observații):

Compararea mediilor comune ale valorilor [1, 2, 2, 3, 4, 7, 9]
Tip Descriere Exemplu Rezultat
Media aritmetică Suma valorilor unui set de date împărțit la numărul de valori: (1 + 2 + 2 + 3 + 4 + 7 + 9) / 7 4
Median Valoare medie care separă jumătățile mai mari și mai mici ale unui set de date 1, 2, 2, 3 , 4, 7, 9 3
Mod Cea mai frecventă valoare într-un set de date 1, 2 , 2 , 3, 4, 7, 9 2

Definiție formală

În mod formal, o mediană a unei populații este orice valoare astfel încât cel mult jumătate din populație este mai mică decât mediana propusă și cel mult jumătate este mai mare decât mediana propusă. După cum s-a văzut mai sus, este posibil ca medianele să nu fie unice. Dacă fiecare set conține mai puțin de jumătate din populație, atunci o parte din populație este exact egală cu mediana unică.

Mediana este bine definită pentru orice date ordonate (unidimensionale) și este independentă de orice metrică la distanță . Mediana poate fi astfel aplicată claselor clasificate, dar nu numerice (de exemplu, elaborarea unei note mediane atunci când elevii sunt notați de la A la F), deși rezultatul ar putea fi la jumătatea distanței dintre clase dacă există un număr par de cazuri.

O mediană geometrică , pe de altă parte, este definită în orice număr de dimensiuni. Un concept asociat, în care rezultatul este obligat să corespundă unui membru al eșantionului, este medoidul .

Nu este acceptată pe scară largă nu notatie standard pentru mediana, dar unii autori reprezintă mediana unei variabile x fie ca x sau μ 1/2 , uneori , de asemenea , M . În oricare dintre aceste cazuri, utilizarea acestor simboluri sau a altor simboluri pentru mediană trebuie definită în mod explicit atunci când sunt introduse.

Mediana este un caz special al altor modalități de a rezuma valorile tipice asociate cu o distribuție statistică : este a 2-a quartilă , a 5-a decilă și a 50 - a percentilă .

Utilizări

Mediana poate fi utilizată ca măsură a localizării atunci când se acordă o importanță redusă valorilor extreme, de obicei, deoarece o distribuție este înclinată , valorile extreme nu sunt cunoscute sau valorile aberante nu sunt de încredere, adică pot fi erori de măsurare / transcriere.

De exemplu, luați în considerare multiset-ul

1, 2, 2, 2, 3, 14.

Mediana este 2 în acest caz, (așa cum este și modul ) și ar putea fi văzută ca o indicație mai bună a centrului decât media aritmetică a 4, care este mai mare decât toate valorile. Cu toate acestea, relația empirică citată pe scară largă conform căreia media este mutată „mai departe în coada” unei distribuții decât mediana nu este în general adevărată. Cel mult, se poate spune că cele două statistici nu pot fi „prea departe”; a se vedea § Mediile și medianele legate de inegalitate de mai jos.

Deoarece o mediană se bazează pe datele de mijloc dintr-un set, nu este necesar să se cunoască valoarea rezultatelor extreme pentru a o calcula. De exemplu, într-un test de psihologie care investighează timpul necesar pentru a rezolva o problemă, dacă un număr mic de persoane nu a reușit să rezolve problema deloc în timpul dat, se poate calcula în continuare o mediană.

Deoarece mediana este ușor de înțeles și ușor de calculat, în timp ce este o aproximare robustă la medie , mediana este o statistică rezumativă populară în statistici descriptive . În acest context, există mai multe opțiuni pentru o măsură a variabilității : intervalul , intervalul intercuartil , deviația absolută medie și deviația absolută mediană .

În scopuri practice, diferite măsuri de localizare și dispersie sunt adesea comparate pe baza cât de bine pot fi estimate valorile populației corespunzătoare dintr-un eșantion de date. Mediana, estimată utilizând mediana eșantionului, are proprietăți bune în acest sens. Deși nu este de obicei optim dacă se presupune o anumită distribuție a populației, proprietățile sale sunt întotdeauna rezonabile de bune. De exemplu, o comparație a eficienței estimatorilor candidați arată că media eșantionului este mai eficientă din punct de vedere statistic atunci când - și numai când - datele sunt necontaminate de datele din distribuțiile cu coadă grea sau din amestecurile de distribuții. Chiar și atunci, mediana are o eficiență de 64% în comparație cu media varianței minime (pentru eșantioane normale mari), ceea ce înseamnă că varianța medianei va fi cu ~ 50% mai mare decât varianța mediei.

Distribuții de probabilitate

Vizualizare geometrică a modului, medianei și mediei unei funcții de densitate de probabilitate arbitrară

Pentru orice distribuție de probabilitate real- evaluată cu funcție de distribuție cumulativă F , o mediană este definită ca orice număr real  m care satisface inegalitățile  

.

O formulare echivalentă folosește o variabilă aleatorie X distribuită conform F :

Rețineți că această definiție nu necesită ca X să aibă o distribuție absolut continuă (care are o funcție de densitate de probabilitate ƒ ) și nici nu necesită una discretă . În primul caz, inegalitățile pot fi îmbunătățite la egalitate: o mediană satisface

.

Orice distribuție de probabilitate pe R are cel puțin o mediană, dar în cazuri patologice poate exista mai mult de o mediană: dacă F este constant 1/2 pe un interval (astfel încât ƒ = 0 acolo), atunci orice valoare a acelui interval este o median.

Medianele anumitor distribuții

Medianele anumitor tipuri de distribuții pot fi ușor calculate din parametrii lor; în plus, există chiar și pentru unele distribuții care nu au o medie bine definită, cum ar fi distribuția Cauchy :

Populații

Proprietatea de optimitate

Eroarea absolută medie a unei variabile reale c în raport cu variabila aleatoare  X este

Cu condiția ca distribuția probabilității X este astfel încât există speranța de mai sus, atunci m este o valoare mediană de X dacă și numai dacă m este o Minimizer a erorii medii absolute în ceea ce privește X . În special, m este o mostră mediană dacă și numai dacă m minimizează media aritmetică a abaterilor absolute.

Mai general, o mediană este definită ca minim de

așa cum este discutat mai jos în secțiunea despre mediane multivariate (în mod specific, mediana spațială ).

Această definiție bazată pe optimizare a medianei este utilă în analiza datelor statistice, de exemplu, în gruparea k- mediane .

Inegalitatea în legătură cu mijloacele și medianele

Compararea mediei , medianei și modului a două distribuții log-normale cu asimetrie diferită

Dacă distribuția are varianță finită, atunci distanța dintre mediană și medie este mărginită de o abatere standard .

Această legătură a fost dovedită de Mallows, care a folosit inegalitatea lui Jensen de două ori, după cum urmează. Utilizarea | · | pentru valoarea absolută , avem

Prima și a treia inegalitate provin din inegalitatea lui Jensen aplicată funcției de valoare absolută și funcției pătrate, care sunt fiecare convexe. A doua inegalitate vine din faptul că o mediană minimizează funcția de deviere absolută .

Dovada neagrelor poate fi generalizată pentru a obține o versiune multivariată a inegalității pur și simplu prin înlocuirea valorii absolute cu o normă :

unde m este o mediană spațială , adică un minimizator al funcției Mediana spațială este unică atunci când dimensiunea setului de date este de două sau mai multe.

O dovadă alternativă utilizează inegalitatea unilaterală a lui Chebyshev; apare într- o inegalitate a parametrilor de localizare și scară . Această formulă rezultă, de asemenea, direct din inegalitatea lui Cantelli .

Distribuții unimodale

În cazul distribuțiilor unimodale , se poate obține o legătură mai clară la distanța dintre mediană și medie:

.

O relație similară se menține între mediană și mod:

Inegalitatea lui Jensen pentru mediane

Inegalitatea lui Jensen afirmă că pentru orice variabilă aleatorie X cu o așteptare finită E [ X ] și pentru orice funcție convexă f

Această inegalitate se generalizează și la mediană. Spunem că o funcție f: ℝ → ℝ este o funcție C dacă, pentru orice t ,

este un interval închis (permițând cazurile degenerate ale unui singur punct sau al unui set gol ). Fiecare funcție C este convexă, dar inversul nu se menține. Dacă f este o funcție C, atunci

Dacă medianele nu sunt unice, declarația este valabilă pentru suprema corespunzătoare.

Mediane pentru probe

Eșantionul median

Calcul eficient al medianei eșantionului

Chiar dacă comparație-sortare n elemente necesită Ω ( n log n ) operații, algoritmi de selecție pot calcula k - lea cel mai mic-a n elemente cu numai Θ ( n ) operațiuni. Aceasta include mediana, care este n/2Statistica de ordinul al treilea (sau pentru un număr par de eșantioane, media aritmetică a celor două statistici de ordin mediu).

Algoritmii de selecție au încă dezavantajul de a necesita memorie Ω ( n ) , adică trebuie să aibă eșantionul complet (sau o porțiune de dimensiune liniară) în memorie. Deoarece acest lucru, precum și cerința de timp liniar, pot fi prohibitive, au fost dezvoltate mai multe proceduri de estimare pentru mediană. Una simplă este mediana celor trei reguli, care estimează mediana ca mediana unui sub-eșantion cu trei elemente; aceasta este folosită în mod obișnuit ca subrutină în algoritmul de sortare rapid , care folosește o estimare a medianei de intrare a acesteia. O mai estimator de robust este Tukey lui ninther , care este mediana a trei reguli aplicate cu recursie limitată: dacă A este proba prevăzută ca o matrice , și

med3 ( A ) = mediană ( A [1], A [n/2], A [ n ]) ,

atunci

ninther ( A ) = med3 (med3 ( A [1 ...1/3n ]), med3 ( A [1/3n ...2/3n ]), med3 ( A [2/3n ... n ]))

Remedian este un estimator pentru mediana , care necesită timp liniar dar de memorie sub liniar, care operează într - o singură trecere peste probă.

Distribuția eșantionării

Distribuțiile atât ale probei medii, cât și ale mediei probei au fost determinate de Laplace . Distribuția medianei eșantionului dintr-o populație cu funcție de densitate este asimptotic normală cu medie și varianță

unde este mediana și este dimensiunea eșantionului. Urmează mai jos o dovadă modernă. Rezultatul lui Laplace este acum înțeles ca un caz special al distribuției asimptotice a cuantilelor arbitrare .

Pentru eșantioanele normale, densitatea este , deci pentru eșantioanele mari, varianța mediană este egală (Vezi și secțiunea # Eficiență de mai jos.)

Derivarea distribuției asimptotice

Luăm mărimea eșantionului ca fiind un număr impar și presupunem variabila noastră continuă; formula pentru cazul variabilelor discrete este dată mai jos în § Densitatea locală empirică . Proba poate fi rezumată ca „ de mai jos median“, „la mediană“, și „peste medie“, care corespunde unei distribuții trinomial cu probabilități , și . Pentru o variabilă continuă, probabilitatea ca mai multe valori ale eșantionului să fie exact egale cu mediana este 0, deci se poate calcula densitatea de la punctul direct din distribuția trinomială:

.

Acum introducem funcția beta. Pentru argumente întregi și , acest lucru poate fi exprimat ca . De asemenea, amintiți-vă că . Utilizarea acestor relații și setarea ambelor și egală cu permite ca ultima expresie să fie scrisă ca

Prin urmare, funcția de densitate a medianei este o distribuție beta simetrică împinsă înainte de . Media sa, așa cum ne-am aștepta, este 0,5 și varianța sa este . Prin regula lanțului , varianța corespunzătoare a medianei eșantionului este

.

2 suplimentare sunt neglijabile în limită .

Densitatea locală empirică

În practică, funcțiile și adesea nu sunt cunoscute sau asumate. Cu toate acestea, ele pot fi estimate dintr-o distribuție de frecvență observată. În această secțiune, oferim un exemplu. Luați în considerare următorul tabel, reprezentând un eșantion de 3.800 de observații (cu valoare discretă):

v 0 0,5 1 1.5 2 2.5 3 3.5 4 4.5 5
f (v) 0,000 0,008 0,010 0,013 0,083 0,108 0,328 0,220 0,202 0,023 0,005
F (v) 0,000 0,008 0,018 0,031 0,114 0,222 0,550 0,770 0,972 0,995 1.000

Deoarece observațiile sunt discrete, construirea distribuției exacte a medianei nu este o traducere imediată a expresiei de mai sus pentru ; se poate (și de obicei are) să aibă mai multe instanțe ale medianei în eșantion. Deci, trebuie să însumăm toate aceste posibilități:

Aici, i este numărul de puncte strict mai mic decât mediana și k numărul strict mai mare.

Folosind aceste preliminarii, este posibil să se investigheze efectul mărimii eșantionului asupra erorilor standard ale mediei și medianei. Media observată este de 3,16, mediana brută observată este de 3, iar media interpolată observată este de 3,174. Tabelul următor oferă câteva statistici de comparație.

Marime de mostra
Statistic
3 9 15 21
Valoarea preconizată a medianei 3.198 3.191 3.174 3.161
Eroare standard a medianei (formula de mai sus) 0,482 0,305 0,257 0,239
Eroare standard a medianei (aproximare asimptotică) 0,879 0,508 0,393 0,332
Eroare standard a mediei 0,421 0,243 0,188 0,159

Valoarea așteptată a medianei scade ușor pe măsură ce mărimea eșantionului crește, în timp ce, așa cum ar fi de așteptat, erorile standard atât ale medianei, cât și ale mediei sunt proporționale cu rădăcina pătrată inversă a dimensiunii eșantionului. Aproximarea asimptotică greșește din partea prudenței prin supraestimarea erorii standard.

Estimarea varianței din datele eșantionului

Valoarea - valoarea asimptotică a unde este mediana populației - a fost studiată de mai mulți autori. Metoda standard „ștergeți un” cuțit produce rezultate inconsistente . O alternativă - metoda „șterge k” - în care crește odată cu mărimea eșantionului s-a dovedit a fi asimptotic consistentă. Această metodă poate fi costisitoare din punct de vedere al calculului pentru seturi de date mari. O estimare bootstrap este cunoscută a fi consecvente, dar converge foarte lent ( ordin al ). Au fost propuse alte metode, dar comportamentul lor poate diferi între eșantioanele mari și cele mici.

Eficienţă

Eficiența medianei eșantionului, măsurată ca raportul dintre varianța mediei la variația mediana, depinde de dimensiunea eșantionului și pe distribuția populației de bază. Pentru un eșantion de mărime din distribuția normală , eficiența pentru N mare este

Eficiența tinde la fel ca la infinit.

Cu alte cuvinte, variația relativă a mediana va fi , sau 57% mai mare decât variația mediei - relativă eroarea standard a medianei va fi , sau cu 25% mai mare decât eroarea standard a mediei , ( a se vedea și secțiunea # Distribuirea eșantionării de mai sus.).

Alți estimatori

Pentru distribuțiile univariate care sunt simetrice în jurul unei mediane, estimatorul Hodges – Lehmann este un estimator robust și extrem de eficient al medianei populației.

Dacă datele sunt reprezentate de un model statistic care specifică o anumită familie de distribuții de probabilitate , atunci estimările medianei pot fi obținute prin adaptarea acelei familii de distribuții de probabilitate la date și calcularea medianei teoretice a distribuției adaptate. Interpolația Pareto este o aplicație a acestei situații atunci când se presupune că populația are o distribuție Pareto .

Mediană multivariată

Anterior, acest articol a discutat mediana univariată, când eșantionul sau populația avea o singură dimensiune. Când dimensiunea este două sau mai mare, există mai multe concepte care extind definiția medianei univariate; fiecare astfel de mediană multivariată este de acord cu mediana univariată când dimensiunea este exact una.

Median marginal

Mediana marginală este definită pentru vectorii definiți în raport cu un set fix de coordonate. O mediană marginală este definită ca fiind vectorul ale cărui componente sunt mediane univariate. Mediana marginală este ușor de calculat, iar proprietățile sale au fost studiate de Puri și Sen.

Mediană geometrică

Medie geometrică a unui set discret de puncte de probă într - un spațiu euclidian este punctul minimizând suma distanțelor la punctele de eșantionare.

Spre deosebire de mediana marginală, mediana geometrică este echivariantă în ceea ce privește transformările de similitudine euclidiene, cum ar fi translațiile și rotațiile .

Mediană în toate direcțiile

Dacă medianele marginale pentru toate sistemele de coordonate coincid, atunci locația lor comună poate fi denumită „mediană în toate direcțiile”. Acest concept este relevant pentru teoria votului pe baza teoremei votantului median . Când există, mediana în toate direcțiile coincide cu mediana geometrică (cel puțin pentru distribuții discrete).

Punctul central

O generalizare alternativă a medianei în dimensiuni superioare este punctul central .

Alte concepte legate de mediană

Mediană interpolată

Atunci când avem de-a face cu o variabilă discretă, este uneori util să considerăm valorile observate ca fiind punctele medii ale intervalelor continue subiacente. Un exemplu în acest sens este o scală Likert, pe care opiniile sau preferințele sunt exprimate pe o scară cu un număr stabilit de răspunsuri posibile. Dacă scala constă din numere întregi pozitive, o observație de 3 ar putea fi considerată ca reprezentând intervalul de la 2,50 la 3,50. Este posibil să se estimeze mediana variabilei de bază. Dacă, să zicem, 22% din observații au valoare 2 sau mai mică și 55,0% sunt de 3 sau mai mică (deci 33% au valoarea 3), atunci mediana este 3, deoarece mediana este cea mai mică valoare pentru care este mai mare decât jumătate. Dar mediana interpolată este undeva între 2,50 și 3,50. Mai întâi adăugăm jumătate din lățimea intervalului la mediană pentru a obține limita superioară a intervalului median. Apoi scădem acea proporție din lățimea intervalului care este egală cu proporția de 33% care se află deasupra marcajului de 50%. Cu alte cuvinte, împărțim lățimea intervalului proporțional cu numărul de observații. În acest caz, 33% este împărțit în 28% sub mediană și 5% deasupra acesteia, așa că scădem 5/33 din lățimea intervalului din limita superioară de 3,50 pentru a da o mediană interpolată de 3,35. Mai formal, dacă valorile sunt cunoscute, mediana interpolată poate fi calculată din

Alternativ, dacă într-un eșantion observat există scoruri peste categoria mediană, scoruri în ea și scoruri sub aceasta, atunci mediana interpolată este dată de

Pseudo-mediană

Pentru distribuții univariate care sunt simetrice în jurul unei mediane, estimatorul Hodges – Lehmann este un estimator robust și extrem de eficient al medianei populației; pentru distribuții nesimetrice, estimatorul Hodges – Lehmann este un estimator robust și extrem de eficient al pseudo-medianei populației , care este mediana unei distribuții simetrizate și care este apropiată de mediana populației. Estimatorul Hodges – Lehmann a fost generalizat la distribuții multivariate.

Variante de regresie

Theil-Sen Estimatorul este o metodă de robust de regresie liniară bazată pe găsirea medianele pante .

Filtru mediu

În contextul de procesare a imaginii de monocrome imaginilor raster există un tip de zgomot, cunoscut sub numele de zgomot sare și piper , atunci când fiecare pixel devine în mod independent , negru (cu o anumită probabilitate mică) sau alb (cu unele probabilitate mică), și este neschimbat în caz contrar (cu probabilitatea apropiată de 1). O imagine construită din valori mediane ale cartierelor (cum ar fi pătratul 3 × 3) poate reduce efectiv zgomotul în acest caz.

Analiza grupului

In analiza cluster , a k-medianele clusterizare algoritm oferă o modalitate de clustere care definesc, în care criteriul de maximizare a distanței dintre clusterului-mijloc , care este utilizat în k-means clustering , este înlocuită prin maximizarea distanței dintre cluster medianele.

Linie mediană-mediană

Aceasta este o metodă de regresie robustă. Ideea datează de la Wald în 1940, care a sugerat împărțirea unui set de date bivariate în două jumătăți în funcție de valoarea parametrului independent : o jumătate stângă cu valori mai mici decât mediana și o jumătate dreaptă cu valori mai mari decât mediana. El a sugerat luarea mijloacelor variabilelor dependente și independente ale jumătăților stânga și dreaptă și estimarea pantei liniei care unește aceste două puncte. Linia ar putea fi apoi ajustată pentru a se potrivi majorității punctelor din setul de date.

Nair și Shrivastava în 1942 au sugerat o idee similară, dar au susținut în schimb împărțirea eșantionului în trei părți egale înainte de a calcula mijloacele submostrelor. Brown și Mood, în 1951, au propus ideea de a folosi medianele a două submostre, mai degrabă mijloacele. Tukey a combinat aceste idei și a recomandat împărțirea eșantionului în trei sub-eșantioane de dimensiuni egale și estimarea liniei pe baza medianelor sub-eșantioanelor.

Estimatori nepărtinitori median

Orice estimator mediu imparțial minimizează riscul ( pierderea așteptată ) în raport cu funcția de pierdere a erorii pătrate , așa cum a observat Gauss . Un estimator median fără prejudecăți minimizează riscul cu privire la funcția de pierdere a deviației absolute , așa cum a observat Laplace . Alte funcții de pierdere sunt utilizate în teoria statistică , în special în statistici solide .

Teoria estimatorilor nepărtinitori median a fost reînviată de George W. Brown în 1947:

Se va spune că o estimare a unui parametru unidimensional θ este mediană-imparțială dacă, pentru fixed fix, mediana distribuției estimării este la valoarea θ; adică, estimarea subestimează la fel de des pe cât o supraestimează. Această cerință pare, în majoritatea scopurilor, să îndeplinească la fel de mult ca cerința medie imparțială și are proprietatea suplimentară că este invariantă în transformarea unu-la-unu.

-  pagina 584

Au fost raportate alte proprietăți ale estimatorilor median-imparțiali. Estimatorii nepărtinitori median sunt invarianți sub transformări unu-la-unu .

Există metode de construire a unor estimatori median-imparțiali care sunt optimi (într-un sens analog proprietății de varianță minimă pentru estimatorii medii imparțiali). Astfel de construcții există pentru distribuții de probabilitate care au funcții de probabilitate monotone . Un astfel de procedeu este un analog al procedurii Rao-Blackwell pentru estimatorii nepărtinitori: Procedura este valabilă pentru o clasă mai mică de distribuții de probabilitate decât procedura Rao-Blackwell, dar pentru o clasă mai mare de funcții de pierdere .

Istorie

Cercetătorii științifici din Orientul Apropiat antic par să nu fi folosit cu totul statistici rezumative, alegând în schimb valori care să ofere consistență maximă cu o teorie mai largă care să integreze o mare varietate de fenomene. În cadrul comunității științifice mediteraneene (și, mai târziu, europene), statisticile precum media reprezintă fundamental o dezvoltare medievală și modernă timpurie. (Istoria medianei în afara Europei și a predecesorilor ei rămâne relativ ne studiată.)

Ideea medianei a apărut în secolul al XIII-lea în Talmud , pentru a analiza corect aprecierile divergente . Cu toate acestea, conceptul nu s-a răspândit în comunitatea științifică mai largă.

În schimb, cel mai apropiat strămoș al medianei moderne este gama medie , inventată de Al-Biruni . Transmiterea lucrării lui Al-Biruni către savanții ulteriori nu este clară. Al-Biruni și-a aplicat tehnica testării metalelor, dar, după ce și-a publicat lucrarea, majoritatea analizatorilor au adoptat în continuare cea mai nefavorabilă valoare din rezultatele lor, ca să nu pară că trișează . Cu toate acestea, creșterea navigației pe mare în timpul Epocii Descoperirii a însemnat că navigatorii navei trebuiau să încerce din ce în ce mai mult să determine latitudinea pe vreme nefavorabilă împotriva țărmurilor ostile, ducând la un interes reînnoit pentru statisticile rezumative. Indiferent dacă a fost redescoperită sau inventată independent, gama medie este recomandată navigatorilor nautici în „Instrucțiuni pentru călătoria lui Raleigh în Guiana, 1595” a lui Harriot.

Ideea medianei ar fi putut apărea pentru prima dată în cartea lui Edward Wright , din 1599, Certaine Errors in Navigation, într-o secțiune despre navigarea busolei . Wright a fost reticent în a renunța la valorile măsurate și ar fi putut simți că mediana - încorporând o proporție mai mare din setul de date decât intervalul mediu - era mai probabil să fie corectă. Cu toate acestea, Wright nu a dat exemple de utilizare a tehnicii sale, făcând dificilă verificarea faptului că a descris noțiunea modernă de mediană. Mediana (în contextul probabilității) a apărut cu siguranță în corespondența lui Christiaan Huygens , dar ca un exemplu de statistică inadecvată practicii actuariale .

Cea mai veche recomandare a medianei datează din 1757, când Roger Joseph Boscovich a dezvoltat o metodă de regresie bazată pe norma L 1 și, prin urmare, implicit pe mediană. În 1774, Laplace a făcut această dorință explicită: a sugerat ca mediana să fie utilizată ca estimator standard al valorii unui PDF posterior . Criteriul specific a fost de a minimiza magnitudinea așteptată a erorii; unde este estimarea și este adevărata valoare. În acest scop, Laplace a determinat distribuțiile atât ale mediei eșantionului, cât și ale medianei eșantionului la începutul anilor 1800. Cu toate acestea, un deceniu mai târziu, Gauss și Legendre au dezvoltat metoda celor mai mici pătrate , care se minimizează pentru a obține media. În contextul regresiei, inovația lui Gauss și Legendre oferă un calcul mult mai ușor. În consecință, propunerea Laplaces a fost în general respinsă până la apariția dispozitivelor de calcul 150 de ani mai târziu (și este încă un algoritm relativ neobișnuit).

Antoine Augustin Cournot în 1843 a fost primul care a folosit termenul mediană ( valeur médiane ) pentru valoarea care împarte o distribuție de probabilitate în două jumătăți egale. Gustav Theodor Fechner a folosit mediana ( Centralwerth ) în fenomenele sociologice și psihologice. Mai devreme fusese folosit doar în astronomie și în domenii conexe. Gustav Fechner a popularizat mediana în analiza formală a datelor, deși fusese folosită anterior de Laplace, iar mediana a apărut într-un manual de FY Edgeworth . Francis Galton a folosit termenul englezesc median în 1881, folosind mai devreme termenii de valoare medie în 1869 și mediu în 1880.

Statisticienii au încurajat utilizarea intensă a medianelor de-a lungul secolului al XIX-lea pentru claritatea intuitivă și ușurința calculului manual. Cu toate acestea, noțiunea de mediană nu se pretează teoriei momentelor superioare, precum și media aritmetică , și este mult mai greu de calculat prin computer. Ca urmare, mediana a fost înlocuită în mod constant ca noțiune de medie generică prin media aritmetică în timpul secolului al XX-lea.

Vezi si

Note

Referințe

linkuri externe

Acest articol încorporează material din Median pentru o distribuție pe PlanetMath , care este licențiată sub licența Creative Commons Attribution / Share-Alike .