Interval (statistici) - Range (statistics)

În statistici , intervalul unui set de date este diferența dintre cele mai mari și cele mai mici valori. Diferența este specifică, gama unui set de date este rezultatul scăderii eșantionului maxim și minim .

Cu toate acestea, în statisticile descriptive , acest concept de gamă are un sens mai complex. Intervalul este dimensiunea celui mai mic interval (statistici) care conține toate datele și oferă o indicație a dispersiei statistice . Se măsoară în aceleași unități ca datele. Deoarece depinde doar de două dintre observații, este cel mai util în reprezentarea dispersiei seturilor mici de date.

Pentru variabile aleatoare IID continue

Pentru n variabile aleatoare continue independente și distribuite identic X 1 , X 2 , ..., X n cu funcție de distribuție cumulativă G ( x ) și funcție de densitate de probabilitate g ( x ). Fie T să denumim intervalul unui eșantion de mărime n dintr-o populație cu funcție de distribuție G ( x ).

Distribuție

Gama are funcție de distribuție cumulativă

Gumbel observă că „frumusețea acestei formule este complet afectată de faptele pe care, în general, nu le putem exprima pe G ( x  +  t ) cu G ( x ) și că integrarea numerică este lungă și obositoare”.

Dacă distribuția fiecărui X i este limitată la dreapta (sau la stânga), atunci distribuția asimptotică a gamei este egală cu distribuția asimptotică a celei mai mari (cele mai mici) valori. Pentru distribuții mai generale distribuția asimptotică poate fi exprimată ca o funcție Bessel .

Momente

Intervalul mediu este dat de

unde x ( G ) este funcția inversă. În cazul în care fiecare dintre X i are o distribuție normală standard , intervalul mediu este dat de

Pentru variabile aleatoare continue non-IID

Pentru n variabile aleatoare continue independente distribuite neidentic X 1 , X 2 , ..., X n cu funcții de distribuție cumulative G 1 ( x ), G 2 ( x ), ..., G n ( x ) și funcții de densitate de probabilitate g 1 ( x ), g 2 ( x ), ..., g n ( x ), intervalul are funcție de distribuție cumulativă

Pentru variabile aleatorii IID discrete

Pentru n variabile aleatoare discrete independente și distribuite identic X 1 , X 2 , ..., X n cu funcție de distribuție cumulativă G ( x ) și funcția de masă de probabilitate g ( x ), intervalul lui X i este intervalul unui eșantion de mărimea n dintr-o populație cu funcție de distribuție G ( x ). Putem presupune fără pierderea generalitățiisuportul fiecărui X i este {1,2,3, ..., N } unde N este un număr întreg pozitiv sau infinit.

Distribuție

Gama are funcția de probabilitate a masei

Exemplu

Dacă presupunem că g ( x ) = 1 / N , distribuția uniformă discretă pentru toate x , atunci găsim

Derivare

Probabilitatea de a avea o valoare specifică a intervalului, t , poate fi determinată prin adăugarea probabilităților de a avea două eșantioane care diferă de t și fiecare altă probă având o valoare între cele două extreme. Probabilitatea ca un eșantion să aibă valoarea x este . Probabilitatea ca altul să aibă o valoare t mai mare decât x este:

Probabilitatea ca toate celelalte valori să se situeze între aceste două extreme este:

Combinând cele trei rezultate:

Cantități conexe

Gama este un exemplu specific de statistici de comandă . În special, gama este o funcție liniară a statisticilor de ordine, pe care le aduce în domeniul de aplicare al L-estimare .

Vezi si

Referințe