Cantitate esențială - Pivotal quantity

În statistici , o cantitate pivotă sau pivot este o funcție a observațiilor și a parametrilor neobservabili, astfel încât distribuția probabilității funcției să nu depindă de parametrii necunoscuți (inclusiv parametrii de neplăcere ). O cantitate pivot nu trebuie să fie o statistică - funcția și valoarea ei pot depinde de parametrii modelului, dar distribuția sa nu trebuie. Dacă este o statistică, atunci este cunoscută sub numele de statistică auxiliară .

Mai formal, să fie un eșantion aleatoriu dintr-o distribuție care depinde de un parametru (sau vector de parametri) . Fie o variabilă aleatorie a cărei distribuție este aceeași pentru toți . Apoi se numește o cantitate esențială (sau pur și simplu un pivot ).

Cantitățile pivotante sunt utilizate în mod obișnuit pentru normalizare pentru a permite compararea datelor din diferite seturi de date. Este relativ ușor să construim pivoti pentru parametrii de localizare și scară: pentru primii formăm diferențe astfel încât locația să se anuleze, pentru cel de-al doilea raporturi astfel încât scala să se anuleze.

Cantitățile esențiale sunt fundamentale pentru construirea statisticilor de testare , deoarece permit statisticii să nu depindă de parametri - de exemplu, statistica t a lui Student este pentru o distribuție normală cu varianță (și medie) necunoscută. De asemenea, oferă o metodă de construire a intervalelor de încredere , iar utilizarea unor cantități pivotante îmbunătățește performanța bootstrap - ului . Sub formă de statistici auxiliare, acestea pot fi utilizate pentru a construi intervale de predicție frecventistă (intervale de încredere predictive).

Exemple

Distributie normala

Una dintre cele mai simple cantități pivotante este scorul z ; dată o distribuție normală cu medie și varianță și o observație x, scorul z:

are distribuție - o distribuție normală cu media 0 și varianță 1. În mod similar, deoarece media eșantionului n are distribuție de eșantionare , scorul z al mediei

are, de asemenea, distribuție Rețineți că, deși aceste funcții depind de parametri - și astfel se pot calcula numai dacă parametrii sunt cunoscuți (nu sunt statistici) - distribuția este independentă de parametri.

Având în vedere observații independente, distribuite identic (iid) de la distribuția normală cu medie și varianță necunoscute , o cantitate pivotă poate fi obținută din funcția:

Unde

și

sunt estimări imparțiale ale și , respectiv. Funcția este statistica t a Studentului pentru o nouă valoare , care trebuie extrasă din aceeași populație ca setul de valori deja observat .

Utilizarea funcției devine o cantitate esențială, care este distribuită și de distribuția t a Studentului cu grade de libertate. După cum este necesar, chiar dacă apare ca argument pentru funcție , distribuția lui nu depinde de parametri sau de distribuția normală de probabilitate care guvernează observațiile .

Aceasta poate fi utilizată pentru a calcula un interval de predicție pentru următoarea observație, a se vedea Intervalul de predicție: distribuție normală .

Distribuție normală bivariată

În cazuri mai complicate, este imposibil să construim pivoti exacți. Cu toate acestea, având pivote aproximative îmbunătățește convergența la normalitatea asimptotică .

Să presupunem că un eșantion de mărime a vectorilor este preluat dintr-o distribuție normală bivariată cu corelație necunoscută .

Un estimator al este corelația eșantionului (Pearson, moment)

unde sunt varianțele eșantionului lui și . Statistica eșantionului are o distribuție asimptotic normală:

.

Cu toate acestea, o transformare de stabilizare a varianței

cunoscută sub numele de transformarea Fisher a z a coeficientului de corelație permite crearea unei distribuții asimptotice independente de parametrii necunoscuți:

unde este parametrul de distribuție corespunzător. Pentru dimensiunile probelor finite , variabila aleatoare va avea o distribuție mai apropiată de normală decât cea a . O aproximare și mai apropiată de distribuția normală standard se obține utilizând o aproximare mai bună pentru varianța exactă: forma obișnuită este

Robusteţe

Din punctul de vedere al statisticilor robuste , cantitățile esențiale sunt robuste la modificările parametrilor - într-adevăr, independente de parametri - dar nu, în general, robuste la modificările modelului, cum ar fi încălcările presupunerii normalității. Acest lucru este fundamental pentru critica robustă a statisticilor non-robuste, adesea derivate din cantități esențiale: astfel de statistici pot fi robuste în cadrul familiei, dar nu sunt robuste în afara acesteia.

Vezi si

Referințe