Distribuția încrederii - Confidence distribution

În inferența statistică , conceptul de distribuție de încredere ( CD ) a fost deseori denumit în mod vag funcție de distribuție pe spațiul parametrilor care poate reprezenta intervale de încredere de toate nivelurile pentru un parametru de interes. Din punct de vedere istoric, a fost construit în mod obișnuit prin inversarea limitelor superioare ale intervalelor de încredere laterale inferioare ale tuturor nivelurilor și a fost, de asemenea, frecvent asociat cu o interpretare fiducială ( distribuție fiducială ), deși este un concept pur frecventist. O distribuție de încredere NU este o funcție de distribuție a probabilității parametrului de interes, dar poate fi totuși o funcție utilă pentru a face inferențe.

În ultimii ani, a existat o creștere a interesului reînnoit pentru distribuțiile de încredere. În evoluțiile mai recente, conceptul de distribuție a încrederii a apărut ca un concept pur frecventist , fără nicio interpretare sau raționament fiducial. Conceptual, o distribuție de încredere nu este diferită de un estimator de punct sau un estimator de interval ( interval de încredere ), dar folosește o funcție de distribuție dependentă de eșantion pe spațiul parametrilor (în loc de un punct sau un interval) pentru a estima parametrul de interes.

Un exemplu simplu de distribuție de încredere, care a fost utilizat pe larg în practica statistică, este o distribuție bootstrap . Dezvoltarea și interpretarea unei distribuții bootstrap nu implică niciun raționament fiducial; același lucru este valabil și pentru conceptul de distribuție a încrederii. Dar noțiunea de distribuție a încrederii este mult mai largă decât cea a unei distribuții bootstrap. În special, cercetările recente sugerează că cuprinde și unifică o gamă largă de exemple, de la cazuri parametrice regulate (inclusiv cele mai multe exemple ale dezvoltării clasice a distribuției fiduciale Fisher) la distribuții bootstrap, funcții de valoare p, funcții de probabilitate normalizate și, în unele cazuri, priori bayesieni și posteriori bayesieni .

Așa cum o distribuție posterioară bayesiană conține o multitudine de informații pentru orice tip de inferență bayesiană , o distribuție de încredere conține o multitudine de informații pentru construirea a aproape toate tipurile de inferențe frecventiste, inclusiv estimări punctuale , intervale de încredere , valori critice, putere statistică și p- valorile, printre altele. Unele evoluții recente au evidențiat potențialele promițătoare ale conceptului CD, ca un instrument inferențial eficient.

Istorie

Neyman (1937) a introdus ideea de „încredere” în lucrarea sa despre intervalele de încredere, care a clarificat proprietatea de repetare frecventistă. Potrivit lui Fraser, sămânța (ideea) distribuției încrederii poate fi chiar urmărită până la Bayes (1763) și Fisher (1930). Deși fraza pare să fie folosită mai întâi în Cox (1958). Unii cercetători consideră distribuția încrederii ca „interpretarea neymaniană a distribuțiilor fiduciale ale lui Fisher”, care a fost „disputată cu furie de Fisher”. Se crede, de asemenea, că aceste „dispute neproductive” și „insistența încăpățânată” a lui Fisher ar putea fi motivul pentru care conceptul de distribuire a încrederii a fost mult timp interpretat greșit ca un concept fiducial și nu a fost dezvoltat pe deplin în cadrul frecventistului. Într-adevăr, distribuția încrederii este un concept pur frecventist cu o interpretare pur frecventistă și are, de asemenea, legături cu conceptele de inferență bayesiană și cu argumentele fiduciale.

Definiție

Definiție clasică

În mod clasic, o distribuție de încredere este definită prin inversarea limitelor superioare ale unei serii de intervale de încredere pe partea inferioară. În special,

Pentru fiecare α din (0, 1), fie (−∞,  ξ n ( α )] un interval de încredere în partea inferioară de 100α% pentru θ , unde ξ n ( α ) =  ξ n ( X n , α) este continuu și creșterea în α pentru fiecare probă X n . Apoi, H n (•) =  ξ n −1 (•) este o distribuție de încredere pentru  θ .

Efron a afirmat că această distribuție "atribuie probabilitatea 0,05 la θ situată între punctele finale superioare ale intervalului de încredere 0,90 și 0,95 etc. " și „are un apel intuitiv puternic”. În literatura clasică, funcția de distribuție a încrederii este interpretată ca o funcție de distribuție a parametrului θ , ceea ce este imposibil dacă nu este implicat un raționament fiducial, deoarece, într-un cadru frecventist, parametrii sunt fixi și non-aleatori.

A interpreta funcția CD în întregime dintr-un punct de vedere frecventist și a nu o interpreta ca o funcție de distribuție a unui parametru (fix / non-aleatoriu) este una dintre principalele plecări ale dezvoltării recente față de abordarea clasică. Lucrul frumos despre tratarea distribuțiilor de încredere ca un concept pur frecventist (similar cu un estimator de puncte) este că este acum liber de constrângerile restrictive, dacă nu controversate, stabilite de Fisher asupra distribuțiilor fiduciale.

Definiția modernă

Se aplică următoarea definiție; Θ este spațiul parametrilor parametrului necunoscut de interes θ și χ este spațiul eșantion corespunzător datelor X n = { X 1 , ..., X n }:

O funcție H n (•) = H n ( X n , •) pe χ  ×  Θ  → [0, 1] se numește distribuție de încredere (CD) pentru un parametru θ , dacă urmează două cerințe:
  • (R1) Pentru fiecare X nχ dat , H n (•) = H n ( X n , •) este o funcție de distribuție cumulativă continuă pe Θ ;
  • (R2) La valoarea parametrului adevărat θ  =  θ 0 , H n ( θ 0 ) ≡  H n ( X n , θ 0 ), în funcție de eșantionul X n , urmează distribuția uniformă U [0, 1].

De asemenea, funcția H este un CD asimptotic ( ACD ), dacă cerința U [0, 1] este adevărată numai asimptotic și cerința de continuitate pe H n (•) este abandonată.

În termeni netecnici, o distribuție de încredere este o funcție atât a parametrului, cât și a eșantionului aleatoriu, cu două cerințe. Prima cerință (R1) necesită pur și simplu ca un CD să fie o distribuție pe spațiul parametrilor. A doua cerință (R2) stabilește o restricție asupra funcției astfel încât inferențele (estimatori punctuali, intervale de încredere și testarea ipotezelor etc.) bazate pe distribuția încrederii au proprietăți frecventiste dorite. Acest lucru este similar cu restricțiile în estimarea punctelor pentru a asigura anumite proprietăți dorite, cum ar fi imparțialitatea, consistența, eficiența etc.

O distribuție de încredere derivată prin inversarea limitelor superioare ale intervalelor de încredere (definiție clasică) satisface, de asemenea, cerințele din definiția de mai sus, iar această versiune a definiției este în concordanță cu definiția clasică.

Spre deosebire de inferența fiducială clasică, pot fi disponibile mai multe distribuții de încredere pentru a estima un parametru în orice setare specifică. De asemenea, spre deosebire de inferența fiducială clasică, optimitatea nu face parte din cerință. În funcție de setare și de criteriul utilizat, uneori există o distribuție unică de încredere „cea mai bună” (din punct de vedere al optimității). Dar, uneori, nu există o distribuție optimă de încredere disponibilă sau, în unele cazuri extreme, s-ar putea chiar să nu putem găsi o distribuție de încredere semnificativă. Acest lucru nu este diferit de practica estimării punctului.

O definiție cu spații măsurabile

O distribuție de încredere pentru un parametru într-un spațiu măsurabil este un estimator de distribuție cu pentru o familie de regiuni de încredere pentru cu nivel pentru toate nivelurile . Familia regiunilor de încredere nu este unică. Dacă există doar pentru , atunci este o distribuție de încredere cu nivel stabilit . Ambele și toate sunt funcții măsurabile ale datelor. Aceasta implică faptul că este o măsură aleatorie și este un set aleatoriu. . Dacă cerința definitorie este valabilă pentru egalitate, atunci distribuția încrederii este, prin definiție, exactă. Dacă, în plus, este un parametru real, atunci definiția teoretică a măsurii coincide cu definiția clasică de mai sus.

Exemple

Exemplul 1: medie normală și varianță

Să presupunem că este dat un eșantion normal X i  ~  N ( μσ 2 ), i  = 1, 2, ...,  n .

(1) Varianța σ 2 este cunoscută

Fie, Φ funcția de distribuție cumulativă a distribuției normale standard și funcția de distribuție cumulativă a distribuției Student . Atât funcțiile, cât și date de

îndeplinesc cele două cerințe din definiția CD și sunt funcții de distribuție a încrederii pentru  μ . În plus,

satisface definiția unei distribuții de încredere asimptotice atunci când n → ∞, și este o distribuție de încredere asimptotică pentru μ . Utilizările și sunt echivalente cu starea pe care o folosim și , respectiv, cu estimarea .

(2) Varianța σ 2 este necunoscută

Pentru parametrul μ , deoarece implică parametrul necunoscut σ și încalcă cele două cerințe din definiția CD, nu mai este un „estimator de distribuție” sau o distribuție de încredere pentru  μ . Cu toate acestea, este încă un CD pentru μ și este un CD pentru  μ .

Pentru parametrul σ 2 , funcția de distribuție cumulativă dependentă de eșantion

este o funcție de distribuție a încrederii pentru σ 2 . Iată funcția de distribuție cumulativă a distribuției.

În cazul în care varianța σ 2 este cunoscută, este optimă în ceea ce privește producerea celor mai scurte intervale de încredere la un nivel dat. În cazul în care varianța σ 2 este necunoscută, este o distribuție optimă de încredere pentru μ .

Exemplul 2: corelație normală bivariantă

Fie ρ denotă coeficientul de corelație al unei populații normale bivariate . Este bine cunoscut faptul că Fisher's z este definit de transformarea Fisher :

are distribuția limitativă cu o rată rapidă de convergență, unde r este corelația eșantionului și n este dimensiunea eșantionului.

Functia

este o distribuție de încredere asimptotică pentru ρ .


O densitate exactă de încredere pentru ρ este

unde este funcția hipergeometrică gaussiană și . Aceasta este, de asemenea, densitatea posterioară a unui Bayes care se potrivește anterior pentru cei cinci parametri din distribuția binormală.

Ultima formulă din cartea clasică a lui Fisher oferă

unde și . Această formulă a fost derivată de CR Rao .

Exemplul 3: medie binormală

Să se genereze date de unde este un vector necunoscut în plan și are o distribuție binormală și cunoscută în plan. Distribuția de definește o distribuție de încredere pentru . Regiunile de încredere pot fi alese ca interiorul elipselor centrate la și axele date de vectorii proprii ai matricei de covarianță a . Distribuția încrederii este în acest caz binormală cu medie , iar regiunile de încredere pot fi alese în multe alte moduri. Distribuția de încredere coincide în acest caz cu posteriorul bayesian folosind priorul Haar drept. Argumentul se generalizează în cazul unei medii necunoscute într-un spațiu Hilbert cu dimensiune infinită , dar în acest caz distribuția încrederii nu este un posterior bayesian.

Utilizarea distribuțiilor de încredere pentru deducere

Interval de încredere

CDinference1.png

Din definiția CD-ului, este evident că intervalul și asigură intervale de încredere de nivel 100 (1 -  α )% de diferite tipuri, pentru θ , pentru orice α  ∈ (0, 1). De asemenea, este un nivel de 100 (1 -  α 1  -  α 2 )% interval de încredere pentru parametrul θ pentru orice α 1  > 0, α 2  > 0 și α 1  +  α 2  <1. Iată, cuantilul de 100 β % al sau se rezolvă pentru θ în ecuație . Același lucru este valabil și pentru un CD, unde nivelul de încredere este atins în limită. Unii autori au propus utilizarea acestora pentru a vizualiza grafic ce valori ale parametrilor sunt în concordanță cu datele, în loc de acoperire sau scopuri de performanță.

Estimarea punctelor

Estimatorii punctuali pot fi, de asemenea, construiți având în vedere un estimator de distribuție a încrederii pentru parametrul de interes. De exemplu, având în vedere H n ( θ ) CD pentru un parametru θ , alegerile naturale ale estimatorilor de puncte includ mediana M n  =  H n −1 (1/2), media și punctul maxim al densității CD-ului

În unele condiții modeste, printre alte proprietăți, se poate dovedi că acești estimatori de puncte sunt toți consistenți. Anumite distribuții de încredere pot oferi estimatori frecvenți optimi.

Testarea ipotezei

Se poate obține o valoare p pentru un test, fie pe o parte, fie pe două fețe, referitor la parametrul  θ , din distribuția sa de încredere H n ( θ ). Notăm prin masa de probabilitate a unei mulțimi C sub funcția de distribuție a încrederii. Acest p s (C) este numit „suport” în inferența CD și este cunoscut și ca „credință” în literatura fiducială. Avem

(1) Pentru testul unilateral K 0 : θ  ∈  C vs. K 1 : θ  ∈  C c , unde C este de tipul (−∞,  b ] sau [ b , ∞), se poate arăta din Definiție CD care sup θ  ∈  C P θ ( p s ( C ) ≤  α ) =  α . Astfel, p s ( C ) =  H n ( C ) este valoarea p corespunzătoare a testului.

(2) Pentru testul individual K 0 : θ  =  b vs. K 1 : θ  ≠  b , P { K 0 : θ  =  b } (2 min { p s ( C lo ), se poate arăta din definiția CD-ului că p s ( C sus )} ≤  α ) =  α . Astfel, 2 min { p s ( C lo ),  p s ( C up )} = 2 min { H n ( b ), 1 -  H n ( b )} este valoarea p corespunzătoare a testului. Aici, C lo = (−∞,  b ] și C up  = [ b , ∞).

Vedeți Figura 1 din Xie și Singh (2011) pentru o ilustrare grafică a inferenței CD-ului.

Implementări

Câteva programe statistice au implementat abilitatea de a construi și grafica distribuții de încredere.

R , prin intermediul concurve, pvaluefunctionsși episheetpachete

Excel , prinepisheet

Stata , viaconcurve

Vezi si

Referințe

Bibliografie