Testul raportului de probabilitate - Likelihood-ratio test

În statistici , testul raportului de probabilitate evaluează bunătatea potrivirii a două modele statistice concurente pe baza raportului probabilităților lor , în mod specific unul găsit prin maximizarea întregului spațiu de parametri și altul găsit după impunerea unor constrângeri . Dacă constrângerea (adică ipoteza nulă ) este susținută de datele observate , cele două probabilități nu ar trebui să difere cu mai mult decât eroarea de eșantionare . Astfel, testul raportului de probabilitate testează dacă acest raport este semnificativ diferit de unul sau echivalent dacă logaritmul său natural este semnificativ diferit de zero.

Testul raportului de probabilitate, cunoscut și sub numele de testul Wilks , este cea mai veche dintre cele trei abordări clasice ale testării ipotezelor, împreună cu testul multiplicator Lagrange și testul Wald . De fapt, ultimele două pot fi conceptualizate ca aproximări la testul raportului de probabilitate și sunt echivalente asimptotic. În cazul comparării a două modele dintre care fiecare nu are parametri necunoscuți , utilizarea testului raportului de probabilitate poate fi justificată de lema Neyman-Pearson . Lema demonstrează că testul are cea mai mare putere dintre toți concurenții.

Definiție

General

Să presupunem că avem un model statistic cu spațiu de parametri . O ipoteză nulă este adesea afirmată spunând că parametrul se află într-un subset specificat de . Ipoteza alternativă este , așadar , că este în completarea lui , adică în care este notat cu . Statistica testului raportului de probabilitate pentru ipoteza nulă este dată de:

unde cantitatea din paranteze se numește raport de probabilitate. Aici, notația se referă la suprem . Deoarece toate probabilitățile sunt pozitive și, deoarece maximul constrâns nu poate depăși maximul necontrolat, raportul de probabilitate este limitat între zero și unu.

Adesea statistica testului raportului de probabilitate este exprimată ca o diferență între probabilitățile de log

Unde

este logaritmul funcției de probabilitate maximizată și este valoarea maximă în cazul special că ipoteza nulă este adevărată (dar nu neapărat o valoare care se maximizează pentru datele eșantionate) și

denotați argumentele respective ale valorilor maxime și ale intervalelor permise în care sunt încorporate. Înmulțirea cu −2 asigură matematic că (prin teorema lui Wilks ) converge asimptotic spre a fi distribuite χ ² dacă ipoteza nulă este adevărată. Cele Distribuțiile finite eșantion testelor probabilitate ratio sunt în general necunoscute.

Testul raportului de probabilitate necesită ca modelele să fie imbricate - adică modelul mai complex poate fi transformat în modelul mai simplu prin impunerea de constrângeri asupra parametrilor primului. Multe statistici comune de testare sunt teste pentru modele imbricate și pot fi formulate ca raporturi log-probabilitate sau aproximări ale acestora: de exemplu, Z si testul , The F si testul , The G - test , și testul chi-pătrat Pearson ; pentru o ilustrare cu un eșantion t -test , vezi mai jos.

Dacă modelele nu sunt imbricate, atunci în loc de testul raportului de probabilitate, există o generalizare a testului care poate fi utilizată de obicei: pentru detalii, consultați probabilitatea relativă .

Caz de ipoteze simple

Un test de ipoteză simplu vs. simplu a specificat complet modele atât în ​​ipoteza nulă, cât și în ipoteza alternativă, care pentru comoditate sunt scrise în termeni de valori fixe ale unui parametru noțional :

În acest caz, în ambele ipoteze, distribuția datelor este complet specificată: nu există parametri necunoscuți de estimat. Pentru acest caz, este disponibilă o variantă a testului raportului de probabilitate:

Unele referințe mai vechi pot folosi reciprocitatea funcției de mai sus ca definiție. Astfel, raportul de probabilitate este mic dacă modelul alternativ este mai bun decât modelul nul.

Testul raportului de probabilitate oferă regula deciziei după cum urmează:

Dacă nu respingeți ;
Dacă , respinge ;
Respingeți cu probabilitate dacă

Valorile și sunt de obicei alese pentru a obține un nivel de semnificație specificat , prin relație

Neyman-Pearson Lema afirmă că acest test de probabilitate-raport este cel mai puternic dintre toate la nivel de teste pentru acest caz.

Interpretare

Raportul de probabilitate este o funcție a datelor ; prin urmare, este o statistică , deși neobișnuită prin aceea că valoarea statisticii depinde de un parametru ,. Testul raportului de probabilitate respinge ipoteza nulă dacă valoarea acestei statistici este prea mică. Cât de mic este prea mic depinde de nivelul de semnificație al testului, adică de ce probabilitate de eroare de tip I este considerată tolerabilă (erorile de tip I constau în respingerea unei ipoteze nule care este adevărată).

Numărătorul corespunde probabilitatea unui rezultat observat sub ipoteza nulă . La numitor corespunde probabilității maxime a unui rezultat observat, parametrii peste întregul spațiu parametru care variază. Numărătorul acestui raport este mai mic decât numitorul; deci, raportul de probabilitate este între 0 și 1. Valorile scăzute ale raportului de probabilitate înseamnă că rezultatul observat a fost mult mai puțin probabil să apară sub ipoteza nulă în comparație cu alternativa. Valorile ridicate ale statisticii înseamnă că rezultatul observat a fost aproape la fel de probabil să apară sub ipoteza nulă ca alternativă, și astfel ipoteza nulă nu poate fi respinsă.

Un exemplu

Următorul exemplu este adaptat și prescurtat de la Stuart, Ord și Arnold (1999 , §22.2).

Să presupunem că avem un eșantion aleatoriu, de mărimea n , dintr-o populație care este distribuită în mod normal. Atât media, μ , cât și abaterea standard, σ , a populației sunt necunoscute. Vrem să testăm dacă media este egală cu o valoare dată, μ 0 .

Astfel, ipoteza noastră nulă este H 0μ = μ 0,  iar ipoteza noastră alternativă este H 1μμ 0  . Funcția de probabilitate este

Cu un anumit calcul (omis aici), se poate arăta că

unde t este statisticul t cu n  - 1 grade de libertate. Prin urmare, putem folosi distribuția exactă cunoscută a lui t n -1 pentru a trage inferențe.

Distribuție asimptotică: teorema lui Wilks

Dacă distribuția raportului de probabilitate corespunzătoare unei anumite ipoteze nule și alternative poate fi determinată în mod explicit, atunci poate fi utilizată direct pentru a forma regiuni de decizie (pentru a susține sau respinge ipoteza nulă). Cu toate acestea, în majoritatea cazurilor, distribuția exactă a raportului de probabilitate corespunzătoare unor ipoteze specifice este foarte dificil de determinat.

Presupunând că H 0 este adevărat, există un rezultat fundamental al lui Samuel S. Wilks : Pe măsură ce dimensiunea eșantionului se apropie , statisticile de test definite mai sus vor fi distribuite asimptotic chi-pătrat ( ) cu grade de libertate egale cu diferența de dimensionalitate a și . Aceasta implică faptul că, pentru o mare varietate de ipoteze, putem calcula raportul de probabilitate pentru date și apoi putem compara valoarea observată cu valoarea corespunzătoare unei semnificații statistice dorite ca un test statistic aproximativ . Există și alte extensii.

Vezi si

Referințe

Lecturi suplimentare

linkuri externe