Metoda CLs (fizica particulelor) - CLs method (particle physics)

În fizica particulelor , CL reprezintă o metodă statistică pentru stabilirea limitelor superioare (numite și limite de excludere ) la parametrii modelului , o formă particulară de estimare a intervalului utilizată pentru parametrii care pot lua doar valori non-negative. Deși se spune că CL-urile se referă la nivelurile de încredere , „numele metodei este ... înșelător, întrucât regiunea de excludere a CL-urilor nu este un interval de încredere ”. A fost introdus pentru prima dată de fizicieni care lucrează la experimentul LEP de la CERN și de atunci a fost folosit de multe experimente de fizică cu energie ridicată . Este o metodă frecventistă în sensul că proprietățile limitei sunt definite prin intermediul probabilităților de eroare , cu toate acestea diferă de intervalele standard de încredere prin faptul că nivelul de încredere declarat al intervalului nu este egal cu probabilitatea sa de acoperire . Motivul acestei abateri este că limitele superioare standard bazate pe un test foarte puternic produc în mod necesar intervale goale cu o anumită probabilitate fixă ​​atunci când valoarea parametrului este zero și această proprietate este considerată nedorită de majoritatea fizicienilor și statisticienilor.

Limitele superioare derivate cu metoda CLs conțin întotdeauna valoarea zero a parametrului și, prin urmare, probabilitatea de acoperire în acest moment este întotdeauna de 100%. Definiția CL-urilor nu rezultă dintr-un cadru teoretic precis al inferenței statistice și, prin urmare, este descrisă uneori ca ad-hoc . Cu toate acestea, are o asemănare strânsă cu conceptele de dovezi statistice propuse de statisticianul Allan Birnbaum .

Definiție

Fie X un eșantion aleatoriu dintr-o distribuție de probabilitate cu un parametru real negativ . O limită superioară CLs pentru parametrul θ , cu nivel de încredere , este o statistică (adică variabilă aleatorie observabilă ) care are proprietatea:

 

 

 

 

( 1 )

Inegalitatea este utilizată în definiție pentru a explica cazurile în care distribuția lui X este discretă și o egalitate nu poate fi realizată cu precizie. Dacă distribuția lui X este continuă, atunci aceasta ar trebui înlocuită de o egalitate. Rețineți că definiția implică faptul că probabilitatea de acoperire este întotdeauna mai mare decât .

O definiție echivalentă poate fi făcută luând în considerare un test de ipoteză a ipotezei nule împotriva alternativei . Atunci numeratorul din ( 1 ), atunci când este evaluat la , corespunde probabilității de eroare de tip I ( ) a testului (adică, este respins când ) și numitorul puterii ( ). Criteriul de respingere necesită, așadar, ca raportul să fie mai mic decât . Acest lucru poate fi interpretat intuitiv ca spunând că este exclus, deoarece este mai puțin probabil să observăm un rezultat atât de extrem ca X când este adevărat decât atunci când alternativa este adevărată.

Calculul limitei superioare se face de obicei prin construirea unei statistici de testare și găsirea valorii pentru care

unde este rezultatul observat al experimentului.

Utilizare în fizica energiei ridicate

Limitele superioare bazate pe metoda CLs au fost utilizate în numeroase publicații ale rezultatelor experimentale obținute la experimentele de accelerare a particulelor, cum ar fi LEP , Tevatron și LHC , cele mai notabile în căutările de particule noi.

Origine

Motivația inițială pentru CLs s-a bazat pe un calcul condițional al probabilității sugerat de fizicianul G. Zech pentru un experiment de numărare a evenimentelor. Să presupunem că un experiment constă în măsurarea evenimentelor provenite din procesele de semnal și de fundal, ambele descrise de distribuțiile Poisson cu ratele respective și anume . se presupune că este cunoscut și este parametrul care trebuie estimat prin experiment. Procedura standard pentru stabilirea unei limite superioare pentru un rezultat experimental dat constă în excluderea valorilor pentru care , care garantează cel puțin acoperire. Luați în considerare, de exemplu, un caz în care se observă și evenimente, apoi se constată că este exclus la un nivel de încredere de 95%. Dar acest lucru implică faptul că este exclus, și anume toate valorile posibile ale . Un astfel de rezultat este dificil de interpretat, deoarece experimentul nu poate distinge în esență valori foarte mici de ipoteza numai de fundal și, astfel, declararea faptului că astfel de valori mici sunt excluse (în favoarea ipotezei numai de fond) pare inadecvată. Pentru a depăși această dificultate, Zech a sugerat condiționarea probabilității ca pe observația că , unde este numărul (incomensurabil) de evenimente de fond. Raționamentul din spate este că atunci când este mic, procedura este mai probabil să producă o eroare (adică un interval care nu acoperă valoarea adevărată) decât atunci când este mare, iar distribuția sa este independentă de . Adică, nu trebuie raportată probabilitatea de eroare generală, ci probabilitatea condițională, având în vedere cunoștințele pe care le deține cu privire la numărul de evenimente de fond din eșantion. Această probabilitate condiționată este

care corespund definiției de mai sus a CL-urilor. Prima egalitate utilizează doar definiția probabilității condiționale , iar a doua egalitate vine din faptul că dacă și numărul evenimentelor de fundal este, prin definiție, independent de puterea semnalului.

Generalizarea argumentului condițional

Argumentul condițional al lui Zech poate fi extins formal la cazul general. Să presupunem că este o statistică de test din care derivă intervalul de încredere și să fie

unde este rezultatul observat de experiment. Apoi poate fi privită ca o variabilă aleatorie incomensurabilă (deoarece nu se cunoaște), a cărei distribuție este uniformă între 0 și 1 independent de . Dacă testul este imparțial, atunci rezultatul implică

din care, asemănător condiționării în cazul anterior, se obține

Relația cu principiile fundamentale

Argumentele date mai sus pot fi privite ca urmând spiritul principiului condiționalității inferenței statistice, deși exprimă o noțiune mai generalizată de condiționalitate care nu necesită existența unei statistici auxiliare . Cu toate acestea, principiul condiționalității , deja în versiunea sa originală mai restrânsă, implică formal principiul probabilității , un rezultat arătat faimos de Birnbaum . CL nu respectă principiul probabilității și, astfel, astfel de considerații pot fi folosite doar pentru a sugera plauzibilitate, dar nu și completitudinea teoretică din punct de vedere fundamental. (La fel, totuși, se poate spune despre orice metodă frecventistă dacă principiul condiționalității este considerat necesar).

Birnbaum însuși a sugerat în lucrarea sa din 1962 că raportul CLs ar trebui utilizat ca o măsură a puterii dovezilor statistice furnizate de testele de semnificație, mai degrabă decât singur. Aceasta a rezultat dintr-o simplă aplicare a principiului probabilității : dacă rezultatul unui experiment trebuie raportat doar sub forma unei decizii de „acceptare” / „respingere”, atunci procedura generală este echivalentă cu un experiment care are doar două posibilități. rezultate, cu probabilități , și , sub . Raportul de probabilitate asociat cu „respingerea” rezultatului este, prin urmare, și, prin urmare, ar trebui să determine interpretarea probatorie a acestui rezultat. (Deoarece, pentru un test de două ipoteze simple, raportul de probabilitate este o reprezentare compactă a funcției de probabilitate ). Pe de altă parte, dacă principiul probabilității trebuie urmat în mod consecvent, atunci trebuie utilizat raportul de probabilitate al rezultatului inițial și nu , ceea ce face ca baza unei astfel de interpretări să fie discutabilă. Ulterior, Birnbaum a descris acest lucru ca având „cel mult valoare euristică, dar nu substanțială, pentru interpretarea dovezilor”.

O abordare mai directă care conduce la o concluzie similară poate fi găsită în formularea Birnbaum a principiului încrederii , care, spre deosebire de versiunea mai obișnuită, se referă la probabilități de eroare de ambele tipuri. Acest lucru se afirmă după cum urmează:

„Un concept de dovezi statistice nu este plauzibil decât dacă găsește„ dovezi puternice contra ”cu probabilitate mică ( ) când este adevărat și cu probabilitate mult mai mare (1 - ) când este adevărat.”

O astfel de definiție a încrederii poate părea în mod natural satisfăcută de definiția CL-urilor. Rămâne adevărat că atât acest lucru, cât și versiunile mai comune (asociate cu teoria Neyman - Pearson ) ale principiului încrederii sunt incompatibile cu principiul probabilității și, prin urmare, nicio metodă frecventistă nu poate fi privită ca o soluție cu adevărat completă la problemele ridicate de luând în considerare proprietățile condiționate ale intervalelor de încredere.

Calcul în limita eșantionului mare

Dacă sunt îndeplinite anumite condiții de regularitate, atunci o funcție de probabilitate generală va deveni o funcție gaussiană în limita eșantionului mare. În acest caz, limita superioară a CL-urilor la nivelul de încredere (derivată din testul uniform cel mai puternic ) este dată de

unde este distribuția standard cumulată normală , este estimatorul maxim al probabilității și este deviația sa standard ; acesta din urmă ar putea fi estimat din inversul matricei de informații Fisher sau folosind setul de date „Asimov”. Acest rezultat se întâmplă să fie echivalent cu un interval credibil bayesian dacă se utilizează o prioritate uniformă pentru .

Referințe

Lecturi suplimentare

linkuri externe