Aleatoritate statistică - Statistical randomness

Se spune că o secvență numerică este aleatorie statistic atunci când nu conține modele sau regularități recunoscute ; secvențe precum rezultatele unei aruncări ideale de zaruri sau cifrele π prezintă aleatoritate statistică.

Aleatoritatea statistică nu implică neapărat aleatoritatea „adevărată” , adică imprevizibilitatea obiectivă . Pseudorandomness este suficient pentru multe utilizări, cum ar fi statistici, de unde și denumirea de randomness statistic .

Aleatorietatea globală și aleatoria locală sunt diferite. Cele mai multe concepții filosofice ale întâmplării sunt globale - pentru că se bazează pe ideea că „pe termen lung” o secvență pare cu adevărat aleatorie, chiar dacă anumite sub-secvențe nu ar arăta aleatoriu. Într-o secvență „cu adevărat” aleatorie de numere de lungime suficientă, de exemplu, este probabil că ar exista secvențe lungi de altceva decât numere repetate, deși în ansamblu secvența ar putea fi aleatorie. Aleatoritatea locală se referă la ideea că pot exista lungimi minime ale secvenței în care distribuțiile aleatorii sunt aproximate. Părțile lungi din aceleași numere, chiar și cele generate de procese „cu adevărat” aleatorii, ar diminua „aleatoritatea locală” a unui eșantion (s-ar putea să fie aleator local doar pentru secvențe de 10.000 de numere; luarea secvențelor mai mici de 1.000 ar putea să nu pară aleatorii deloc, de exemplu).

Prin urmare, o secvență care prezintă un model nu este dovedită statistic aleatorie. Conform principiilor teoriei Ramsey , obiectele suficient de mari trebuie să conțină în mod necesar o anumită substructură („tulburarea completă este imposibilă”).

Legislația privind jocurile de noroc impune anumite standarde de aleatoritate statistică sloturilor .

Teste

Primele teste pentru numerele aleatorii au fost publicate de MG Kendall și Bernard Babington Smith în Journal of the Royal Statistical Society în 1938. Ele au fost construite pe instrumente statistice, cum ar fi testul chi-pătrat al lui Pearson, care au fost dezvoltate pentru a distinge dacă fenomenele experimentale se potrivesc teoretic probabilități. Pearson și-a dezvoltat testul inițial arătând că un număr de experimente de zaruri de către WFR Weldon nu au prezentat un comportament „aleatoriu”.

Cele patru teste inițiale ale lui Kendall și Smith erau teste de ipoteză , care au luat drept ipoteză nulă ideea că fiecare număr dintr-o anumită secvență aleatorie avea șanse egale de apariție și că diferite alte tipare din date ar trebui distribuite și în mod echipabil.

  • Testul de frecvență a fost foarte de bază: verificarea pentru a vă asigura că există aproximativ același număr de 0s, 1s, 2s, 3s etc.
  • Testul serial a făcut același lucru, dar pentru secvențe de două cifre la un moment dat (00, 01, 02 etc.), comparând frecvențele observate cu predicțiile lor ipotetice în care erau distribuite în mod egal.
  • Testul de poker , testat pentru anumite secvențe de cinci numere la un moment dat (AAAAA, AAAAB, AAABB etc.) bazat pe mâinile jocului de poker .
  • Testul gap-ului a analizat distanțele dintre zerouri (00 ar fi o distanță de 0, 030 ar fi o distanță de 1, 02250 ar fi o distanță de 3 etc.).

Dacă o anumită secvență a reușit să treacă toate aceste teste într-un anumit grad de semnificație (în general 5%), atunci s-a considerat că este, în cuvintele lor „aleator local”. Kendall și Smith au diferențiat „aleatoritatea locală” de „adevărata aleatorietate” prin faptul că multe secvențe generate cu metode cu adevărat aleatorii s-ar putea să nu afișeze „randomitatea locală” într-un anumit grad - secvențele foarte mari ar putea conține mai multe rânduri dintr-o singură cifră. Acest lucru ar putea fi „aleatoriu” pe scara întregii secvențe, dar într-un bloc mai mic nu ar fi „aleatoriu” (nu le-ar trece testele) și ar fi inutil pentru o serie de aplicații statistice.

Pe măsură ce seturile de numere aleatorii au devenit din ce în ce mai frecvente, au fost folosite mai multe teste, de sofisticare în creștere. Unele teste moderne trasează cifre aleatorii ca puncte pe un plan tridimensional, care pot fi apoi rotite pentru a căuta modele ascunse. În 1995, statisticianul George Marsaglia a creat un set de teste cunoscute sub numele de teste dure , pe care le distribuie cu un CD-ROM de 5 miliarde de numere pseudorandom . În 2015, Yongge Wang a distribuit un pachet software Java pentru testarea statistică bazată pe distanță.

Număr de pseudoaleatoriu generatoare necesită teste ca verificări exclusive pentru lor „dezordine“ , deoarece acestea sunt hotărât să nu produse prin procese „ cu adevărat aleatoare“, ci , mai degrabă prin algoritmi deterministe. De-a lungul istoriei generării de numere aleatorii, multe surse de numere considerate a fi „aleatorii” sub testare s-au descoperit ulterior că sunt foarte non-aleatorii atunci când sunt supuse anumitor tipuri de teste. Noțiunea de numere cvasi-aleatorii a fost dezvoltată pentru a ocoli unele dintre aceste probleme, deși generatoarele de numere pseudorandom sunt încă utilizate pe scară largă în multe aplicații (chiar și cele cunoscute a fi extrem de „non-aleatorii”), deoarece sunt „suficient de bune” pentru majoritatea aplicații.

Alte teste:

  • Testul Monobit tratează fiecare bit de ieșire al generatorului de numere aleatorii ca un test de întoarcere a monedei și determină dacă numărul observat de capete și cozi este aproape de frecvența așteptată de 50%. Numărul de capete dintr-un traseu monedă formează o distribuție binomială .
  • Wald-Wolfowitz se execută de testare teste pentru numărul de biți tranziții între 0 biți și 1 biți, comparând frecvențele observate cu frecvență așteptată a unei secvențe de bit aleatoare.
  • Entropia informațională
  • Test de autocorelare
  • Testul Kolmogorov – Smirnov
  • Test statistic aleatoriu bazat pe distanță. Yongge Wang a arătat că standardele de testare NIST SP800-22 nu sunt suficiente pentru a detecta o anumită slăbiciune a generatoarelor de aleatorie și a propus testul de randomitate bazat pe distanță statistic.
  • Estimarea densității spectrale - efectuarea unei transformări Fourier pe un semnal „aleatoriu” o transformă într-o sumă de funcții periodice pentru a detecta tendințe repetitive non aleatorii
  • Testul statistic universal al lui Maurer
  • La testele inveterat

Vezi si

Referințe

linkuri externe