Diferența medie strict standardizată - Strictly standardized mean difference

În statistici , diferența medie strict standardizată (SSMD) este o măsură a dimensiunii efectului . Este media împărțită la abaterea standard a unei diferențe între două valori aleatorii fiecare din unul din cele două grupuri. A fost inițial propus pentru controlul calității și selectarea loviturilor în screening-ul de mare viteză (HTS) și a devenit un parametru statistic care măsoară dimensiunile efectului pentru compararea oricăror două grupuri cu valori aleatorii.

fundal

În screening-ul de mare viteză (HTS), controlul calității (QC) este esențial. O caracteristică QC importantă într-un test HTS este cât de mult diferă între ele controlele pozitive, compușii de testat și controalele negative. Această caracteristică QC poate fi evaluată utilizând comparația a două tipuri de godeuri în testele HTS . Raportul semnal-zgomot (S / N), raportul semnal-fundal (S / B) și factorul Z au fost adoptate pentru a evalua calitatea testelor HTS prin compararea a două tipuri de puțuri investigate. Cu toate acestea, S / B nu ia în considerare nicio informație privind variabilitatea; iar S / N poate capta variabilitatea doar într-un singur grup și, prin urmare, nu poate evalua calitatea testului atunci când cele două grupuri au variabilități diferite. Zhang JH și colab. a propus Z-factor . Avantajul factorului Z față de S / N și S / B este că ia în considerare variabilitățile în ambele grupuri comparate. Ca rezultat, factorul Z a fost utilizat pe scară largă ca metrică QC în testele HTS. Semnul absolut din factorul Z face incomod să se deducă din punct de vedere matematic inferența sa statistică.

Pentru a obține un parametru mai interpretabil pentru măsurarea diferențierii între două grupuri, Zhang XHD a propus SSMD pentru a evalua diferențierea dintre un control pozitiv și un control negativ în testele HTS. SSMD are o bază probabilistică datorită legăturii sale puternice cu probabilitatea d + (adică probabilitatea ca diferența dintre două grupuri să fie pozitivă). Într-o oarecare măsură, d + -probabilitatea este echivalentă cu indicele probabilistic bine stabilit P ( X  >  Y ) care a fost studiat și aplicat în multe domenii. Susținut pe baza sa probabilistică, SSMD a fost utilizat atât pentru controlul calității, cât și pentru selecția hit-urilor în screening-ul de mare viteză.

Concept

Parametru statistic

Ca parametru statistic, SSMD (notat ca ) este definit ca raportul dintre deviația medie și standard a diferenței dintre două valori aleatorii, respectiv din două grupuri. Să presupunem că un grup cu valori aleatorii are medie și varianță, iar un alt grup are medie și varianță . Covarianța între cele două grupuri este Apoi, SSMD pentru compararea acestor două grupuri este definit ca

Dacă cele două grupuri sunt independente,

Dacă cele două grupuri independente au varianțe egale ,

În situația în care cele două grupuri sunt corelate, o strategie utilizată în mod obișnuit pentru a evita calculul este mai întâi obținerea observațiilor pereche de la cele două grupuri și apoi estimarea SSMD pe baza observațiilor pereche. Pe baza unei diferențe asociate cu media populației și , SSMD este

Estimarea statistică

În situația în care cele două grupuri sunt independente, Zhang XHD a obținut estimarea maximă a probabilității (MLE) și metoda de moment (MM) a SSMD. Să presupunem că grupurile 1 și 2 au media eșantionului și variațiile eșantionului . Estimarea MM a SSMD este atunci

Când cele două grupuri au distribuții normale cu varianță egală , varianța minimă uniformă estimare imparțială (UMVUE) a SSMD este,

unde sunt dimensiunile eșantionului în cele două grupuri și .

În situația în care cele două grupuri sunt corelate, pe baza unei diferențe asociate cu dimensiunea eșantionului, media eșantionului și varianța eșantionului , estimarea MM a SSMD este

Estimarea UMVUE a SSMD este

SSMD arată similar cu statisticile t și ale lui Cohen, dar acestea sunt diferite între ele, așa cum se ilustrează în.

Aplicare în teste de screening de mare viteză

SSMD este raportul dintre medie și abaterea standard a diferenței dintre două grupuri. Atunci când datele sunt preprocesate folosind transformarea jurnalului, așa cum facem în mod normal în experimentele HTS, SSMD este media schimbării jurnalului împărțită la abaterea standard a modificării jurnalului în raport cu o referință negativă. Cu alte cuvinte, SSMD este modificarea medie a pliurilor (pe scara jurnalului) penalizată de variabilitatea schimbării pliurilor (pe scara jurnalului). Pentru controlul calității, un indice pentru calitatea unui test HTS este magnitudinea diferenței dintre un control pozitiv și o referință negativă într-o placă de testare . Pentru selectarea loviturilor, dimensiunea efectelor unui compus (adică, o moleculă mică sau un ARNsi ) este reprezentată de magnitudinea diferenței dintre compus și o referință negativă. SSMD măsoară direct magnitudinea diferenței dintre două grupuri. Prin urmare, SSMD poate fi utilizat atât pentru controlul calității, cât și pentru selectarea hiturilor în experimentele HTS.

Control de calitate

Numărul de godeuri pentru controalele pozitive și negative dintr-o placă în platforma 384-godeuri sau 1536-godeuri este în mod normal proiectat să fie rezonabil de mare. Să presupunem că controalele pozitive și negative dintr-o placă au media eșantionului , variațiile eșantionului și dimensiunile eșantionului . De obicei, presupune că controalele au varianță egală într-o placă. Într-un astfel de caz, SSMD pentru evaluarea calității în placa respectivă este estimat ca

unde . Atunci când presupunerea unei varianțe egale nu se menține, SSMD pentru evaluarea calității în placa respectivă este estimat ca

Dacă există în mod clar valori aberante în controale, SSMD poate fi estimat ca

unde sunt medianele și deviațiile absolute mediane în controalele pozitive și, respectiv, negative.

Z-factor Criteriul QC bazat este popular folosit în HTS teste. Cu toate acestea, s-a demonstrat că acest criteriu QC este cel mai potrivit pentru un test cu controale pozitive foarte sau extrem de puternice. Într-un test RNAi HTS, un control pozitiv puternic sau moderat este de obicei mai instructiv decât un control pozitiv foarte sau extrem de puternic, deoarece eficacitatea acestui control este mai similară cu rezultatele de interes. În plus, controalele pozitive din cele două experimente HTS au teoretic diferite dimensiuni de efecte. În consecință, pragurile QC pentru controlul moderat ar trebui să fie diferite de cele pentru controlul puternic din aceste două experimente. Mai mult, este comun ca două sau mai multe controale pozitive să fie adoptate într-un singur experiment. Aplicarea acelorași criterii QC bazate pe factorul Z la ambele controale duce la rezultate inconsistente așa cum este ilustrat în literatură.

Criteriile QC bazate pe SSMD enumerate în tabelul următor iau în considerare dimensiunea efectului unui control pozitiv într-un test HTS în care controlul pozitiv (cum ar fi un control de inhibare) are teoretic valori mai mici decât referința negativă.

Tipul de calitate A: Control moderat B: Control puternic C: Control foarte puternic D: Control extrem de puternic
Excelent
Bun
Inferior
Sarac

În aplicație, dacă dimensiunea efectului unui control pozitiv este cunoscută biologic, adoptați criteriul corespunzător pe baza acestui tabel. În caz contrar, următoarea strategie ar trebui să ajute la determinarea criteriului QC care trebuie aplicat: (i) în multe teste HTS cu molecule mici, cu un control pozitiv, de obicei ar trebui adoptat criteriul D (și, ocazional, criteriul C), deoarece acest control are de obicei foarte sau extrem efecte puternice; (ii) pentru testele RNAi HTS în care viabilitatea celulară este răspunsul măsurat, criteriul D ar trebui adoptat pentru controalele fără celule (și anume, godeurile fără celule adăugate) sau controale de fond; (iii) într-un test viral în care cantitatea de viruși din celulele gazdă este interesantă, criteriul C este de obicei utilizat, iar criteriul D este folosit ocazional pentru controlul pozitiv constând din ARNsi de la virus.

Criterii similare QC bazate pe SSMD pot fi construite pentru un test HTS în care controlul pozitiv (cum ar fi un control de activare) are teoretic valori mai mari decât referința negativă. Mai multe detalii despre modul de aplicare a criteriilor QC bazate pe SSMD în experimentele HTS pot fi găsite într-o carte.

Selectați lovitura

Într-un test HTS, un obiectiv principal este de a selecta compuși cu dimensiunea dorită de inhibare sau efect de activare. Mărimea efectului compus este reprezentată de magnitudinea diferenței dintre un compus testat și un grup de referință negativ fără efecte de inhibare / activare specifice. Un compus cu dimensiunea dorită a efectelor într-un ecran HTS se numește hit. Procesul de selectare a accesărilor se numește selecție de accesări. Există două strategii principale de selectare a hiturilor cu efecte mari. Una este să folosiți anumite metrici pentru a clasifica și / sau clasifica compușii după efectele lor și apoi pentru a selecta cel mai mare număr de compuși puternici , care este practic pentru testele de validare . Cealaltă strategie este de a testa dacă un compus are efecte suficient de puternice pentru a atinge un nivel prestabilit. În această strategie, ratele fals negative (FNR) și / sau ratele fals pozitive (FPR) trebuie controlate.

SSMD nu numai că poate clasifica dimensiunea efectelor, ci și clasifica efectele așa cum se arată în tabelul următor pe baza valorii populației ( ) SSMD.

Subtipul efectului Praguri pentru SSMD negative Praguri pentru SSMD pozitive
Extrem de puternic
Foarte puternic
Puternic
Destul de puternic
Moderat
Destul de moderat
Destul de slab
Slab
Foarte slab
Foarte slab
Fara efect

Estimarea SSMD pentru ecrane fără replici diferă de cea pentru ecrane cu replici.

Într-un ecran primar fără replici, presupunând că valoarea măsurată (de obicei pe scara logului) într-un puț pentru un compus testat este și referința negativă în acea placă are dimensiunea eșantionului , media eșantionului , mediana , deviația standard și deviația absolută mediană , SSMD pentru acest compus este estimat ca

unde . Când există valori aberante într-un test care este de obicei comun în experimentele HTS, o versiune robustă a SSMD poate fi obținută folosind

Într-un ecran de confirmare sau primar cu replici, pentru al i-lea compus de test cu replici, calculăm diferența asociată între valoarea măsurată (de obicei pe scara log) a compusului și valoarea mediană a unui control negativ într-o placă, apoi obțineți media și varianța diferenței asociate între replici. SSMD pentru acest compus este estimat ca

În multe cazuri, oamenii de știință pot utiliza atât SSMD, cât și modificarea medie a pliurilor pentru selectarea loviturilor în experimentele HTS. Graficul cu lanternă dublă poate afișa atât modificarea medie a pliurilor, cât și SSMD pentru toți compușii de testare într-un test și poate ajuta la integrarea acestora pentru a selecta accesările în experimentele HTS. Utilizarea SSMD pentru selectarea hiturilor în experimentele HTS este ilustrată pas cu pas

Vezi si

Lecturi suplimentare

Referințe