Folding @ home - Folding@home

Pliant @ acasă
FAH Logo.svg
Autori originali Vijay Pande
Dezvoltatori Laboratorul Pande, Sony , Nvidia , ATI Technologies, Joseph Coffland, Cauldron Development
Eliberarea inițială 1 octombrie 2000 ; Acum 21 de ani ( 01.01.2000 )
Versiune stabila
7.6.21 / 23 octombrie 2020 ; Acum 11 luni ( 23-10-2020 )
Sistem de operare Microsoft Windows , macOS , Linux , PlayStation 3 (întrerupt de la versiunea de firmware 4.30)
Platformă IA-32 , x86-64
Disponibil in Engleză
Tip Calcul distribuit
Licență Software proprietar
Site-ul web foldingathome .org

Folding @ home ( FAH sau F @ h ) este un proiect de calcul distribuit menit să ajute oamenii de știință să dezvolte noi terapii pentru o varietate de boli prin simularea dinamicii proteinelor. Aceasta include procesul de pliere a proteinelor și mișcările proteinelor și se bazează pe simulări rulate pe computerele personale ale voluntarilor. Folding @ home se află în prezent la Universitatea Washington din St. Louis și este condus de Greg Bowman, fost student al lui Vijay Pande .

Proiectul utilizează unități de procesare grafică (GPU), unități centrale de procesare (procesoare) și procesoare ARM precum cele de pe Raspberry Pi pentru calcul distribuit și cercetare științifică. Proiectul utilizează o metodologie de simulare statistică , care este o schimbare de paradigmă de la metodele tradiționale de calcul. Ca parte a arhitecturii de rețea model client-server , mașinile voluntare primesc fiecare bucăți dintr-o simulare (unități de lucru), le completează și le returnează în serverele de baze de date ale proiectului , unde unitățile sunt compilate într-o simulare generală. Voluntarii își pot urmări contribuțiile pe site-ul web Folding @ home, ceea ce face participarea voluntarilor competitivă și încurajează implicarea pe termen lung.

Folding @ home este unul dintre cele mai rapide sisteme de calcul din lume. Cu un interes sporit pentru proiect ca urmare a pandemiei COVID-19 , sistemul a atins o viteză de aproximativ 1,22 exaflops până la sfârșitul lunii martie 2020 și a atins 2,43 exaflops până la 12 aprilie 2020, făcându-l primul sistem de calcul exaflop din lume . Acest nivel de performanță din rețeaua sa de calcul pe scară largă le-a permis cercetătorilor să ruleze simulări costisitoare , la nivel atomic, de pliere a proteinelor de mii de ori mai mult decât se obținuse anterior. De la lansarea sa pe 1 octombrie 2000, Pande Lab a produs 225 de lucrări de cercetare științifică ca rezultat direct al Folding @ home. Rezultatele simulărilor proiectului sunt de acord cu experimentele.

fundal

O proteină înainte și după pliere. Începe într-o stare instabilă a bobinei aleatorii și se termină în conformitate cu starea sa nativă.

Proteinele sunt o componentă esențială pentru multe funcții biologice și participă practic la toate procesele din celulele biologice . Acestea acționează adesea ca enzime , efectuând reacții biochimice, inclusiv semnalizarea celulară , transportul molecular și reglarea celulară . Ca elemente structurale, unele proteine ​​acționează ca un tip de schelet pentru celule și ca anticorpi , în timp ce alte proteine ​​participă la sistemul imunitar . Înainte ca o proteină să își asume aceste roluri, trebuie să se plieze într-o structură funcțională tridimensională , un proces care apare adesea spontan și este dependent de interacțiunile din secvența sa de aminoacizi și de interacțiunile aminoacizilor cu mediul înconjurător. Plierea proteinelor este condusă de căutarea pentru a găsi cea mai favorabilă conformație energetică a proteinei, adică starea sa nativă . Astfel, înțelegerea plierii proteinelor este esențială pentru a înțelege ce face și cum funcționează o proteină și este considerată un sfânt graal al biologiei computaționale . În ciuda plierii care apar într-un mediu celular aglomerat , de obicei se desfășoară fără probleme. Cu toate acestea, din cauza proprietăților chimice a proteinelor sau a altor factori, proteine pot misfold , adică, pliați calea greșită și sfârșesc diform. Cu excepția cazului în care mecanismele celulare pot distruge sau reîntoarce proteinele pliate greșit, ele se pot agrega ulterior și pot provoca o varietate de boli debilitante. Experimentele de laborator care studiază aceste procese pot fi limitate în domeniul de aplicare și în detaliile atomice, determinându-i pe oamenii de știință să utilizeze modele de calcul bazate pe fizică care, atunci când completează experimentele, încearcă să ofere o imagine mai completă a plierii proteinelor, a plierii greșite și a agregării.

Datorită complexității conformației sau spațiului de configurație a proteinelor (setul de forme posibile pe care le poate lua o proteină) și limitelor în puterea de calcul, simulările dinamicii moleculare ale tuturor atomilor au fost sever limitate în intervalele de timp pe care le pot studia. În timp ce majoritatea proteinelor se pliază în mod obișnuit în ordinea milisecundelor, înainte de 2010, simulările ar putea ajunge doar la nanosecunde până la microsecunde. Supercalculatoarele cu scop general au fost folosite pentru a simula plierea proteinelor, dar astfel de sisteme sunt intrinsec costisitoare și de obicei împărțite între multe grupuri de cercetare. Mai mult, deoarece calculele din modelele cinetice au loc în serie, scalarea puternică a simulărilor moleculare tradiționale la aceste arhitecturi este extrem de dificilă. Mai mult, deoarece plierea proteinelor este un proces stocastic (adică aleatoriu) și poate varia statistic în timp, este o provocare din punct de vedere computerizat să folosim simulări lungi pentru vederi cuprinzătoare ale procesului de pliere.

Folding @ home folosește modele de stare Markov , precum cea diagramată aici, pentru a modela posibilele forme și căi de pliere pe care le poate lua o proteină pe măsură ce se condensează din starea inițială înfășurată aleatoriu (stânga) în structura sa nativă 3-D (dreapta).

Plierea proteinelor nu are loc într-un singur pas. În schimb, proteinele își petrec cea mai mare parte a timpului de pliere, aproape 96% în unele cazuri, așteptând în diferite stări conformaționale intermediare , fiecare cu un minim de energie liberă termodinamică locală în peisajul energetic al proteinei . Printr-un proces cunoscut sub numele de eșantionare adaptivă , aceste conformații sunt utilizate de Folding @ home ca puncte de plecare pentru un set de traiectorii de simulare. Pe măsură ce simulările descoperă mai multe conformații, traiectoriile sunt repornite de la acestea și un model de stare Markov (MSM) este creat treptat din acest proces ciclic. MSM-urile sunt modele de ecuații master în timp discret care descriu peisajul conformațional și energetic al unei biomolecule ca un set de structuri distincte și tranzițiile scurte dintre ele. Eșantionarea adaptivă a metodei modelului de stare Markov crește semnificativ eficiența simulației, deoarece evită calculul în interiorul minimului de energie locală în sine și este susceptibilă de calcul distribuit (inclusiv pe GPUGRID ), deoarece permite agregarea statistică a traiectoriilor de simulare scurte și independente. Timpul necesar pentru construirea unui model de stare Markov este invers proporțional cu numărul de simulări paralele rulate, adică cu numărul de procesoare disponibile. Cu alte cuvinte, realizează paralelizare liniară , ducând la o reducere de aproximativ patru ordine de mărime a timpului total de calcul serial. Un MSM completat poate conține zeci de mii de stări de probă din spațiul de fază al proteinei (toate conformațiile pe care le poate lua o proteină) și tranzițiile dintre ele. Modelul ilustrează evenimente și căi pliabile (de exemplu, rute), iar cercetătorii pot utiliza ulterior clusterizarea cinetică pentru a vizualiza o reprezentare cu granulație grosieră a modelului altfel foarte detaliat. Ei pot folosi aceste MSM pentru a dezvălui modul în care proteinele se pliază greșit și pentru a compara cantitativ simulările cu experimentele.

Între 2000 și 2010, lungimea studiată a proteinelor Folding @ home a crescut cu un factor de patru, în timp ce intervalele sale de timp pentru simulările de pliere a proteinelor au crescut cu șase ordine de mărime. În 2002, Folding @ home a folosit modele de stare Markov pentru a finaliza aproximativ un milion de zile CPU de simulări pe o perioadă de câteva luni, iar în 2011, MSM-urile au paralelizat o altă simulare care a necesitat 10 milioane de ore de procesare agregate. În ianuarie 2010, Folding @ home a folosit MSM-uri pentru a simula dinamica proteinei NTL9 cu 32 de reziduuri de pliere lentă până la 1,52 milisecunde, o scară de timp în concordanță cu previziunile experimentale ale ratei de pliere, dar de o mie de ori mai lungă decât cea realizată anterior. Modelul a constat din mai multe traiectorii individuale, fiecare cu două ordine de mărime mai scurte, și a oferit un nivel de detaliu fără precedent în peisajul energetic al proteinei. În 2010, cercetătorul Folding @ home, Gregory Bowman, a primit premiul Thomas Kuhn Paradigm Shift Award de la American Chemical Society pentru dezvoltarea software-ului open-source MSMBuilder și pentru obținerea unui acord cantitativ între teorie și experiment. Pentru munca sa, Pande a fost distins cu Premiul Michael și Kate Bárány 2012 pentru tineri investigatori pentru "dezvoltarea metodelor de calcul care definesc câmpul și schimbă câmpul pentru a produce modele teoretice de lider pentru plierea proteinelor și ARN-ului ", precum și pentru premiul Irving Sigal pentru tineri investigatori din 2006 pentru rezultatele sale de simulare care „au stimulat o reexaminare a semnificației atât a ansamblului, cât și a măsurătorilor cu o singură moleculă, făcând eforturile lui Pande o contribuție pionieră la metodologia de simulare”.

Exemple de aplicare în cercetarea biomedicală

Plasarea greșită a proteinelor poate duce la o varietate de boli, inclusiv boala Alzheimer, cancerul , boala Creutzfeldt-Jakob , fibroza chistică , boala Huntington, anemia falciformă și diabetul de tip II . Infecția celulară de viruși precum HIV și gripa implică, de asemenea, evenimente de pliere pe membranele celulare . Odată ce defectarea proteinelor este mai bine înțeleasă, pot fi dezvoltate terapii care sporesc capacitatea naturală a celulelor de a regla plierea proteinelor. Astfel de terapii includ utilizarea de molecule proiectate pentru a modifica producția unei proteine ​​date, pentru a ajuta la distrugerea unei proteine ​​pliate greșit sau pentru a ajuta la procesul de pliere. Combinația dintre modelarea moleculară de calcul și analiza experimentală are posibilitatea de a modela fundamental viitorul medicinei moleculare și proiectarea rațională a terapeuticii , cum ar fi accelerarea și scăderea costurilor de descoperire a medicamentelor . Scopul primilor cinci ani de Folding @ home a fost de a face progrese în înțelegerea plierii, în timp ce obiectivul actual este de a înțelege plierea greșită și bolile conexe, în special Alzheimer.

Simulările rulate pe Folding @ home sunt utilizate împreună cu experimente de laborator, dar cercetătorii le pot folosi pentru a studia modul în care plierea in vitro diferă de plierea în mediile celulare native. Acest lucru este avantajos în studierea aspectelor legate de pliere, plierea greșită și relațiile lor cu bolile care sunt dificil de observat experimental. De exemplu, în 2011, Folding @ home a simulat plierea proteinelor în interiorul unui tunel de ieșire ribozomal , pentru a ajuta oamenii de știință să înțeleagă mai bine modul în care închiderea naturală și aglomerarea ar putea influența procesul de pliere. Mai mult, oamenii de știință folosesc de obicei denaturanți chimici pentru a dezvolta proteinele din starea lor nativă stabilă. În general nu se știe cum denaturantul afectează replierea proteinei și este dificil să se determine experimental dacă aceste stări denaturate conțin structuri reziduale care pot influența comportamentul de pliere. În 2010, Folding @ home a folosit GPU-uri pentru a simula stările derulate ale proteinei L și și-a prezis rata de colaps în acord puternic cu rezultatele experimentale.

Seturile mari de date din proiect sunt disponibile gratuit pentru alți cercetători, la cerere, iar unele pot fi accesate de pe site-ul web Folding @ home. Laboratorul Pande a colaborat cu alte sisteme de dinamică moleculară, cum ar fi supercomputerul Blue Gene , și partajează software-ul cheie Folding @ home cu alți cercetători, astfel încât algoritmii care au beneficiat Folding @ home pot ajuta alte domenii științifice. În 2011, au lansat software-ul Copernicus open-source, care se bazează pe MSM-ul Folding @ home și alte metode de paralelizare și are ca scop îmbunătățirea eficienței și scalării simulărilor moleculare pe clustere sau supercalculatoare mari de computere . Rezumate ale tuturor descoperirilor științifice de la Folding @ home sunt postate pe site-ul web Folding @ home după publicare.

Boala Alzheimer

Boala Alzheimer este legată de agregarea fragmentelor de proteine ​​beta amiloide din creier (dreapta). Cercetătorii au folosit Folding @ home pentru a simula acest proces de agregare, pentru a înțelege mai bine cauza bolii.

Boala Alzheimer este o boală neurodegenerativă incurabilă care afectează cel mai adesea vârstnicii și reprezintă mai mult de jumătate din toate cazurile de demență . Cauza exactă a acesteia rămâne necunoscută, dar boala este identificată ca o boală care se pliază greșit de proteine . Alzheimerul este asociat cu agregări toxice ale peptidei beta amiloid (Aβ) , cauzate de Aβ care se pliază greșit și se aglomerează împreună cu alte peptide Aβ. Aceste agregate Aβ cresc apoi în plăci senile semnificativ mai mari , un marker patologic al bolii Alzheimer. Datorită naturii eterogene a acestor agregate, metodele experimentale precum cristalografia cu raze X și rezonanța magnetică nucleară (RMN) au avut dificultăți în caracterizarea structurilor lor. Mai mult, simulările atomice ale agregării Aβ sunt extrem de solicitante din punct de vedere calculatic datorită dimensiunii și complexității lor.

Prevenirea agregării Aβ este o metodă promițătoare pentru dezvoltarea medicamentelor terapeutice pentru boala Alzheimer, potrivit Naeem și Fazili într-un articol de revizuire a literaturii . În 2008, Folding @ home a simulat dinamica agregării Aβ în detalii atomice pe scări temporale de ordinul a zeci de secunde. Studiile anterioare au putut să simuleze doar aproximativ 10 microsecunde. Folding @ home a reușit să simuleze plierea Aβ cu șase ordine de mărime mai lungi decât era posibil anterior. Cercetătorii au folosit rezultatele acestui studiu pentru a identifica un ac de păr beta care a fost o sursă majoră de interacțiuni moleculare în cadrul structurii. Studiul a ajutat la pregătirea laboratorului Pande pentru viitoarele studii de agregare și pentru cercetări suplimentare pentru a găsi o peptidă mică care poate stabiliza procesul de agregare.

În decembrie 2008, Folding @ home a găsit mai mulți candidați mici, care par să inhibe toxicitatea agregatelor Aβ. În 2010, în strânsă cooperare cu Centrul pentru Mașini de Pliat Proteine, aceste componente medicamentoase au început să fie testate pe țesut biologic . În 2011, Folding @ home a realizat simulări ale mai multor mutații ale Aβ care par să stabilizeze formarea agregatului, ceea ce ar putea ajuta la dezvoltarea terapiilor medicamentoase terapeutice pentru boală și ar ajuta foarte mult cu studii experimentale de spectroscopie de rezonanță magnetică nucleară ale oligomerilor Aβ . Mai târziu în acel an, Folding @ home a început simulări ale diferitelor fragmente Aβ pentru a determina modul în care diferite enzime naturale afectează structura și plierea Aβ.

Boala Huntington

Boala Huntington este o tulburare genetică neurodegenerativă care este asociată cu greșirea și agregarea proteinelor. Repetările excesive ale aminoacidului glutaminic la capătul N-terminal al proteinei huntin provoacă agregare și, deși comportamentul repetărilor nu este complet înțeles, acesta duce la declinul cognitiv asociat bolii. Ca și în cazul altor agregate, există dificultăți în determinarea experimentală a structurii sale. Oamenii de știință folosesc Folding @ home pentru a studia structura agregatului de proteine ​​hunttin și pentru a prezice modul în care se formează, ajutând cu metode raționale de proiectare a medicamentelor pentru a opri formarea agregatului. Fragmentul N17 al proteinei hunttin accelerează această agregare și, deși au fost propuse mai multe mecanisme, rolul său exact în acest proces rămâne în mare parte necunoscut. Folding @ home a simulat aceasta și alte fragmente pentru a clarifica rolul lor în boală. Din 2008, metodele sale de proiectare a medicamentelor pentru boala Alzheimer au fost aplicate la Huntington.

Cancer

Mai mult de jumătate din toate cazurile de cancer cunoscute implică mutații ale p53 , o proteină supresoare tumorală prezentă în fiecare celulă care reglează ciclul celular și semnalează moartea celulei în cazul deteriorării ADN-ului . Mutațiile specifice din p53 pot perturba aceste funcții, permițând unei celule anormale să crească în continuare necontrolat, rezultând dezvoltarea tumorilor . Analiza acestor mutații ajută la explicarea cauzelor profunde ale cancerelor legate de p53. În 2004, Folding @ home a fost utilizat pentru a efectua primul studiu de dinamică moleculară a replierii dimerului proteic al p53 într-o simulare a întregului atom de apă . Rezultatele simulării au fost de acord cu observațiile experimentale și au oferit informații despre replierea dimerului care anterior nu era de obținut. Aceasta a fost prima publicație revizuită de colegi despre cancer dintr-un proiect de calcul distribuit. În anul următor, Folding @ home a alimentat o nouă metodă de identificare a aminoacizilor esențiali pentru stabilitatea unei proteine ​​date, care a fost apoi utilizată pentru a studia mutațiile p53. Metoda a avut un succes rezonabil în identificarea mutațiilor care promovează cancerul și a determinat efectele mutațiilor specifice care altfel nu ar putea fi măsurate experimental.

Folding @ home este, de asemenea, utilizat pentru a studia chaperone proteice , proteine ​​de șoc termic care joacă roluri esențiale în supraviețuirea celulelor, ajutând la plierea altor proteine ​​în mediul aglomerat și stresant din punct de vedere chimic din interiorul unei celule. Celulele canceroase cu creștere rapidă se bazează pe chaperone specifice, iar unele chaperone joacă roluri cheie în rezistența la chimioterapie . Inhibițiile la acești chaperoni specifici sunt văzuți ca potențiale moduri de acțiune pentru medicamente eficiente pentru chimioterapie sau pentru reducerea răspândirii cancerului. Folosind Folding @ home și colaborând îndeaproape cu Centrul pentru Mașini de pliere a proteinelor, laboratorul Pande speră să găsească un medicament care să inhibe acele șaperone implicate în celulele canceroase. Cercetatorii sunt , de asemenea , folosind Folding @ home pentru a studia alte molecule legate de cancer, cum ar fi enzima Src kinaza , și unele forme ale Engrailed homeodomeniu : o proteină mare , care poate fi implicat în multe boli, inclusiv cancerul. În 2011, Folding @ home a început simulări ale dinamicii proteinei mici de nod EETI, care poate identifica carcinoamele în scanările imagistice prin legarea la receptorii de suprafață ai celulelor canceroase.

Interleukina 2 (IL-2) este o proteină care ajută celulele T ale sistemului imunitar să atace agenții patogeni și tumorile. Cu toate acestea, utilizarea sa ca tratament pentru cancer este restricționată din cauza efectelor secundare grave, cum ar fi edemul pulmonar . IL-2 se leagă de aceste celule pulmonare diferit de celulele T, astfel că cercetarea IL-2 implică înțelegerea diferențelor dintre aceste mecanisme de legare. În 2012, Folding @ home a asistat la descoperirea unei forme mutante de IL-2, care este de trei sute de ori mai eficientă în rolul său de sistem imunitar, dar care are mai puține efecte secundare. În experimente, această formă modificată a depășit semnificativ IL-2 natural în împiedicarea creșterii tumorii. Companiile farmaceutice și- au exprimat interesul pentru molecula mutantă, iar Institutele Naționale de Sănătate o testează pe o mare varietate de modele tumorale pentru a încerca să accelereze dezvoltarea acesteia ca terapeutică.

Osteogenesis imperfecta

Osteogeneza imperfectă , cunoscută sub numele de boală osoasă fragilă, este o afecțiune genetică incurabilă, care poate fi letală. Cei cu boala nu sunt capabili să facă țesut osos conjunctiv funcțional. Acest lucru se datorează cel mai frecvent unei mutații a colagenului de tip I , care îndeplinește o varietate de roluri structurale și este cea mai abundentă proteină la mamifere . Mutația provoacă o deformare a structurii triple helix a colagenului , care, dacă nu este distrusă în mod natural, duce la țesutul osos anormal și slăbit. În 2005, Folding @ home a testat o nouă metodă mecanică cuantică care s-a îmbunătățit cu metodele de simulare anterioare și care poate fi utilă pentru viitoarele studii de calcul ale colagenului. Deși cercetătorii au folosit Folding @ home pentru a studia plierea și plierea greșită a colagenului, interesul reprezintă un proiect pilot în comparație cu cercetarea Alzheimer și Huntington.

Viruși

Folding @ home sprijină cercetarea pentru prevenirea unor virusuri , precum gripa și HIV , de la recunoașterea și pătrunderea celulelor biologice . În 2011, Folding @ home a început simulări ale dinamicii enzimei RNase H , o componentă cheie a HIV, pentru a încerca să proiecteze medicamente care să o dezactiveze. Folding @ home a fost, de asemenea, utilizat pentru a studia fuziunea membranelor , un eveniment esențial pentru infecția virală și o gamă largă de funcții biologice. Această fuziune implică modificări conformaționale ale proteinelor de fuziune virală și ale andocării proteinelor , dar mecanismele moleculare exacte din spatele fuziunii rămân în mare parte necunoscute. Evenimentele de fuziune pot consta din peste o jumătate de milion de atomi care interacționează pentru sute de microsecunde. Această complexitate limitează simulările tipice pe computer la aproximativ zece mii de atomi peste zeci de nanosecunde: o diferență de mai multe ordine de mărime. Dezvoltarea de modele pentru a prezice mecanismele de fuziune a membranei va ajuta la înțelegerea științifică a modului de a viza procesul cu medicamente antivirale. În 2006, oamenii de știință au aplicat modelele de stat Markov și rețeaua Folding @ home pentru a descoperi două căi de fuziune și pentru a obține alte perspective mecaniciste.

În urma simulărilor detaliate de la Folding @ home a celulelor mici cunoscute sub numele de vezicule , în 2007, laboratorul Pande a introdus o nouă metodă de calcul pentru a măsura topologia modificărilor sale structurale în timpul fuziunii. În 2009, cercetătorii au folosit Folding @ home pentru a studia mutațiile hemaglutininei gripale , o proteină care atașează un virus la celula gazdă și ajută la intrarea virală. Mutațiile hemaglutininei afectează cât de bine se leagă proteina de moleculele receptorilor de pe suprafața celulei unei gazde , ceea ce determină cât de infectă este tulpina virusului de organismul gazdă. Cunoașterea efectelor mutațiilor hemaglutininei ajută la dezvoltarea medicamentelor antivirale . Începând din 2012, Folding @ home continuă să simuleze plierea și interacțiunile hemaglutininei, completând studiile experimentale de la Universitatea din Virginia .

În martie 2020, Folding @ home a lansat un program de asistare a cercetătorilor din întreaga lume care lucrează la găsirea unui remediu și aflând mai multe despre pandemia de coronavirus . Valul inițial de proiecte simulează ținte proteice potențial drogabile din virusul SARS-CoV-2 și virusul SARS-CoV aferent, despre care există semnificativ mai multe date disponibile.

Proiectarea medicamentelor

Medicamentele funcționează prin legarea la locații specifice pe moleculele țintă și provocând unele modificări dorite, cum ar fi dezactivarea unei ținte sau provocarea unei modificări conformaționale . În mod ideal, un medicament ar trebui să acționeze foarte specific și să se lege numai de ținta sa, fără a interfera cu alte funcții biologice. Cu toate acestea, este dificil să se determine cu precizie unde și cât de strâns se vor lega două molecule. Datorită limitelor puterii de calcul, metodele curente in silico trebuie să schimbe viteza pentru precizie ; de exemplu, utilizați metode rapide de andocare a proteinelor în loc de calcule costisitoare ale energiei libere . Performanța de calcul Folding @ home permite cercetătorilor să utilizeze ambele metode și să le evalueze eficiența și fiabilitatea. Proiectarea medicamentelor asistată de computer are potențialul de a accelera și de a reduce costurile descoperirii medicamentelor. In 2010, Folding @ home utilizat MSMS și calcule energetice libere pentru a prezice starea nativă a villin proteinei în intervalul 1,8 angstromi (Â) deviație pătratică medie (Rmsd) din structura cristalină determinată experimental prin cristalografie cu raze X . Această acuratețe are implicații asupra viitoarelor metode de predicție a structurii proteinelor , inclusiv pentru proteinele intrinsec nestructurate . Oamenii de știință au folosit Folding @ home pentru a cerceta rezistența la medicamente, studiind vancomicina , un antibiotic de ultimă instanță și beta-lactamaza , o proteină care poate descompune antibioticele precum penicilina .

Activitatea chimică are loc de-a lungul sitului activ al unei proteine . Metodele tradiționale de proiectare a medicamentelor implică legarea strânsă de acest site și blocarea activității acestuia, în ipoteza că proteina țintă există într-o structură rigidă. Cu toate acestea, această abordare funcționează pentru aproximativ doar 15% din toate proteinele. Proteinele conțin situsuri alosterice care, atunci când sunt legate de molecule mici, pot modifica conformația unei proteine ​​și, în cele din urmă, afectează activitatea proteinei. Aceste site-uri sunt ținte atractive pentru droguri, dar localizarea acestora este foarte costisitoare din punct de vedere al calculului . În 2012, Folding @ home și MSMS au fost folosite pentru a identifica site - urile alosterice in trei proteine relevante medical: beta-lactamază, interleukina-2 și H RNază .

Aproximativ jumătate din toate antibioticele cunoscute interferează cu funcționarea ribozomului unei bacterii , o mașină biochimică mare și complexă care efectuează biosinteza proteinelor prin traducerea ARN - ului mesager în proteine. Antibioticele macrolide înfundă tunelul de ieșire al ribozomului, prevenind sinteza proteinelor bacteriene esențiale. În 2007, laboratorul Pande a primit un grant pentru a studia și proiecta noi antibiotice. În 2008, au folosit Folding @ home pentru a studia interiorul acestui tunel și modul în care moleculele specifice îl pot afecta. Structura completă a ribozomului a fost determinată abia din 2011, iar Folding @ home a simulat și proteine ​​ribozomale , deoarece multe dintre funcțiile lor rămân în mare parte necunoscute.

Aplicații potențiale în cercetarea biomedicală

Există mult mai multe boli promovate prin plierea greșită a proteinelor , care pot fi benefice de Folding @ home, fie pentru a discerne structura proteinei pliate greșit, fie pentru cinetica plierii greșite și pentru a ajuta la proiectarea medicamentelor în viitor. Bolile prionice adesea fatale sunt printre cele mai semnificative.

Bolile prionice

Un prion (PrP) este o proteină celulară transmembranară care se găsește pe scară largă în celulele eucariote . La mamifere, este mai abundentă în sistemul nervos central . Deși funcția sa este necunoscută, conservarea sa ridicată în rândul speciilor indică un rol important în funcția celulară. Schimbarea conformațională de la proteina prionică normală (PrPc, înseamnă celular) la boala cauzatoare de izoformă PrPSc (înseamnă boala protionică prionică - scrapie ) provoacă o serie de boli cunoscute colectiv sub numele de encefalopatii spongiforme transmisibile (EST), inclusiv encefalopatia spongiformă bovină ( ESB) la bovine, boala Creutzfeldt-Jakob (CJD) și insomnie fatală la boala umană, cu risipă cronică (CWD) din familia căprioarelor. Schimbarea conformațională este larg acceptată ca rezultat al plierii greșite a proteinelor . Ceea ce diferențiază EST de alte boli care nu se pliază în proteine ​​este natura sa transmisibilă. „Semănatul” PrPSc infecțios, care apare fie spontan, ereditar sau dobândit prin expunerea la țesuturi contaminate, poate provoca o reacție în lanț de transformare a PrPc normal în agregate de fibrile sau plăci amiloide, cum ar fi plăci, constând din PrPSc.

Structura moleculară a PrPSc nu a fost complet caracterizată datorită naturii sale agregate. Niciunul nu se știe prea multe despre mecanismul de îndoire a proteinelor și nici cinetica acesteia . Folosind structura cunoscută a PrPc și rezultatele studiilor in vitro și in vivo descrise mai jos, Folding @ home ar putea fi valoroasă în elucidarea modului în care se formează PrPSc și modul în care proteina infecțioasă se aranjează pentru a forma fibrile și amiloide ca plăci, ocolind cerința pentru a purifica PrPSc sau a dizolva agregatele.

PrPc a fost enzimatic disociate de membrană și purificată, structura sa studiat folosind tehnici de caracterizare de structură , cum ar fi spectroscopie RMN și cristalografie cu raze X . PrPc post-translațional are 231 aminoacizi (aa) în murin. Molecula constă dintr-o regiune amino terminală lungă și nestructurată care se întinde până la un reziduu 121 și un domeniu terminal carboxi structurat . Acest domeniu globular adăpostește două catene β antiparalele scurte de formare a foilor (aa 128 până la 130 și aa 160 până la 162 în PrPc murin) și trei helice α (helix I: aa 143 până la 153; helix II: aa 171 până la 192 ; helix III: aa 199 până la 226 în PrPc murin), Helices II și III sunt orientate anti-paralel și conectate printr-o buclă scurtă. Stabilitatea lor structurală este susținută de o punte disulfură , care este paralelă cu ambele catene β. Aceste helice α și foaia β formează miezul rigid al domeniului globular al PrPc.

Boala care cauzează PrPSc este rezistentă la proteinază K și insolubilă. Încercările de a-l purifica din creierul animalelor infectate produc invariabil amestecuri eterogene și stări agregate care nu pot fi caracterizate prin spectroscopie RMN sau cristalografie cu raze X. Cu toate acestea, este un consens general că PrPSc conține un procent ridicat de foi β strâns strânse decât PrPc normal care face proteina insolubilă și rezistentă la proteinază. Folosind tehnici de microscopie crioelectronică și modelare structurală bazate pe structuri proteice comune similare, s-a descoperit că PrPSc conține foi ß în regiunea aa 81-95 până la aa 171, în timp ce structura terminală carboxi se presupune că se păstrează, păstrând disulfura- conformație α-elicoidală legată în PrPc normal. Aceste ß-foi formează un paralel beta-stâng paralel. Se crede că trei molecule de PrPSc formează o unitate primară și, prin urmare, constituie baza așa-numitelor fibrile asociate scrapiei. Activitatea catalitică depinde de mărimea particulei. Particulele PrPSc care constau din doar 14-28 molecule PrPc prezintă cea mai mare rată de infectivitate și conversie.

În ciuda dificultății de a purifica și caracteriza PrPSc, din structura moleculară cunoscută a PrPc și folosind șoareci transgenici și ștergerea N-terminală, pot fi deduse potențialele „puncte fierbinți” ale pliării greșite a proteinelor care duc la PrPSc patogen și Folding @ home ar putea fi de mare valoare în confirmarea acestora. Studiile au constatat că atât structura primară, cât și cea secundară a proteinei prionice pot avea o semnificație a conversiei.

Există mai mult de douăzeci de mutații ale genei proteinei prionice ( PRNP ) despre care se știe că sunt asociate sau care sunt direct legate de forma ereditară a EST umane [56], indicând aminoacizi singuri la o anumită poziție, probabil în domeniul carboxi , al PrPc poate afecta susceptibilitatea la EST.

Regiunea amino terminală post-translațională a PrPc constă din reziduurile 23-120 care alcătuiesc aproape jumătate din secvența amino a PrPc maturat pe toată lungimea. Există două secțiuni în regiunea amino terminală care pot influența conversia. În primul rând, reziduurile 52-90 conțin o regiune de repetare a octapeptidelor (de 5 ori) care influențează probabil legarea inițială (prin repetările octapeptidelor) și, de asemenea, conversia efectivă prin a doua secțiune a aa 108-124. AGAAAAGA extrem de hidrofob este situat între resturile 113 și 120 și este descris ca situs de agregare presupus, deși această secvență necesită părțile sale flancante pentru a forma agregate fibrilare.

În domeniul carboxi globular, printre cele trei spirale, studiul a arătat că spirala II are o înclinație semnificativă mai mare la conformația β-catenelor. Datorită flexibilității conformaționale ridicate observată între reziduurile 114-125 (parte a lanțului N-terminal nestructurat) și înclinația ridicată a catenei β a helixului II, doar modificările moderate ale condițiilor de mediu sau ale interacțiunilor ar putea fi suficiente pentru a induce plierea greșită a PrPc și formarea ulterioară a fibrilelor.

Alte studii ale structurilor RMN ale PrPc au arătat că aceste reziduuri (~ 108–189) conțin cea mai mare parte a domeniului pliat, incluzând atât catene β, primele două helice α, cât și regiunile buclă / rotire care le conectează, dar nu și helixul III . Mici modificări în structurile de buclă / rotire ale PrPc în sine ar putea fi importante și în conversie. Într-un alt studiu, Riek și colab. a arătat că cele două regiuni mici ale catenei β în amonte de regiunile de buclă acționează ca un loc de nucleație pentru conversia conformațională a structurilor buclă / rotire și α-elicoidale din PrPc în foaie β.

Pragul energetic pentru conversie nu este neapărat ridicat. Stabilitatea la pliere, adică energia liberă a unei proteine ​​globulare din mediul său este în intervalul uneia sau a două legături de hidrogen , permițând astfel trecerea la o izoformă fără necesitatea unei energii de tranziție ridicate.

Din interacțiunile dintre moleculele de PrPc, interacțiunile hidrofobe joacă un rol crucial în formarea foilor β, un semn distinctiv al PrPSc, deoarece foile aduc fragmente de lanțuri polipeptidice în imediata apropiere. Într-adevăr, Kutznetsov și Rackovsky au arătat că mutațiile care promovează boala în PrPc uman au avut o tendință semnificativă statistic spre creșterea hidrofobicității locale.

Experimentele in vitro au arătat că cinetica plierii greșite are o fază de întârziere inițială urmată de o fază de creștere rapidă a formării fibrilelor. Este probabil ca PrPc să treacă prin unele stări intermediare, cum ar fi cel puțin parțial desfăcute sau degradate, înainte de a ajunge în cele din urmă ca parte a unei fibrile amiloide.

Modele de participare

La fel ca alte proiecte de calcul distribuite , Folding @ home este un proiect online de știință pentru cetățeni . În aceste proiecte, nespecialiștii contribuie cu puterea de procesare a computerului sau ajută la analiza datelor produse de oamenii de știință profesioniști. Participanții primesc puțină recompensă evidentă sau deloc.

S-au efectuat cercetări privind motivațiile cetățenilor de știință și majoritatea acestor studii au constatat că participanții sunt motivați să ia parte din motive altruiste; adică vor să ajute oamenii de știință și să contribuie la avansarea cercetării lor. Mulți participanți la știința cetățenească au un interes subiacent în subiectul cercetării și se îndreaptă spre proiecte care sunt în discipline de interes pentru ei. Folding @ home nu este diferit în această privință. Cercetările efectuate recent asupra a peste 400 de participanți activi au dezvăluit că doreau să contribuie la cercetare și că mulți aveau prieteni sau rude afectate de bolile pe care oamenii de știință Folding @ home le investighează.

Folding @ home atrage participanții care sunt pasionați de hardware de calculator. Aceste grupuri aduc o expertiză considerabilă proiectului și sunt capabili să construiască computere cu o putere de procesare avansată. Alte proiecte de calcul distribuite atrag aceste tipuri de participanți și proiectele sunt adesea folosite pentru a evalua performanța computerelor modificate, iar acest aspect al hobby-ului este acomodat prin natura competitivă a proiectului. Persoanele și echipele pot concura pentru a vedea cine poate procesa cele mai multe unități de procesare a computerului (CPU).

Această ultimă cercetare privind Folding @ home care implică interviu și observație etnografică a grupurilor online a arătat că echipele de entuziaști hardware pot lucra uneori împreună, împărtășind cele mai bune practici în ceea ce privește maximizarea producției de procesare. Astfel de echipe pot deveni comunități de practică , cu o limbă comună și o cultură online. Acest model de participare a fost observat în alte proiecte de calcul distribuite.

O altă observație cheie a participanților la Folding @ home este că mulți sunt bărbați. Acest lucru a fost observat și în alte proiecte distribuite. Mai mult, mulți participanți lucrează în locuri de muncă și cariere bazate pe computer și tehnologie.

Nu toți participanții la Folding @ home sunt pasionați de hardware. Mulți participanți rulează software-ul proiectului pe mașini nemodificate și participă competitiv. Peste 100.000 de participanți sunt implicați în Folding @ home. Cu toate acestea, este dificil să se stabilească ce proporție de participanți sunt pasionați de hardware. Deși, potrivit managerilor de proiect, contribuția comunității entuziaști este substanțial mai mare în ceea ce privește puterea de procesare.

Performanţă

Puterea de calcul a Folding @ home și a celui mai rapid supercomputer din aprilie 2004 până în octombrie 2012. Între iunie 2007 și iunie 2011, Folding @ home (roșu) a depășit performanța celui mai rapid supercomputer Top500 (negru). Cu toate acestea, a fost eclipsat de computerul K în noiembrie 2011 și Blue Gene / Q în iunie 2012.

Performanța FLOPS a supercomputerului este evaluată prin rularea standardului LINPACK . Această testare pe termen scurt are dificultăți în reflectarea corectă a performanței susținute în sarcinile din lumea reală, deoarece LINPACK se mapează mai eficient la hardware-ul supercomputerului. Sistemele de calcul variază în arhitectură și design, astfel încât comparația directă este dificilă. În ciuda acestui fapt, FLOPS rămân metrica principală de viteză utilizată în supercomputere. În schimb, Folding @ home își determină FLOPS-urile folosind timpul ceasului de perete, măsurând cât timp necesită unitățile sale de lucru.

Pe 16 septembrie 2007, datorită în mare parte participării consolelor PlayStation 3, proiectul Folding @ home a atins oficial un nivel de performanță susținut mai mare decât un petaFLOPS nativ , devenind primul sistem de calcul de orice fel care a făcut acest lucru. Cel mai rapid supercomputer Top500 de atunci era BlueGene / L , cu 0,280 petaFLOPS. Anul următor, pe 7 mai 2008, proiectul a atins un nivel de performanță susținut mai mare decât două petaFLOPS native, urmat de cele trei și patru repere petaFLOPS native în august 2008 și, respectiv, 28 septembrie 2008. La 18 februarie 2009, Folding @ home a realizat cinci petaFLOPS native și a fost primul proiect de calcul care a atins aceste cinci niveluri. În comparație, cel mai rapid supercomputer noiembrie 2008 a fost IBM e Roadrunner la 1.105 petaflopi. Pe 10 noiembrie 2011, performanța Folding @ home a depășit șase petaFLOPS native cu echivalentul a aproape opt x86 petaFLOPS. La mijlocul lunii mai 2013, Folding @ home a obținut peste șapte petaFLOPS native, cu echivalentul a 14,87 x86 petaFLOPS. Apoi, a ajuns la opt petaFLOPS native pe 21 iunie, urmat de nouă pe 9 septembrie a acelui an, cu 17,9 x86 petaFLOPS. Pe 11 mai 2016 Folding @ home a anunțat că se îndreaptă spre atingerea marcajului de 100 x86 petaFLOPS.

Utilizarea suplimentară a crescut de la creșterea gradului de conștientizare și participare la proiect în urma pandemiei coronavirusului în 2020. Pe 20 martie 2020 Folding @ home a anunțat prin Twitter că rulează cu peste 470 petaFLOPS native, echivalentul a 958 x86 petaFLOPS. Până pe 25 martie a ajuns la 768 petaFLOPS, sau 1,5 x86 exaFLOPS, făcându-l primul sistem de calcul exaFLOP . Pe 20 noiembrie 2020 Folding @ home are doar 0,2 x86 exaFLOPS din cauza unei erori de calcul.

Puncte

Similar cu alte proiecte de calcul distribuite, Folding @ home evaluează cantitativ contribuțiile de calcul ale utilizatorilor la proiect printr-un sistem de creditare. Toate unitățile dintr-un proiect proteic dat au un credit de bază uniform, care este determinat prin compararea uneia sau mai multor unități de lucru din acel proiect pe o mașină de referință oficială înainte de lansarea proiectului. Fiecare utilizator primește aceste puncte de bază pentru finalizarea fiecărei unități de lucru, deși prin utilizarea unei chei de acces poate primi puncte bonus adăugate pentru completarea fiabilă și rapidă a unităților care sunt mai solicitante din punct de vedere calculațional sau au o prioritate științifică mai mare. Utilizatorii pot primi, de asemenea, credit pentru munca lor de către clienți pe mai multe mașini. Acest sistem de puncte încearcă să alinieze creditul acordat cu valoarea rezultatelor științifice.

Utilizatorii își pot înregistra contribuțiile în cadrul unei echipe, care combină punctele tuturor membrilor lor. Un utilizator își poate crea propria echipă sau se poate alătura unei echipe existente. În unele cazuri, o echipă poate avea propriile surse de ajutor sau recrutare bazate pe comunitate, cum ar fi un forum pe Internet . Punctele pot încuraja concurența prietenoasă între indivizi și echipe pentru a calcula cel mai mult proiectul, ceea ce poate aduce beneficii comunității pliante și poate accelera cercetarea științifică. Statisticile individuale și ale echipelor sunt postate pe site-ul web Folding @ home.

Dacă un utilizator nu formează o echipă nouă sau nu se alătură unei echipe existente, acel utilizator devine automat parte a unei echipe „implicite”. Această echipă „implicită” are un număr de echipă „0”. Statisticile sunt acumulate pentru această echipă „implicită”, precum și pentru echipele special denumite.

Software

Software-ul Folding @ home la sfârșitul utilizatorului implică trei componente principale: unități de lucru, nuclee și un client.

Unități de lucru

O unitate de lucru reprezintă datele proteice pe care clientul este rugat să le proceseze. Unitățile de lucru reprezintă o fracțiune din simularea dintre stări într-un model Markov . După ce unitatea de lucru a fost descărcată și procesată complet de computerul unui voluntar, aceasta este returnată serverelor Folding @ home, care apoi acordă voluntarului punctele de credit. Acest ciclu se repetă automat. Toate unitățile de lucru au termene asociate și, dacă acest termen este depășit, este posibil ca utilizatorul să nu primească credit și unitatea va fi reemisă automat unui alt participant. Deoarece plierea proteinelor are loc în serie și multe unități de lucru sunt generate de predecesorii lor, acest lucru permite procesului general de simulare să continue normal dacă o unitate de lucru nu este returnată după o perioadă rezonabilă de timp. Datorită acestor termene limită, cerința minimă de sistem pentru Folding @ home este un procesor Pentium 3 450 MHz cu extensii Streaming SIMD (SSE). Cu toate acestea, unitățile de lucru pentru clienții performanți au un termen mult mai scurt decât cele pentru clientul uniprocesor, întrucât o parte majoră a beneficiului științific depinde de finalizarea rapidă a simulărilor.

Înainte de lansarea publică, unitățile de lucru parcurg mai multe etape de asigurare a calității pentru a împiedica pe cele problematice să devină pe deplin disponibile. Aceste etape de testare includ interne, beta și avansate, înainte de o versiune finală completă în Folding @ home. Unitățile de lucru Folding @ home sunt procesate în mod normal o singură dată, cu excepția cazului rar în care apar erori în timpul procesării. Dacă acest lucru se întâmplă pentru trei utilizatori diferiți, unitatea este extrasă automat din distribuție. Forumul de asistență Folding @ home poate fi utilizat pentru a face diferența dintre problemele care apar din hardware problematic și de unitățile de lucru defecte.

Miezuri

Programele de dinamică moleculară specializate, denumite „FahCores” și adesea „nuclee” prescurtate, efectuează calculele pe unitatea de lucru ca proces de fond . O mare majoritate a nucleelor ​​Folding @ home se bazează pe GROMACS , unul dintre cele mai rapide și populare pachete software de dinamică moleculară, care constă în mare parte din codul limbajului de asamblare optimizat manual și optimizări hardware. Deși GROMACS este un software open-source și există un efort de cooperare între laboratorul Pande și dezvoltatorii GROMACS, Folding @ home folosește o licență cu sursă închisă pentru a asigura validitatea datelor. Miezurile mai puțin active includ ProtoMol și SHARPEN. Folding @ home a folosit AMBER , CPMD , Desmond și TINKER , dar acestea au fost de atunci retrase și nu mai sunt în serviciu activ. Unele dintre aceste nuclee efectuează calcule explicite de solvatare în care solventul din jur (de obicei apă) este modelat atom cu atom; în timp ce altele efectuează metode de solvatare implicite , în care solventul este tratat ca un continuu matematic. Nucleul este separat de client pentru a permite actualizarea automată a metodelor științifice fără a necesita o actualizare a clientului. Miezul creează periodic puncte de control pentru calcul, astfel încât, dacă sunt întrerupte, să poată relua lucrările din acel moment la pornire.

Client

Folding @ home care rulează pe Fedora 25

Un participant Folding @ home instalează un program client pe computerul personal . Utilizatorul interacționează cu clientul, care gestionează celelalte componente software din fundal. Prin intermediul clientului, utilizatorul poate întrerupe procesul de pliere, poate deschide un jurnal de evenimente, poate verifica progresul lucrării sau poate vizualiza statistici personale. Clienții computerului rulează continuu în fundal cu o prioritate foarte mică, folosind puterea de procesare inactivă, astfel încât utilizarea normală a computerului să nu fie afectată. Utilizarea maximă a procesorului poate fi ajustată prin setările clientului. Clientul se conectează la un server Folding @ home și preia o unitate de lucru și poate descărca, de asemenea, nucleul adecvat pentru setările clientului, sistemul de operare și arhitectura hardware de bază. După procesare, unitatea de lucru este returnată serverelor Folding @ home. Clienții de computer sunt adaptate sistemelor de procesare uniprocesor și multi-core și unităților de procesare grafică . Diversitatea și puterea fiecărei arhitecturi hardware oferă Folding @ home capacitatea de a finaliza eficient multe tipuri de simulări în timp util (în câteva săptămâni sau luni, mai degrabă decât în ​​ani), ceea ce are o valoare științifică semnificativă. Împreună, acești clienți permit cercetătorilor să studieze întrebări biomedicale considerate anterior impracticabile pentru abordarea computerizată.

Dezvoltatorii de software profesioniști sunt responsabili pentru majoritatea codului Folding @ home, atât pentru client, cât și pentru server. Echipa de dezvoltare include programatori de la Nvidia , ATI , Sony și Cauldron Development. Clienții pot fi descărcați numai de pe site-ul oficial Folding @ home sau partenerii săi comerciali și vor interacționa doar cu fișierele computerului Folding @ home. Vor încărca și descărca date cu serverele de date Folding @ home (prin portul  8080, cu 80 ca alternativă), iar comunicarea este verificată utilizând semnături digitale de 2048 biți . În timp ce interfața grafică cu utilizatorul (GUI) a clientului este open-source, clientul este un software proprietar care citează drept motive securitatea și integritatea științifică.

Cu toate acestea, această rațiune a utilizării software-ului proprietar este contestată, deoarece, deși licența ar putea fi aplicabilă retrospectiv în domeniul legal, nu împiedică practic modificarea (cunoscută și sub denumirea de corecție ) a fișierelor binare executabile . În mod similar, distribuția numai binară nu împiedică modificarea rău intenționată a codului binar executabil, fie printr-un atac de tip „ om în mijloc” în timp ce este descărcat prin internet, fie prin redistribuirea binelor de către o terță parte care a fost modificate anterior fie în starea lor binară (adică patch-uri ), fie prin descompilarea și recompilarea lor după modificare. Aceste modificări sunt posibile cu excepția cazului în care fișierele binare - și canalul de transport - sunt semnate, iar persoana / sistemul destinatar poate verifica semnătura digitală, caz în care modificările nejustificate ar trebui să fie detectabile, dar nu întotdeauna. Oricum, deoarece, în cazul Folding @ home, datele de intrare și rezultatul de ieșire procesate de software-ul clientului sunt ambele semnate digital, integritatea muncii poate fi verificată independent de integritatea software-ului client în sine.

Folding @ home folosește bibliotecile software Cosm pentru rețea. Folding @ home a fost lansat pe 1 octombrie 2000 și a fost primul proiect de calcul distribuit destinat sistemelor bio-moleculare. Primul său client a fost un screensaver , care va rula în timp ce computerul nu era altfel utilizat. În 2004, laboratorul Pande a colaborat cu David P. Anderson pentru a testa un client suplimentar în cadrul open source BOINC . Acest client a fost lansat în versiunea beta închisă în aprilie 2005; cu toate acestea, metoda a devenit irealizabilă și a fost abandonată în iunie 2006.

Unități de procesare grafică

Hardware-ul specializat al unităților de procesare grafică (GPU) este conceput pentru a accelera redarea aplicațiilor grafice 3-D, cum ar fi jocurile video, și poate depăși semnificativ CPU-urile pentru unele tipuri de calcule. GPU-urile sunt una dintre cele mai puternice și mai rapide platforme de calcul, iar mulți oameni de știință și cercetători urmăresc calcule de uz general pe unitățile de procesare grafică (GPGPU). Cu toate acestea, hardware-ul GPU este dificil de utilizat pentru sarcini non-grafice și necesită, de obicei, o restructurare semnificativă a algoritmului și o înțelegere avansată a arhitecturii subiacente. O astfel de personalizare este o provocare, cu atât mai mult pentru cercetătorii cu resurse limitate de dezvoltare software. Folding @ home folosește biblioteca OpenMM open-source , care folosește un model de proiectare bridge cu două niveluri de interfață de programare a aplicației (API) pentru a interfața software-ul de simulare moleculară cu o arhitectură hardware subiacentă. Odată cu adăugarea de optimizări hardware, simulările GPU bazate pe OpenMM nu necesită modificări semnificative, dar obțin performanțe aproape egale cu codul GPU reglat manual și depășesc mult implementările CPU.

Înainte de 2010, fiabilitatea de calcul a hardware-ului de consum GPGPU era în mare parte necunoscută, iar dovezile circumstanțiale legate de lipsa detectării și corectării erorilor încorporate în memoria GPU au ridicat probleme de fiabilitate. În primul test pe scară largă al preciziei științifice a GPU, un studiu din 2010 a peste 20.000 de gazde din rețeaua Folding @ home a detectat erori ușoare în subsistemele de memorie a două treimi din GPU-urile testate. Aceste erori au fost puternic corelate cu arhitectura plăcii, deși studiul a concluzionat că calculul GPU de încredere a fost foarte fezabil atâta timp cât se acordă atenție trăsăturilor hardware, cum ar fi detectarea erorilor din partea software-ului.

Prima generație de client GPU Folding @ home (GPU1) a fost lansată publicului pe 2 octombrie 2006, oferind o viteză de 20-30 de ori pentru unele calcule față de omologii săi GROMACS bazate pe procesor . A fost prima dată când GPU-urile au fost folosite fie pentru calcul distribuit, fie pentru calcule majore ale dinamicii moleculare. GPU1 le-a oferit cercetătorilor cunoștințe și experiență semnificative în dezvoltarea software-ului GPGPU , dar ca răspuns la inexactitățile științifice cu DirectX , pe 10 aprilie 2008 a fost succedat de GPU2, a doua generație a clientului. Ca urmare a introducerii GPU2, GPU1 a fost retras oficial pe 6 iunie Comparativ cu GPU1, GPU2 a fost mai științific fiabile și productive, pe RAN ATI si CUDA activat pentru Nvidia GPU, și a sprijinit algoritmi mai avansate, proteine mai mari, și de vizualizare în timp real a simulării proteinelor. După aceasta, a treia generație de client GPU Folding @ home (GPU3) a fost lansată pe 25 mai 2010. Deși compatibilă cu GPU2, GPU3 a fost mai stabilă, mai eficientă și mai flexibilă în abilitățile sale științifice și a folosit OpenMM Cadru OpenCL . Deși acești clienți GPU3 nu au suportat în mod nativ sistemele de operare Linux și macOS , utilizatorii Linux cu plăci grafice Nvidia au putut să le ruleze prin intermediul aplicației software Wine . GPU-urile rămân cea mai puternică platformă Folding @ home din FLOPS . Începând cu noiembrie 2012, clienții GPU reprezintă 87% din totalul fluxului FLOPS x86 al întregului proiect.

Suportul nativ pentru plăcile grafice Nvidia și AMD sub Linux a fost introdus cu FahCore 17, care folosește OpenCL mai degrabă decât CUDA.

PlayStation 3

Clientul PlayStation 3 Life With PlayStation a afișat o animație 3-D a proteinei pliate

Din martie 2007 până în noiembrie 2012, Folding @ home a profitat de puterea de calcul a PlayStation 3 . La momentul înființării, principalul procesor de streaming Cell a oferit o creștere de 20 de ori a vitezei față de calculatoare, pentru unele calcule, puterea de procesare care nu putea fi găsită pe alte sisteme, cum ar fi Xbox 360 . Viteza și eficiența ridicate a PS3 au introdus alte oportunități pentru optimizări valoroase în conformitate cu legea lui Amdahl și au schimbat semnificativ compromisul între eficiența de calcul și precizia generală, permițând utilizarea unor modele moleculare mai complexe la un cost de calcul redus. Acest lucru a permis Folding @ home să execute calcule biomedicale care altfel ar fi fost imposibil de calculat.

Clientul PS3 a fost dezvoltat într-un efort de colaborare între Sony și laboratorul Pande și a fost lansat pentru prima dată ca client independent pe 23 martie 2007. Versiunea sa a făcut din Folding @ home primul proiect de calcul distribuit care utilizează PS3. La 18 septembrie a anului următor, clientul PS3 a devenit un canal al Life cu PlayStation la lansarea sa. În tipurile de calcule pe care le poate efectua, în momentul introducerii sale, clientul se încadrează între flexibilitatea unui CPU și viteza unui GPU. Cu toate acestea, spre deosebire de clienții care rulează pe computerele personale , utilizatorii nu au putut efectua alte activități pe PS3 în timp ce rulează Folding @ home. Mediul uniform al consolei PS3 a facilitat asistența tehnică și a făcut Folding @ home mai ușor de utilizat . PS3 a avut, de asemenea, capacitatea de a transmite rapid datele către GPU-ul său, care a fost utilizat pentru vizualizarea în timp real a nivelului atomic a dinamicii actuale a proteinelor.

Pe 6 noiembrie 2012, Sony a încheiat asistența pentru clientul PS3 Folding @ home și alte servicii disponibile în Life cu PlayStation. De-a lungul duratei sale de viață de cinci ani și șapte luni, peste 15 milioane de utilizatori au contribuit cu peste 100 de milioane de ore de calcul la Folding @ home, ajutând în mare măsură proiectul cu cercetarea bolilor. În urma discuțiilor cu laboratorul Pande, Sony a decis să pună capăt aplicației. Pande l-a considerat pe clientul PlayStation 3 un „schimbător de jocuri” pentru proiect.

Client de procesare multi-core

Folding @ home poate folosi abilitățile de calcul paralele ale procesoarelor multi-core moderne. Capacitatea de a utiliza mai multe nuclee CPU simultan permite finalizarea simulării complete mult mai repede. Lucrând împreună, aceste nuclee CPU completează unități de lucru singure proporțional mai repede decât clientul uniprocesor standard. Această metodă este valoroasă din punct de vedere științific, deoarece permite realizarea unor traiectorii de simulare mult mai lungi în aceeași perioadă de timp și reduce dificultățile tradiționale de scalare a unei simulări mari la mulți procesoare separate. O publicație din 2007 în Journal of Molecular Biology s-a bazat pe prelucrarea multi-core pentru a simula plierea unei părți a proteinei villin de aproximativ 10 ori mai lungă decât era posibilă cu un client cu un singur procesor, în acord cu ratele experimentale de pliere.

În noiembrie 2006, clienții de primă generație multiprocesare simetrică (SMP) au fost eliberați public pentru testarea beta deschisă, denumită SMP1. Acești clienți au folosit protocoale de comunicații pentru interfața de trecere a mesajelor (MPI) pentru procesarea paralelă, deoarece în acel moment nucleele GROMACS nu erau proiectate pentru a fi utilizate cu mai multe fire de execuție. Aceasta a fost prima dată când un proiect de calcul distribuit a folosit MPI. Deși clienții au avut performanțe bune în sistemele de operare bazate pe Unix , cum ar fi Linux și macOS, au fost supărătoare în Windows . La 24 ianuarie 2010, SMP2, a doua generație de clienți SMP și succesorul SMP1, a fost lansată ca o versiune beta deschisă și a înlocuit complexul MPI cu o implementare bazată pe fire mai fiabilă .

SMP2 acceptă o încercare a unei categorii speciale de unități de lucru bigadv , concepute pentru a simula proteinele care sunt neobișnuit de mari și de calculatoare intensive și au o mare prioritate științifică. Aceste unități necesitau inițial minimum opt nuclee CPU, care au fost ridicate la șaisprezece mai târziu, pe 7 februarie 2012. Împreună cu aceste cerințe hardware adăugate față de unitățile de lucru standard SMP2, necesită mai multe resurse de sistem, cum ar fi memoria cu acces aleatoriu (RAM) și lățimea de bandă a internetului . În schimb, utilizatorii care le rulează sunt recompensați cu o creștere de 20% față de sistemul de puncte bonus al SMP2. Categoria bigadv permite Folding @ home să ruleze simulări deosebit de solicitante pentru perioade îndelungate care anterior cereau utilizarea clusterelor de supercomputere și nu puteau fi efectuate nicăieri altundeva pe Folding @ home. Mulți utilizatori cu hardware capabil să ruleze unități bigadv au avut ulterior configurarea hardware considerată neeligibilă pentru unitățile de lucru bigadv atunci când minimele de bază ale procesorului au crescut, lăsându-le capabile să ruleze numai unitățile de lucru SMP normale. Acest lucru a frustrat mulți utilizatori care au investit sume importante de bani în program doar pentru ca hardware-ul lor să fie învechit în scopuri bigadv la scurt timp după aceea. Drept urmare, Pande a anunțat în ianuarie 2014 că programul bigadv se va încheia pe 31 ianuarie 2015.

V7

O imagine de exemplu a clientului V7 în modul Novice care rulează sub Windows 7 . În plus față de o varietate de controale și detalii despre utilizator, V7 prezintă informații despre unitatea de lucru, cum ar fi starea sa, progresul calculului, ETA, punctele de credit, numerele de identificare și descrierea.

Clientul V7 este a șaptea și ultima generație a software-ului client Folding @ home și este o rescriere completă și unificarea clienților anteriori pentru sistemele de operare Windows , macOS și Linux . A fost lansat pe 22 martie 2012. La fel ca predecesorii săi, V7 poate rula Folding @ home în fundal cu o prioritate foarte mică , permițând altor aplicații să utilizeze resursele CPU după cum au nevoie. Este conceput pentru a face instalarea, pornirea și funcționarea mai ușor de utilizat pentru începători și pentru a oferi cercetătorilor o flexibilitate științifică mai mare decât clienții anteriori. V7 folosește Trac pentru gestionarea biletelor sale de erori, astfel încât utilizatorii să poată vedea procesul de dezvoltare și să ofere feedback.

V7 este format din patru elemente integrate. Utilizatorul interacționează de obicei cu interfața grafică open source V7 , numită FAHControl. Acesta are moduri de interfață utilizator Novice, Avansate și Expert și are capacitatea de a monitoriza, configura și controla mulți clienți pliați la distanță de pe un computer. FAHControl direcționează FAHClient, o aplicație back-end care la rândul său gestionează fiecare FAHSlot (sau slot ). Fiecare slot acționează ca înlocuitor pentru clienții uniprocesori Folding @ home v6, SMP sau GPU, diferiți anterior, deoarece poate descărca, procesa și încărca unități de lucru independent. Funcția FAHViewer, modelată după vizualizatorul PS3, afișează o redare 3D în timp real, dacă este disponibilă, a proteinei în curs de procesare.

Google Chrome

În 2014, a fost lansat un client pentru browserele web Google Chrome și Chromium , permițând utilizatorilor să ruleze Folding @ home în browserul lor web. Clientul folosit Google e client nativ caracteristica (NaCl) în browserele web pe bază de crom-pentru a rula Folding @ codul de acasă la viteza de aproape nativ într - un mediu de testare pe mașina utilizatorului. Datorită eliminării treptate a NaCL și a modificărilor de la Folding @ home, clientul web a fost închis definitiv în iunie 2019.

Android

În iulie 2015, un client pentru telefoane mobile Android a fost lansat pe Google Play pentru dispozitivele care rulează Android 4.4 KitKat sau mai nou.

Pe 16 februarie 2018, clientul Android, care a fost oferit în cooperare cu Sony , a fost eliminat din Google Play. Au fost anunțate planuri pentru a oferi o alternativă open source în viitor.

Comparație cu alte simulatoare moleculare

Rosetta @ home este un proiect de calcul distribuit care vizează predicția structurii proteinelor și este unul dintre cei mai exacți predictori ai structurii terțiare . Stările conformaționale din software-ul Rosetta pot fi utilizate pentru a inițializa un model de stare Markov ca puncte de plecare pentru simulările Folding @ home. În schimb, algoritmii de predicție a structurii pot fi îmbunătățiți din modele termodinamice și cinetice și din aspectele de eșantionare ale simulărilor de pliere a proteinelor. Întrucât Rosetta încearcă doar să prezică starea finală pliată și nu cum se desfășoară plierea, Rosetta @ home și Folding @ home sunt complementare și abordează întrebări moleculare foarte diferite.

Anton este un supercomputer special conceput pentru simulări de dinamică moleculară. În octombrie 2011, Anton și Folding @ home au fost cele mai puternice două sisteme de dinamică moleculară. Anton este unic prin capacitatea sa de a produce traiectorii moleculare costisitoare ultralungite, cum ar fi una în 2010 care a atins intervalul de milisecunde. Aceste traiectorii lungi pot fi utile în special pentru unele tipuri de probleme biochimice. Cu toate acestea, Anton nu folosește modelele de stat Markov (MSM) pentru analiză. În 2011, laboratorul Pande a construit un MSM din două simulări Anton de 100 µs și a găsit căi alternative de pliere care nu erau vizibile prin analiza tradițională a lui Anton. Au ajuns la concluzia că există puține diferențe între MSM-uri construite dintr-un număr limitat de traiectorii lungi sau una asamblată din mai multe traiectorii mai scurte. În iunie 2011 Folding @ home a adăugat eșantionarea unei simulații Anton într-un efort de a determina mai bine cum metodele sale se compară cu cele ale lui Anton. Cu toate acestea, spre deosebire de traiectoriile mai scurte ale Folding @ home, care sunt mai predispuse la calcule distribuite și alte metode de paralelizare, traiectorii mai lungi nu necesită eșantionare adaptivă pentru a eșantiona suficient spațiul de fază al proteinei . Datorită acestui fapt, este posibil ca o combinație a metodelor de simulare ale lui Anton și Folding @ home să ofere o eșantionare mai aprofundată a acestui spațiu.

Vezi si

Referințe

Surse

linkuri externe

Ascultați acest articol ( 1 oră și 13 minute )
Pictogramă Wikipedia vorbită
Acest fișier audio a fost creat dintr-o revizuire a acestui articol din 7 octombrie 2014 și nu reflectă modificările ulterioare. ( 07-10-2014 )