Google Cărți - Google Books

Google Cărți
Sigla Google Books 2015.svg
Captură de ecran
Google books screenshot.png
Tipul de site
Biblioteca digitală
Proprietar Google
URL cărți .google .com
Lansat Octombrie 2004 ; Acum 17 ani (ca Google Print) ( 2004-10 )
Statusul curent Activ

Google Books (cunoscut anterior ca Google Book Search și Google Print și cu numele său de cod Project Ocean ) este un serviciu de la Google Inc. care caută textul complet al cărților și revistelor pe care Google le-a scanat, convertite în text utilizând recunoașterea optică a caracterelor ( OCR) și stocate în baza sa de date digitală. Cărțile sunt furnizate fie de editori și autori prin Programul de parteneriat Google Cărți, fie de partenerii bibliotecii Google prin intermediul proiectului de bibliotecă. În plus, Google a colaborat cu un număr de editori de reviste pentru a-și digitaliza arhivele.

Programul pentru editori a fost cunoscut pentru prima dată sub numele de Google Print când a fost introdus la Târgul de carte din Frankfurt în octombrie 2004. Proiectul Google Books Library, care scanează lucrările din colecțiile partenerilor de bibliotecă și le adaugă la inventarul digital, a fost anunțat în decembrie 2004 .

Inițiativa Google Books a fost apreciată pentru potențialul său de a oferi acces fără precedent la ceea ce poate deveni cel mai mare corp online de cunoștințe umane și promovarea democratizării cunoștințelor . Totuși, a fost criticat și pentru potențiale încălcări ale drepturilor de autor și lipsa de editare pentru a corecta numeroasele erori introduse în textele scanate de procesul OCR.

În octombrie 2015, numărul titlurilor cărților scanate a fost de peste 25 de milioane, dar procesul de scanare a încetinit în bibliotecile academice americane. Google a estimat în 2010 că există aproximativ 130 de milioane de titluri distincte în lume și a declarat că intenționează să le scaneze pe toate. Începând din octombrie 2019, Google a sărbătorit 15 ani de cărți Google și a furnizat numărul de cărți scanate cu peste 40 de milioane de titluri.

Eforturile de scanare ale Google Book au fost supuse unor litigii, inclusiv Authors Guild v. Google , un proces de acțiune colectivă în Statele Unite. Acesta a fost un caz major care s-a apropiat de schimbarea practicilor privind drepturile de autor pentru operele orfane din Statele Unite.

Detalii

Rezultatele din Google Books apar atât în Căutarea Google universală, cât și pe site-ul dedicat căutării Google Books ( books.google.com ).

Ca răspuns la interogările de căutare, Google Cărți permite utilizatorilor să vizualizeze pagini complete din cărți în care apar termenii de căutare dacă cartea nu are drepturi de autor sau dacă proprietarul drepturilor de autor a acordat permisiunea. Dacă Google consideră că cartea este încă sub drepturi de autor, un utilizator vede „fragmente” de text în jurul termenilor de căutare solicitați. Toate instanțele termenilor de căutare din textul cărții apar cu o evidențiere galbenă.

Cele patru niveluri de acces utilizate pe Google Cărți sunt:

  • Vizualizare completă : cărțile din domeniul public sunt disponibile pentru „vizualizare completă” și pot fi descărcate gratuit. Cărțile tipărite achiziționate prin Programul de parteneriat sunt, de asemenea, disponibile pentru vizualizare completă, dacă editorul a acordat permisiunea, deși acest lucru este rar.
  • Previzualizare : pentru cărțile tipărite în care a fost acordată permisiunea, numărul de pagini vizibile este limitat la o „previzualizare” setată de o varietate de restricții de acces și măsuri de securitate, unele bazate pe urmărirea utilizatorilor. De obicei, editorul poate seta procentajul cărții disponibile pentru previzualizare. Utilizatorilor li se interzice să copieze, să descarce sau să imprime previzualizări de carte. În partea de jos a paginilor apare un filigran care scrie „Material protejat prin drepturi de autor”. Toate cărțile achiziționate prin Programul de parteneriat sunt disponibile pentru previzualizare.
  • Vizualizare fragment : O „vizualizare fragment” - două-trei rânduri de text care înconjoară termenul de căutare solicitat - este afișată în cazurile în care Google nu are permisiunea proprietarului drepturilor de autor să afișeze o previzualizare. Acest lucru se poate datora faptului că Google nu poate identifica proprietarul sau proprietarul a refuzat permisiunea. Dacă un termen de căutare apare de multe ori într-o carte, Google nu afișează mai mult de trei fragmente, împiedicând astfel utilizatorul să vadă prea mult din carte. De asemenea, Google nu afișează niciun fragment pentru anumite cărți de referință, cum ar fi dicționarele, unde afișarea chiar și a fragmentelor poate dăuna pieței pentru lucrare. Google susține că nu este necesară nicio permisiune conform legii drepturilor de autor pentru a afișa vizualizarea fragmentului.
  • Fără previzualizare : Google afișează, de asemenea, rezultatele căutării cărților care nu au fost digitalizate. Deoarece aceste cărți nu au fost scanate, textul lor nu poate fi căutat și doar metadatele, cum ar fi titlul, autorul, editorul, numărul de pagini, ISBN, subiectul și informațiile privind drepturile de autor și, în unele cazuri, un cuprins și rezumatul cărții sunt disponibil. De fapt, acest lucru este similar cu un catalog de cărți de bibliotecă online.

Ca răspuns la criticile din partea unor grupuri precum American Association of Publishers și Authors Guild , Google a anunțat o politică de renunțare în august 2005, prin care proprietarii drepturilor de autor ar putea furniza o listă de titluri pe care nu le doresc scanate, iar cererea ar fi să fie respectat. Compania a declarat, de asemenea, că nu va scana nicio carte cu drepturi de autor în perioada august - 1 noiembrie 2005, pentru a oferi proprietarilor posibilitatea de a decide ce cărți să excludă din proiect. Astfel, proprietarii de drepturi de autor au trei opțiuni cu privire la orice operă:

  1. Poate participa la Programul de parteneriat pentru a face o carte disponibilă pentru previzualizare sau vizualizare completă, caz în care ar împărți veniturile obținute din afișarea paginilor din lucrare ca răspuns la întrebările utilizatorilor.
  2. Poate lăsa Google să scaneze cartea în Biblioteca Proiectului și să afișeze fragmente ca răspuns la întrebările utilizatorilor.
  3. Poate renunța la proiectul de bibliotecă, caz în care Google nu va scana cartea. Dacă cartea a fost deja scanată, Google își va reseta nivelul de acces ca „Fără previzualizare”.

Majoritatea lucrărilor scanate nu mai sunt tipărite sau disponibile comercial.

Pe lângă achiziționarea de cărți din biblioteci, Google obține și cărți de la editorii săi parteneri, prin „Programul pentru parteneri” - conceput pentru a ajuta editorii și autorii să își promoveze cărțile. Editorii și autorii trimit fie o copie digitală a cărții lor în format EPUB sau PDF , fie o copie tipărită către Google, care este disponibilă pe Google Cărți pentru previzualizare. Editorul poate controla procentajul cărții disponibile pentru previzualizare, cel puțin 20%. De asemenea, pot alege să facă cartea complet vizibilă și chiar să permită utilizatorilor să descarce o copie PDF. Cărțile pot fi, de asemenea, disponibile pentru vânzare pe Google Play. Spre deosebire de Proiectul de bibliotecă, acest lucru nu ridică nicio problemă privind drepturile de autor, deoarece se desfășoară în conformitate cu un acord cu editorul. Editorul poate alege să se retragă din acord în orice moment.

Pentru multe cărți, Google Cărți afișează numerele de pagină originale. Cu toate acestea, Tim Parks , care a scris în The New York Review of Books în 2014, a remarcat că Google a încetat să furnizeze numerele de pagină pentru multe publicații recente (probabil cele achiziționate prin Programul partenerilor) „probabil în alianță cu editorii, pentru a forța cei dintre noi care trebuie să pregătească note de subsol pentru a cumpăra ediții pe hârtie. "

Scanarea cărților

Proiectul a început în 2002 sub numele de cod Project Ocean. Cofondatorul Google, Larry Page, a avut întotdeauna un interes în digitalizarea cărților. Când el și Marissa Mayer au început să experimenteze scanarea cărților în 2002, au trebuit 40 de minute până când digitalizează o carte de 300 de pagini. Dar la scurt timp după ce tehnologia a fost dezvoltată în măsura în care operatorii de scanare puteau scana până la 6000 de pagini pe oră.

Google a creat centre de scanare desemnate către care cărțile erau transportate cu camioane. Stațiile ar putea digitaliza la o rată de 1.000 de pagini pe oră. Cărțile au fost așezate într-un leagăn mecanic personalizat, care a reglat coloana vertebrală a cărții în timp ce o serie de lumini și instrumente optice scanează cele două pagini deschise. Fiecare pagină ar avea două camere direcționate spre ea, captând imaginea, în timp ce un telemetru LIDAR a suprapus o grilă laser tridimensională pe suprafața cărții pentru a surprinde curbura hârtiei. Un operator uman întoarce paginile cu mâna, folosind o pedală pentru a face fotografiile. Fără a fi nevoie să aplatizați paginile sau să le aliniați perfect, sistemul Google nu numai că a atins o eficiență și o viteză remarcabile, dar a contribuit și la protejarea colecțiilor fragile de supraexaminare. Ulterior, imaginile brute au trecut prin trei niveluri de procesare: mai întâi, algoritmii de dezarzire au folosit datele LIDAR pentru a remedia curbura paginilor. Apoi, software-ul de recunoaștere optică a caracterelor (OCR) a transformat imaginile brute în text și, în cele din urmă, o altă rundă de algoritmi a extras numerele paginilor, notele de subsol, ilustrațiile și diagramele.

Multe dintre cărți sunt scanate folosind o cameră Elphel 323 personalizată la o rată de 1.000 de pagini pe oră. Un brevet acordat companiei Google în 2009 a dezvăluit că Google a venit cu un sistem inovator de scanare a cărților care utilizează două camere și lumină cu infraroșu pentru a corecta automat curbura paginilor dintr-o carte. Prin construirea unui model 3D al fiecărei pagini și apoi „dezinformarea” acesteia, Google este capabil să prezinte pagini cu aspect plat, fără a fi nevoie să facă paginile plate, ceea ce necesită utilizarea unor metode distructive, cum ar fi dezlănțuirea sau plăcile de sticlă pentru a individua aplatizați fiecare pagină, ceea ce este ineficient pentru scanarea pe scară largă.

Funcționalitatea site-ului web

Pentru fiecare lucrare, Google Cărți generează automat o pagină de prezentare generală. Această pagină afișează informații extrase din carte - detaliile sale de publicare, o hartă de cuvinte de înaltă frecvență, cuprinsul - precum și material secundar, cum ar fi rezumate, recenzii ale cititorilor și linkuri către alte texte relevante. Un vizitator al paginii, de exemplu, poate vedea o listă de cărți care împărtășesc un gen și o temă similară sau poate vedea o listă a burselor actuale din carte. În plus, acest conținut oferă posibilități interactive utilizatorilor conectați la contul lor Google . Aceștia pot exporta datele bibliografice și citările în formate standard , își pot scrie propriile recenzii, le pot adăuga biblioteca pentru a fi etichetate, organizate și partajate cu alte persoane. Astfel, Google Books colectează aceste elemente mai interpretative dintr-o serie de surse, inclusiv utilizatori, site-uri terțe, precum Goodreads , și adesea autorul și editorul cărții.

De fapt, pentru a încuraja autorii să-și încarce propriile cărți, Google a adăugat mai multe funcționalități pe site. Autorii pot permite vizitatorilor să-și descarce gratuit cartea electronică sau își pot stabili propriul preț de achiziție. Ei pot schimba prețul înainte și înapoi, oferind reduceri ori de câte ori li se potrivește. De asemenea, dacă autorul unei cărți alege să adauge un număr de înregistrare ISBN , LCCN sau OCLC , serviciul va actualiza adresa URL a cărții pentru ao include. Apoi, autorul poate seta o anumită pagină ca ancoră a linkului. Această opțiune face ca cartea lor să fie mai ușor de descoperit.

Ngram Viewer

Ngram Viewer este un serviciu conectat la Google Books care prezintă grafic frecvența utilizării cuvintelor în colecția lor de cărți. Serviciul este important pentru istorici și lingviști, deoarece poate oferi o privire interioară asupra culturii umane prin utilizarea cuvintelor de-a lungul perioadelor de timp. Acest program a fost criticat din cauza erorilor în metadatele utilizate în program.

Probleme de conținut și critici

Proiectul a primit critici că scopul său declarat de a păstra lucrările orfane și scoase din tipar este în pericol din cauza faptului că datele scanate au erori și că astfel de probleme nu au fost rezolvate.

Utilizatorii pot raporta erori în cărțile scanate de Google la support.google.com/books/partner/troubleshooter/2983879 .

Erori de scanare

O mână scanată într-o carte Google

Procesul de scanare este supus erorilor. De exemplu, unele pagini pot fi ilizibile, cu capul în jos sau în ordinea greșită. Savanții au raportat chiar pagini mototolite, obținând degetele mari de la mâini și degete și imagini întunecate sau neclare. În această privință, o declarație de la Google la sfârșitul cărților scanate spune:

Digitalizarea la nivelul cel mai de bază se bazează pe imagini de pagină ale cărților fizice. Pentru a face această carte disponibilă ca fișier formatat ePub, am luat acele imagini de pagină și am extras textul folosind tehnologia de recunoaștere optică a caracterelor (sau OCR pe scurt). Extragerea textului din imagini de pagină este o sarcină dificilă de inginerie. Petele de pe paginile cărților fizice, fonturile fanteziste, fonturile vechi, paginile rupte etc. pot duce la erori în textul extras. OCR imperfect este doar prima provocare în scopul final de a trece de la colecții de imagini de pagină la cărți bazate pe text extras. Algoritmii noștri de computer trebuie, de asemenea, să determine automat structura cărții (care sunt anteturile și subsolurile, unde sunt plasate imaginile, dacă textul este versificat sau proză și așa mai departe). Obținerea acestui drept ne permite să redăm cartea într-un mod care urmează formatul cărții originale. În ciuda eforturilor noastre, este posibil să vedeți greșeli de ortografie, caractere gunoi, imagini străine sau pagini lipsă în această carte. Pe baza estimărilor noastre, aceste erori nu ar trebui să vă împiedice să vă bucurați de conținutul cărții. Provocările tehnice ale construirii automate a unei cărți perfecte sunt descurajante, dar continuăm să îmbunătățim tehnologiile noastre de extragere a OCR și a structurii cărților.

Începând din 2009, Google a declarat că vor începe să utilizeze reCAPTCHA pentru a ajuta la remedierea erorilor găsite în scanările Google Book. Această metodă ar îmbunătăți doar cuvintele scanate care sunt greu de recunoscut din cauza procesului de scanare și care nu pot rezolva erori precum paginile întoarse sau cuvintele blocate.

Erori în metadate

Cercetătorii au raportat frecvent erori descurajante în informațiile despre metadate de pe Google Cărți - inclusiv autori neatribuiți și date de publicare eronate. Geoffrey Nunberg , un lingvist care cercetează schimbările de utilizare a cuvintelor de-a lungul timpului, a observat că o căutare a cărților publicate înainte de 1950 și care conținea cuvântul „internet” a dat un rezultat puțin probabil de 527. Woody Allen este menționat în 325 de cărți aparent publicate înainte de a se naște. Google a răspuns lui Nunberg acuzând majoritatea erorilor contractanților externi.

Alte erori de metadate raportate includ date de publicare înainte de nașterea autorului (de exemplu, 182 de lucrări ale lui Charles Dickens înainte de nașterea sa în 1812); clasificări incorecte ale subiectului (o ediție a lui Moby Dick găsită sub „computere”, o biografie a lui Mae West clasificată la „religie”), clasificări conflictuale (10 ediții ale lui Whitman's Leaves of Grass toate clasificate atât ca „ficțiune”, cât și „non-ficțiune”), titluri scrise incorect, autori și editori ( Moby Dick: sau „Peretele” alb ) și metadatele pentru o carte au fost atașate incorect la o carte complet diferită (metadatele pentru o lucrare matematică din 1818 duc la un roman de dragoste din 1963).

A fost efectuată o revizuire a elementelor de metadate ale autorului, titlului, editorului și anului publicării pentru 400 de înregistrări Google Books selectate aleatoriu. Rezultatele arată că 36% din cărțile eșantionate din proiectul de digitalizare conțineau erori de metadate. Această rată de eroare este mai mare decât s-ar putea aștepta să se găsească într-un catalog online tipic bibliotecii.

Rata generală de eroare de 36,75% găsită în acest studiu sugerează că metadatele Google Books au o rată ridicată de eroare. În timp ce erorile „majore” și „minore” sunt o distincție subiectivă bazată pe conceptul oarecum nedeterminat de „găsire”, erorile găsite în cele patru elemente de metadate examinate în acest studiu ar trebui considerate majore.

Erorile de metadate bazate pe date scanate incorecte îngreunează cercetarea utilizând baza de date Google Books Project. Google a arătat doar un interes limitat în curățarea acestor erori.

Probleme de limbă

Unii politicieni și intelectuali europeni au criticat efortul Google din motive de imperialism lingvistic . Aceștia susțin că, deoarece marea majoritate a cărților propuse pentru scanare sunt în limba engleză, aceasta va avea ca rezultat o reprezentare disproporționată a limbilor naturale în lumea digitală. Germană, rusă, franceză și spaniolă, de exemplu, sunt limbi populare în bursă. Cu toate acestea, accentul disproporționat pe limba engleză ar putea modela accesul la bursele istorice și, în cele din urmă, la creșterea și direcția viitoarei bursă. Printre acești critici se numără Jean-Noël Jeanneney , fostul președinte al Bibliothèque nationale de France .

Google Books versus Google Scholar

În timp ce Google Cărți a digitalizat un număr mare de ediții anterioare ale jurnalelor, scanările sale nu includ metadatele necesare pentru identificarea articolelor specifice în ediții specifice. Acest lucru i-a determinat pe producătorii Google Scholar să-și înceapă propriul program de digitalizare și găzduire a articolelor de reviste mai vechi (în acord cu editorii lor).

Parteneri de bibliotecă

Proiectul Google Books Library are ca scop scanarea și transformarea în căutare a colecțiilor mai multor biblioteci importante de cercetare . Împreună cu informații bibliografice , fragmente de text dintr-o carte sunt adesea vizibile. Dacă o carte nu are drepturi de autor și este în domeniul public, cartea este complet disponibilă pentru citire sau descărcare .

Cărțile cu drepturi de autor scanate prin intermediul Library Project sunt puse la dispoziție pe Google Cărți pentru vizualizarea fragmentelor. În ceea ce privește calitatea scanărilor, Google recunoaște că acestea „nu sunt întotdeauna de o calitate suficient de înaltă” pentru a fi oferite spre vânzare pe Google Play. De asemenea, din cauza presupuselor constrângeri tehnice, Google nu înlocuiește scanările cu versiuni de calitate superioară care ar putea fi furnizate de editori.

Proiectul face obiectul procesului Authors Guild v. Google , intentat în 2005 și pronunțat în favoarea Google în 2013 și, din nou, în apel, în 2015.

Proprietarii drepturilor de autor pot revendica drepturile pentru o carte scanată și o pot face disponibilă pentru previzualizare sau vizualizare completă („transferând-o” în contul lor din Programul de parteneri) sau pot solicita companiei Google să împiedice căutarea textului cărții.

Numărul instituțiilor care participă la proiectul de bibliotecă a crescut de la înființarea sa.

Parteneri inițiali

Observați despre proiect la Biblioteca Universității Michigan
  • Universitatea Harvard , Biblioteca Universității Harvard
    Biblioteca Universității Harvard și Google au efectuat un pilot pe tot parcursul anului 2005. Proiectul a continuat, cu scopul de a crește accesul online la fondurile Bibliotecii Universității Harvard, care include peste 15,8 milioane de volume. În timp ce accesul fizic la materialele bibliotecii Harvard este, în general, limitat la studenții, facultățile și cercetătorii actuali de la Harvard sau la cercetătorii care pot veni la Cambridge, Proiectul Harvard-Google a fost conceput pentru a permite atât membrilor comunității Harvard, cât și utilizatorilor de pretutindeni să descopere. lucrează în colecția Harvard.
  • Universitatea din Michigan , Biblioteca Universității din Michigan
În martie 2012, au fost scanate 5,5 milioane de volume.

Parteneri suplimentari

Alți parteneri instituționali s-au alăturat proiectului de când a fost anunțat parteneriatul:

Parteneriatul a fost pentru digitalizarea colecției latino-americane a bibliotecii - aproximativ o jumătate de milion de volume.
În martie 2012, au fost scanate aproximativ 600.000 de volume.

Istorie

2002 : un grup de membri ai echipei de la Google lansează oficial proiectul „cărților secrete”. Fondatorii Google, Sergey Brin și Larry Page, au venit cu ideea că mai târziu au devenit Google Books, în timp ce încă erau absolvenți de la Stanford în 1996. Pagina de istorie de pe site-ul Google Books descrie viziunea lor inițială pentru acest proiect: „într-o lume viitoare în care colecțiile de cărți sunt digitalizate, oamenii ar folosi un „ crawler web ” pentru a indexa conținutul cărților și pentru a analiza conexiunile dintre ele, determinând relevanța și utilitatea oricărei cărți date, urmărind numărul și calitatea citărilor din alte cărți. " Această echipă a vizitat site-urile unora dintre eforturile mai mari de digitalizare din acel moment, inclusiv Biblioteca Congresului American Memory Project , Project Gutenberg și Biblioteca Universală pentru a afla cum funcționează, precum și Universitatea din Michigan, alma mater a lui Page, și baza pentru proiecte de digitalizare precum JSTOR și Making of America. Într-o conversație cu președintele de la acea vreme, Mary Sue Coleman , când Page a aflat că estimarea actuală a Universității pentru scanarea tuturor volumelor bibliotecii a fost de 1.000 de ani, Page ar fi spus lui Coleman că „crede că Google poate contribui la realizarea acesteia în șase. "

2003 : Echipa lucrează pentru a dezvolta un proces de scanare de mare viteză, precum și software pentru rezolvarea problemelor în dimensiuni de tip ciudat, fonturi neobișnuite și „alte particularități neașteptate”.

Decembrie 2004 : Google a semnalat o extensie a inițiativei sale Google Print cunoscută sub numele de Google Print Library Project. Google a anunțat parteneriate cu mai multe biblioteci universitare și publice de mare renume, inclusiv Universitatea din Michigan , Harvard ( Harvard University Library ), Stanford ( Green Library ), Oxford ( Bodleian Library ) și New York Public Library . Conform comunicatelor de presă și bibliotecarilor universitari, Google a planificat să digitalizeze și să pună la dispoziție prin intermediul serviciului său Google Books aproximativ 15 milioane de volume într-un deceniu. Anunțul a declanșat în curând controverse, întrucât asociațiile de editori și autori au contestat planurile Google de digitalizare, nu doar cărțile din domeniul public, ci și titlurile aflate încă sub drepturi de autor.

Septembrie-octombrie 2005 : două procese împotriva Google acuză că compania nu a respectat drepturile de autor și că nu a compensat în mod corespunzător autorii și editorii. Una este o acțiune colectivă în numele autorilor (Authors Guild v. Google, 20 sept. 2005), iar cealaltă este o acțiune civilă introdusă de cinci mari editori și de Asociația editorilor americani . ( McGraw Hill împotriva Google , 19 octombrie 2005)

Noiembrie 2005 : Google a schimbat numele acestui serviciu din Google Print în Google Book Search. Programul său care permite editorilor și autorilor să își includă cărțile în serviciu a fost redenumit Programul de parteneriat Google Books, iar parteneriatul cu bibliotecile a devenit Google Books Library Project .

2006 : Google a adăugat un buton „descărcați un pdf” la toate cărțile sale cu drepturi de autor, din domeniul public. De asemenea, a adăugat o nouă interfață de navigare împreună cu noi pagini „Despre această carte”.

August 2006 : Universitatea din California System a anunțat că se va alătura proiectului de digitalizare a cărților. Aceasta include o parte din cele 34 de milioane de volume din cele aproximativ 100 de biblioteci administrate de sistem.

Septembrie 2006 : Universitatea Complutense din Madrid a devenit prima bibliotecă în limba spaniolă care a aderat la Google Books Library Project.

Octombrie 2006 : Universitatea din Wisconsin – Madison a anunțat că se va alătura proiectului de digitalizare a cărții de căutare împreună cu Biblioteca Societății Istorice din Wisconsin . Combinate, bibliotecile au 7,2 milioane de fonduri.

Noiembrie 2006 : Universitatea din Virginia sa alăturat proiectului. Bibliotecile sale conțin peste cinci milioane de volume și peste 17 milioane de manuscrise, cărți rare și arhive.

Ianuarie 2007 : Universitatea din Texas din Austin a anunțat că se va alătura proiectului de digitalizare a cărții de căutare. Cel puțin un milion de volume ar fi digitalizate din cele 13 locații ale bibliotecii universității.

Martie 2007 : Biblioteca de Stat Bavareză a anunțat un parteneriat cu Google pentru a scana peste un milion de lucrări de domeniu public și epuizate în germană, precum și în engleză, franceză, italiană, latină și spaniolă.

Mai 2007 : Un parteneriat de proiect de digitalizare a cărților a fost anunțat în comun de Google și Biblioteca Cantonală și Universitară din Lausanne .

Mai 2007 : Biblioteca Boekentoren a Universității din Ghent a anunțat că va participa împreună cu Google la digitalizarea și punerea la dispoziție online a versiunilor digitalizate ale cărților din secolul al XIX-lea în limbile franceză și olandeză.

Mai 2007: Universitatea Mysore anunță că Google va digitaliza peste 800.000 de cărți și manuscrise - inclusiv aproximativ 100.000 de manuscrise scrise în sanscrită sau kannada atât pe hârtie, cât și pe frunze de palmier.

Iunie 2007 : Comitetul pentru cooperare instituțională (redenumit Alianța academică Big Ten în 2016) a anunțat că cele douăsprezece biblioteci membre ale sale vor participa la scanarea a 10 milioane de cărți în următorii șase ani.

Iulie 2007 : Universitatea Keio a devenit primul partener de bibliotecă Google din Japonia cu anunțul că vor digitaliza cel puțin 120.000 de cărți din domeniul public.

August 2007 : Google a anunțat că va digitaliza până la 500.000 de articole din domeniul drepturilor de autor și din domeniul public din Biblioteca Universității Cornell . Google va furniza, de asemenea, o copie digitală a tuturor lucrărilor scanate pentru a fi încorporate în propriul sistem de bibliotecă al universității.

Septembrie 2007 : Google a adăugat o funcție care permite utilizatorilor să partajeze fragmente de cărți aflate în domeniul public. Fragmentele pot apărea exact așa cum apar în scanarea cărții sau ca text simplu.

Septembrie 2007 : Google a lansat o nouă funcție numită „Biblioteca mea”, care permite utilizatorilor să creeze biblioteci personalizate personalizate, selecții de cărți pe care să le poată eticheta, revizui, evalua sau căuta cu text integral.

Decembrie 2007 : Universitatea Columbia a fost adăugată ca partener la digitalizarea lucrărilor din domeniul public.

Mai 2008 : Microsoft a renunțat și a planificat să pună capăt proiectului său de scanare , care ajunsese la 750.000 de cărți și 80 de milioane de articole din jurnale.

Octombrie 2008 : s-a ajuns la o soluție între industria editorială și Google după doi ani de negocieri. Google a fost de acord să compenseze autorii și editorii în schimbul dreptului de a pune la dispoziția publicului milioane de cărți.

Octombrie 2008 : "Shared Digital Repository" HathiTrust (cunoscut mai târziu sub numele de Biblioteca digitală HathiTrust) este lansat în comun de Comitetul pentru cooperare instituțională și de cele 11 biblioteci universitare din sistemul Universității din California , toate fiind biblioteci partenere Google, să arhiveze și să ofere acces academic la cărți din colecțiile lor scanate de Google și de alții.

Noiembrie 2008 : Google a atins valoarea de 7 milioane de cărți pentru articolele scanate de Google și de partenerii lor de publicare. 1 milion erau în modul de previzualizare completă și 1 milion erau lucrări complet vizibile și descărcabile din domeniul public. Aproximativ cinci milioane erau epuizate .

Decembrie 2008 : Google a anunțat includerea revistelor în Google Books. Titlurile includ Revista New York , Ebony și Popular Mechanics

Februarie 2009 : Google a lansat o versiune mobilă a Căutării de carte Google, permițând utilizatorilor de telefoane iPhone și Android să citească peste 1,5 milioane de lucrări de domeniu public în SUA (și peste 500.000 în afara SUA) folosind un browser mobil. În loc de imagini de pagină, este afișat textul simplu al cărții.

Mai 2009 : La convenția anuală BookExpo de la New York, Google și-a semnalat intenția de a introduce un program care să permită editorilor să vândă versiunile digitale ale celor mai noi cărți direct către consumatori prin Google.

Decembrie 2009 : Un tribunal francez a oprit scanarea cărților protejate prin drepturi de autor publicate în Franța, spunând că acest lucru încalcă legile drepturilor de autor. A fost prima pierdere juridică majoră pentru proiectul de scanare.

Aprilie 2010 : artiștii vizuali nu au fost incluși în procesul și soluționarea anterioare, sunt grupurile reclamanților într-un alt proces și spun că intenționează să aducă mai mult decât Google Books sub control. „Noua acțiune colectivă”, citește declarația, „depășește Google Library Project și include alte încălcări sistematice și omniprezente ale Google ale drepturilor fotografilor, ilustratorilor și ale altor artiști vizuali”.

Mai 2010 : s-a raportat că Google va lansa un magazin de cărți digitale numit Google Editions . Ar concura cu Amazon, Barnes & Noble, Apple și alți comercianți cu amănuntul de cărți electronice cu propriul magazin de cărți electronice. Spre deosebire de altele, Google Editions ar fi complet online și nu ar necesita un anumit dispozitiv (cum ar fi kindle, Nook sau iPad).

Iunie 2010 : Google a trecut 12 milioane de cărți scanate.

August 2010 : s-a anunțat că Google intenționează să scaneze toate cele 129.864.880 de cărți cunoscute existente într-un deceniu, în valoare de peste 4 miliarde de pagini digitale și 2 trilioane de cuvinte în total.

Decembrie 2010 : Google eBooks (Google Editions) a fost lansat în SUA.

Decembrie 2010 : Google a lansat Ngram Viewer, care colectează și graficează date despre utilizarea cuvintelor în colecția sa de cărți.

Martie 2011 : un judecător federal a respins acordul încheiat între industria publicării și Google.

Martie 2012 : Google a trecut 20 de milioane de cărți scanate.

Martie 2012 : Google a ajuns la un acord cu editorii.

Ianuarie 2013 : Documentarul Google și creierul mondial a fost prezentat la Sundance Film Festival .

Noiembrie 2013 : Hotărârea din Authors Guild v. Google , judecătorul de district american Denny Chin, este de partea Google, invocând utilizarea corectă. Autorii au spus că vor face apel.

Octombrie 2015 : Curtea de apel s-a alăturat companiei Google, declarând că Google nu a încălcat legea drepturilor de autor. Potrivit New York Times, Google a scanat peste 25 de milioane de cărți.

Aprilie 2016 : Curtea Supremă a SUA a refuzat să audieze apelul Authors Guild, ceea ce înseamnă că decizia instanței inferioare a fost în vigoare, iar Google ar fi permis să scaneze cărțile bibliotecii și să afișeze fragmente în rezultatele căutării fără a încălca legea.

stare

Google a fost destul de secret în ceea ce privește planurile sale cu privire la viitorul proiectului Google Books. Operațiunile de scanare au încetinit cel puțin din 2012, după cum au confirmat bibliotecarii din mai multe instituții partenere Google. La Universitatea din Wisconsin, viteza s-a redus la mai puțin de jumătate din ceea ce era în 2006. Cu toate acestea, bibliotecarii au spus că ritmul scăzut ar putea fi un rezultat natural al maturizării proiectului - inițial stivele de cărți au fost preluate în întregime pentru scanarea întrucât acum trebuiau luate în considerare doar titlurile care nu fuseseră deja scanate. Pagina cronologică Google Books a companiei nu a menționat nimic după 2007, chiar și în 2017, iar blogul Google Books a fost fuzionat în blogul Căutare Google în 2012.

În ciuda câștigării unui litigiu de peste zece ani în 2017, The Atlantic a spus că Google „a închis aproape toate operațiunile de scanare”. În aprilie 2017, Wired a raportat că erau doar câțiva angajați Google care lucrau la proiect, iar cărțile noi erau încă scanate, dar cu o rată semnificativ mai mică. Acesta a comentat că bătălia juridică de un deceniu a făcut ca Google să-și piardă ambiția.

Probleme legale

Prin intermediul proiectului, cărțile bibliotecii erau digitalizate oarecum fără discriminare, indiferent de statutul dreptului de autor, ceea ce a dus la o serie de procese împotriva Google. Până la sfârșitul anului 2008, Google ar fi digitalizat peste șapte milioane de cărți, dintre care doar un milion erau lucrări din domeniul public. Dintre restul, un milion erau în drepturi de autor și în tipar, iar cinci milioane erau în drepturi de autor, dar nu au fost tipărite. În 2005, un grup de autori și editori au inițiat un proces major împotriva companiei Google pentru încălcarea operelor protejate prin drepturi de autor. Google a susținut că păstrează „lucrări orfane” - cărți aflate încă sub drepturi de autor, dar ai căror deținători de drepturi de autor nu au putut fi localizați.

De Autorilor și Asociația Editorilor Americani a dat în judecată separat Google în 2005 pentru proiectul său de carte, invocând „masivă încălcarea drepturilor de autor .“ Google a contestat faptul că proiectul său a reprezentat o utilizare corectă și este echivalentul vârstei digitale a unui catalog de carduri cu fiecare cuvânt din publicație indexat. Procesele au fost consolidate și, în cele din urmă, a fost propusă o soluționare . Acordul a primit critici semnificative dintr-o mare varietate de motive, inclusiv antitrust, confidențialitate și inadecvarea claselor propuse de autori și editori. Acordul a fost în cele din urmă respins, iar editorii s-au stabilit cu Google la scurt timp. Autorii Guild și-au continuat cazul, iar în 2011 clasa propusă a fost certificată . Google a contestat acea decizie, cu un număr de amici care au afirmat inadecvarea clasei , iar al doilea circuit a respins certificarea clasei în iulie 2013, retransmandând cauza în fața instanței de district pentru luarea în considerare a apărării Google a utilizării corecte .

În 2015, Authors Guild a depus o nouă contestație împotriva Google pentru a fi luată în considerare de către a doua Curte de Apel SUA din New York. Google a câștigat cazul în unanimitate pe baza argumentului potrivit căruia nu le arătau oamenilor textele complete, ci în schimb fragmente și nu le permit oamenilor să citească ilegal cartea. Într-un raport, instanțele au declarat că nu au încălcat legile dreptului de autor, deoarece erau protejate în temeiul clauzei de utilizare loială.

Autorii Guild au încercat din nou în 2016 să facă apel la decizie și de data aceasta au luat cazul lor pentru a fi examinat de Curtea Supremă. Cazul a fost respins, lăsând intactă decizia celui de-al doilea circuit, ceea ce înseamnă că Google nu a încălcat legile drepturilor de autor. Acest caz a creat, de asemenea, un precedent pentru alte cazuri similare în ceea ce privește legile privind utilizarea loială, deoarece a clarificat în continuare legea și a extins-o. O astfel de clarificare afectează alte proiecte de scanare similare cu Google.

Alte procese au urmat exemplul Guild Authors. În 2006, un proces german, depus anterior, a fost retras. În iunie 2006, Hervé de la Martinière, un editor francez cunoscut sub numele de La Martinière și Éditions du Seuil , și-a anunțat intenția de a da în judecată Google France. În 2009, Curtea Civilă din Paris a acordat 300.000 EUR (aproximativ 430.000 USD ) în daune și dobânzi și a obligat Google să plătească 10.000 EUR pe zi până când scoate cărțile editorului din baza sa de date. Curtea a scris: „Google a încălcat legile drepturilor de autor ale autorilor, reproducând și făcând accesibile” cărțile pe care Seuil le deține fără permisiunea sa și că Google „a comis acte de încălcare a drepturilor de autor, care sunt dăunătoare editorilor”. Google a spus că va face apel. Syndicat National de l'Edition, care s-a alăturat procesului, a declarat că Google a scanat aproximativ 100.000 de opere franceze sub drept de autor.

În decembrie 2009, autorul chinez Mian Mian a intentat un proces civil pentru 8.900 de dolari împotriva Google pentru scanarea romanului ei, Acid Lovers . Acesta este primul astfel de proces introdus împotriva Google în China. De asemenea, în luna noiembrie a aceluiași an, China Written Works Copyright Society (CWWCS) a acuzat Google că a scanat 18.000 de cărți de 570 de scriitori chinezi fără autorizație. Google a fost de acord, pe 20 noiembrie, să furnizeze o listă de cărți chinezești pe care le scanase, însă compania a refuzat să admită că a „încălcat” legile drepturilor de autor.

În martie 2007, Thomas Rubin, consilier general asociat pentru drepturi de autor, mărci comerciale și secrete comerciale la Microsoft, a acuzat Google că a încălcat legea drepturilor de autor cu serviciul lor de căutare de cărți. Rubin a criticat în mod specific politica Google de a copia în mod liber orice lucrare până la notificarea de către deținătorul drepturilor de autor pentru a opri.

Licențierea Google pentru lucrări din domeniul public este, de asemenea, un domeniu de îngrijorare datorat utilizării tehnicilor digitale de filigranare împreună cu cărțile. Unele lucrări publicate care sunt în domeniul public, cum ar fi toate lucrările create de guvernul federal al SUA , sunt tratate în continuare ca alte opere cu drepturi de autor și, prin urmare, blocate după 1922.

Proiecte similare

  • Proiectul Gutenberg este un efort voluntar de digitalizare și arhivare a operelor culturale, pentru a „încuraja crearea și distribuirea cărților electronice”. A fost fondată în 1971 de Michael S. Hart și este cea mai veche bibliotecă digitală. Începând cu 3 octombrie 2015, Proiectul Gutenberg a ajuns la 50.000 de articole din colecția sa.
  • Internet Archive este o organizație non-profit care digitalizează peste 1000 de cărți pe zi, precum și oglinzi cărți din Google Books și din alte surse. În mai 2011, a găzduit peste 2,8 milioane de cărți din domeniul public, mai mult decât aproximativ 1 milion de cărți din domeniul public la Google Books. Open Library , un proiect partener al Internet Archive, împrumută 80.000 de cărți electronice comerciale scanate și cumpărate vizitatorilor a 150 de biblioteci.
  • HathiTrust menține Biblioteca digitală HathiTrust din 13 octombrie 2008, care păstrează și oferă acces la materialul scanat de Google, unele cărți de arhivă pe Internet și unele scanate local de instituțiile partenere. Începând cu mai 2010, aceasta include aproximativ 6 milioane de volume, dintre care peste 1 milion sunt de domeniu public (cel puțin în SUA).
  • ACLS Humanities E-Book , o colecție online de peste 5.400 de cărți de înaltă calitate în științele umaniste și științele sociale conexe, accesibilă prin abonament instituțional.
  • Microsoft a finanțat scanarea a 300.000 de cărți pentru a crea cărți Live Search la sfârșitul anului 2006. A funcționat până în mai 2008, când proiectul a fost abandonat și cărțile au fost puse la dispoziție în mod gratuit pe Internet Archive.
  • Biblioteca Națională digitală a Indiei (NDLI) este un proiect în cadrul Ministerului Dezvoltarea Resurselor Umane, India. Obiectivul este de a integra mai multe biblioteci digitale naționale și internaționale într-un singur portal web. NDLI oferă acces gratuit la multe cărți în engleză și în limbile indiene.
  • Europeana face legături către aproximativ 10 milioane de obiecte digitale începând cu 2010, inclusiv videoclipuri, fotografii, picturi, audio, hărți, manuscrise, cărți tipărite și ziare din ultimii 2.000 de ani de istorie europeană din peste 1.000 de arhive din Uniunea Europeană.
  • Gallica de la Biblioteca Națională Franceză face legătura cu aproximativ 4.000.000 de cărți digitalizate, ziare, manuscrise, hărți și desene etc. Creată în 1997, biblioteca digitală continuă să se extindă la o rată de aproximativ 5.000 de documente noi pe lună. De la sfârșitul anului 2008, majoritatea noilor documente scanate sunt disponibile în format imagine și text. Majoritatea acestor documente sunt scrise în franceză.
  • Wikisource
  • Alergători

Vezi si

Referințe

Lecturi suplimentare

  • Hoffmann, Anna Lauren (2016). „Cărți Google, biblioteci și respect de sine: justiția informațională dincolo de distribuții”. Biblioteca trimestrială . 86 : 76–92. doi : 10.1086 / 684141 . S2CID  146482065 .
  • Jeanneney, Jean-Noël (2008). Google și mitul cunoașterii universale: o vedere din Europa . Chicago, IL: University of Chicago Press.

linkuri externe