PDF - PDF

Format document portabil
Pictogramă Adobe-PDF
Pictograma Adobe PDF
Adobe PDF.svg
Extensie nume de fișier .pdf
Tipul media internet
Introduceți codul PDF (inclusiv un singur spațiu)
Identificator de tip uniform (UTI) com.adobe.pdf
Număr magic %PDF
Dezvoltat de Adobe Inc. (1991-2008)
ISO (2008–)
Eliberarea inițială 15 iunie 1993 ; Acum 28 de ani ( 15.06.1993 )
Ultima lansare
2.0
Extins la PDF / A , PDF / E , PDF / UA , PDF / VT , PDF / X
Standard ISO 32000-2
Formatul deschis ? da
Site-ul web www .iso .org / standard / 75839 .html

Portable Document Format ( PDF ), standardizat ca ISO 32000 , este un format de fișier dezvoltat de Adobe în 1992 pentru a prezenta documente , inclusiv formatarea textului și imaginile, într-un mod independent de software-ul aplicației , hardware și sistemele de operare . Pe baza limbajului PostScript , fiecare fișier PDF încapsulează o descriere completă a unui document plat cu aspect fix, incluzând textul, fonturile , grafica vectorială , imaginile raster și alte informații necesare pentru afișarea acestuia. PDF își are rădăcinile în „The Camelot Project” inițiat de cofondatorul Adobe John Warnock în 1991.

PDF a fost standardizat ca ISO 32000 în 2008. Ultima ediție ca ISO 32000-2: 2020 a fost publicată în decembrie 2020.

Fișierele PDF pot conține o varietate de conținut în afară de text plat și grafică, inclusiv elemente de structurare logică, elemente interactive, cum ar fi adnotări și câmpuri de formă, straturi, conținut media îmbogățit (inclusiv conținut video), obiecte tridimensionale care utilizează U3D sau PRC , și diverse alte formate de date. Specificația PDF prevede, de asemenea, criptare și semnături digitale , atașamente de fișiere și metadate pentru a permite fluxurile de lucru care necesită aceste caracteristici.

Istorie

Adobe Systems a făcut ca specificațiile PDF să fie disponibile gratuit în 1993. În primii ani PDF-ul a fost popular în principal în fluxurile de lucru de editare computerizată și a concurat cu o varietate de formate precum DjVu , Envoy , Common Ground Digital Paper, Farallon Replica și chiar propriile Adobe Format PostScript .

PDF a fost un format proprietar controlat de Adobe până când a fost lansat ca standard deschis la 1 iulie 2008 și publicat de Organizația Internațională pentru Standardizare ca ISO 32000-1: 2008, moment în care controlul specificațiilor a fost transmis unui comitet ISO de experți voluntari din industrie. În 2008, Adobe a publicat o licență publică de brevet ISO 32000-1 acordând drepturi fără drepturi de autor pentru toate brevetele deținute de Adobe care sunt necesare pentru a realiza, utiliza, vinde și distribui implementări conforme PDF.

PDF 1.7, cea de-a șasea ediție a specificației PDF care a devenit ISO 32000-1, include unele tehnologii proprietare definite doar de Adobe, cum ar fi Adobe XML Forms Architecture (XFA) și extensia JavaScript pentru Acrobat, care sunt menționate de ISO 32000-1 ca normativ și indispensabil pentru implementarea completă a specificației ISO 32000-1. Aceste tehnologii proprietare nu sunt standardizate, iar specificațiile lor sunt publicate numai pe site-ul web Adobe. Multe dintre ele nu sunt de asemenea acceptate de implementările populare ale PDF-urilor de la terți.

În decembrie 2020, a fost publicată a doua ediție a PDF 2.0, ISO 32000-2: 2020, care include clarificări, corecții și actualizări critice ale referințelor normative. ISO 32000-2 nu include tehnologii proprietare ca referințe normative.

Detalii tehnice

Un fișier PDF este adesea o combinație de grafică vectorială , text și grafică bitmap . Tipurile de bază ale conținutului într-un PDF sunt:

  • Text stocat ca fluxuri de conținut (adică, necodificat în text simplu );
  • Grafică vectorială pentru ilustrații și modele care constau din forme și linii;
  • Grafică raster pentru fotografii și alte tipuri de imagini
  • Obiecte multimedia din document.

În reviziile PDF ulterioare, un document PDF poate suporta, de asemenea, link-uri (în interiorul documentului sau pe pagina web), formulare, JavaScript (disponibil inițial ca plugin pentru Acrobat 3.0) sau orice alte tipuri de conținut încorporat care pot fi tratate folosind pluginuri.

PDF combină trei tehnologii:

  • Un subset al limbajului de programare pentru descrierea paginii PostScript , pentru generarea aspectului și a graficii.
  • Un sistem de încorporare / înlocuire a fonturilor pentru a permite fonturilor să călătorească împreună cu documentele.
  • Un sistem de stocare structurat pentru a grupa aceste elemente și orice conținut asociat într-un singur fișier, cu comprimarea datelor, acolo unde este cazul.

Limbaj PostScript

PostScript este un limbaj de descriere a paginii rulat într-un interpret pentru a genera o imagine, un proces care necesită multe resurse. Poate gestiona grafică și caracteristici standard ale limbajelor de programare, precum ifinstrucțiuni și loopcomenzi. PDF-ul se bazează în mare parte pe PostScript, dar este simplificat pentru a elimina caracteristicile de control al fluxului ca acestea, în timp ce comenzile grafice, cum ar fi, linetorămân.

Adesea, codul PDF de tip PostScript este generat dintr-un fișier PostScript sursă. Comenzile grafice care sunt generate de codul PostScript sunt colectate și tokenizate . De asemenea, sunt colectate orice fișiere, grafice sau fonturi la care se referă documentul. Apoi, totul este comprimat într-un singur fișier. Prin urmare, întreaga lume PostScript (fonturi, aspect, măsurători) rămâne intactă.

Ca format de document, PDF are mai multe avantaje față de PostScript:

  • PDF conține rezultate simbolizate și interpretate ale codului sursă PostScript, pentru corespondență directă între modificările aduse articolelor din descrierea paginii PDF și modificările aspectului paginii rezultate.
  • PDF (de la versiunea 1.4) acceptă grafică transparentă ; PostScript nu.
  • PostScript este un limbaj de programare interpretat cu o stare globală implicită, astfel încât instrucțiunile care însoțesc descrierea unei pagini pot afecta aspectul oricărei pagini următoare. Prin urmare, toate paginile precedente dintr-un document PostScript trebuie procesate pentru a determina aspectul corect al unei pagini date, în timp ce fiecare pagină dintr-un document PDF nu este afectată de celelalte. Ca urmare, vizualizatorii PDF permit utilizatorului să sară rapid la ultimele pagini ale unui document lung, în timp ce un vizualizator PostScript trebuie să proceseze secvențial toate paginile înainte de a putea afișa pagina de destinație (cu excepția cazului în care convențiile opționale de structurare a documentelor PostScript au fost atent compilat și inclus).

PDF 1.6 acceptă documente 3D interactive încorporate într-un fișier PDF: desenele 3D pot fi încorporate utilizând U3D sau PRC și diverse alte formate de date.

Tipul fisierului

Un fișier PDF conține caractere ASCII pe 7 biți , cu excepția anumitor elemente care pot avea conținut binar. Fișierul începe cu un antet care conține un număr magic (ca un șir lizibil) și versiunea formatului, de exemplu %PDF-1.7. Formatul este un subset al unui format COS („Carusel” Object Structure). Un fișier arbore COS constă în principal din obiecte , dintre care există nouă tipuri:

  • Valori booleene , reprezentând adevărat sau fals
  • Numere reale
  • Numere întregi
  • Șiruri , cuprinse între paranteze ( (...)). Șirurile pot conține caractere pe 8 biți.
  • Nume, începând cu o bară înainte ( /)
  • Matrice , colecții ordonate de obiecte închise între paranteze pătrate ( [...])
  • Dicționare , colecții de obiecte indexate după nume încadrate între paranteze cu unghi dublu ( <<...>>)
  • Fluxuri , care conțin de obicei cantități mari de date binare opțional comprimate, precedate de un dicționar și cuprinse între cuvintele cheie streamși endstream.
  • Nul obiect

Mai mult, pot exista comentarii, introduse cu semnul procent ( %). Comentariile pot conține caractere pe 8 biți.

Obiectele pot fi directe (încorporate într-un alt obiect) sau indirecte . Obiectele indirecte sunt numerotate cu un număr de obiect și un număr de generație și sunt definite între cuvintele cheie objși endobjdacă se află în rădăcina documentului. Începând cu versiunea PDF 1.5, obiectele indirecte (cu excepția altor fluxuri) pot fi, de asemenea, localizate în fluxuri speciale cunoscute sub numele de fluxuri de obiecte (marcate /Type /ObjStm). Această tehnică permite obiectelor non-stream să li se aplice filtre de stream standard, reduce dimensiunea fișierelor care au un număr mare de obiecte indirecte mici și este utilă în special pentru PDF-uri etichetate . Fluxurile de obiecte nu acceptă specificarea numărului de generație al unui obiect (altul decât 0).

Un tabel index, numit și tabelul cu referințe încrucișate, este situat aproape de sfârșitul fișierului și oferă compensarea octeților fiecărui obiect indirect de la începutul fișierului. Acest design permite accesul aleatoriu eficient la obiectele din fișier și permite, de asemenea, să se facă mici modificări fără a rescrie întregul fișier ( actualizare incrementală ). Înainte de versiunea PDF 1.5, tabelul ar fi întotdeauna într-un format ASCII special, ar fi marcat cu xrefcuvântul cheie și ar urma corpul principal compus din obiecte indirecte. Versiunea 1.5 a introdus fluxuri de referință încrucișată opționale , care au forma unui obiect de flux standard, posibil cu filtre aplicate. Un astfel de flux poate fi utilizat în locul tabelului de referințe încrucișate ASCII și conține compensările și alte informații în format binar. Formatul este flexibil prin faptul că permite specificarea lățimii întregi (folosind /Wmatricea), astfel încât, de exemplu, un document care nu depășește 64  KiB poate dedica doar 2 octeți pentru compensarea obiectelor.

La sfârșitul unui fișier PDF este un subsol care conține:

  • Cuvântul startxrefcheie urmat de un decalaj la începutul tabelului de referințe încrucișate (începând cu xrefcuvântul cheie) sau obiectul fluxului de referințe încrucișate, urmat de
  • %%EOF Sfârșit de fișier markerului.

Dacă nu se folosește un flux de referințe încrucișate, subsolul este precedat de trailercuvântul cheie urmat de un dicționar care conține informații care altfel ar fi conținute în dicționarul obiectului fluxului de referință încrucișată:

  • O referință la obiectul rădăcină al structurii arborelui, cunoscut și sub denumirea de catalog ( /Root)
  • Numărul de obiecte indirecte din tabelul de referință încrucișată ( /Size)
  • Alte informații opționale

Există două aspecte în fișierele PDF: neliniarizate (nu „optimizate”) și linearizate („optimizate”). Fișierele PDF neliniarizate pot fi mai mici decât omologii lor liniari, deși sunt mai lente de acces, deoarece porțiuni din datele necesare pentru asamblarea paginilor documentului sunt împrăștiate în întregul fișier PDF. Fișierele PDF liniarizate (denumite și fișiere PDF „optimizate” sau „web optimizate”) sunt construite într-un mod care le permite să fie citite într-un plugin de browser web fără a aștepta descărcarea întregului fișier, deoarece toate obiectele necesare pentru prima pagină de afișat sunt organizate optim la începutul fișierului. Fișierele PDF pot fi optimizate utilizând software-ul Adobe Acrobat sau QPDF .

Model de imagistică

Proiectarea de bază a modului în care sunt reprezentate graficele în PDF este foarte similară cu cea a PostScript , cu excepția utilizării transparenței , care a fost adăugată în PDF 1.4.

Grafica PDF utilizează un sistem de coordonate carteziene independent de dispozitiv pentru a descrie suprafața unei pagini. O descriere a paginii PDF poate utiliza o matrice pentru a scala , roti sau distorsiona elemente grafice. Un concept cheie în PDF este cel al stării grafice , care este o colecție de parametri grafici care pot fi modificați, salvați și restaurați printr-o descriere a paginii . PDF are (începând cu versiunea 2.0) 25 de proprietăți de stare grafică, dintre care unele dintre cele mai importante sunt:

Grafică vectorială

Ca și în PostScript , grafica vectorială în PDF este construită cu căi . Căile sunt de obicei compuse din linii și curbe cubice Bézier , dar pot fi construite și din contururile textului. Spre deosebire de PostScript, PDF nu permite unei singure căi să amestece contururile textului cu liniile și curbele. Căile pot fi mângâiate, umplute, umplute apoi mângâiate sau utilizate pentru tăiere . Liniile și umpluturile pot utiliza orice set de culori în starea grafică, inclusiv modelele . PDF acceptă mai multe tipuri de modele. Cel mai simplu este modelul de placare în care o piesă de artă este specificată pentru a fi desenată în mod repetat. Acesta poate fi un model de plăci colorate , cu culorile specificate în obiectul modelului, sau un model de plăci necolorate , care diferă specificația culorii în momentul în care este desenat modelul. Începând cu PDF 1.3 există, de asemenea, un model de umbrire , care desenează culori care variază continuu. Există șapte tipuri de modele de umbrire, dintre care cele mai simple sunt umbrirea axială (tip 2) și umbrirea radială (tip 3).

Imagini raster

Imaginile raster în PDF (numite Image XObjects ) sunt reprezentate de dicționare cu un flux asociat. Dicționarul descrie proprietățile imaginii, iar fluxul conține datele imaginii. (Mai puțin frecvent, imaginile raster mici pot fi încorporate direct într-o descriere a paginii ca o imagine în linie .) Imaginile sunt de obicei filtrate în scopuri de compresie. Filtrele de imagine acceptate în PDF includ următoarele filtre de uz general:

  • ASCII85Decode , un filtru folosit pentru a pune fluxul în ASCII pe 7 biți ,
  • ASCIIHexDecode , similar cu ASCII85Decode, dar mai puțin compact,
  • FlateDecode , un filtru utilizat în mod obișnuit bazat pe algoritmul de dezumflare definit în RFC  1951 (dezumflarea este utilizată și în formatele de fișiere gzip , PNG și zip , printre altele); introdus în PDF 1.2; poate folosi unul dintre cele două grupuri de funcții predictive pentru compresie zlib / deflate mai compactă: Predictor 2 din specificația TIFF 6.0 și predictori (filtre) din specificația PNG ( RFC  2083 ),
  • LZWDecode , un filtru bazat pe compresia LZW ; poate utiliza unul dintre cele două grupuri de funcții predictive pentru compresie LZW mai compactă: Predictor 2 din specificația TIFF 6.0 și predictori (filtre) din specificația PNG,
  • RunLengthDecode , o metodă simplă de compresie pentru fluxuri cu date repetitive utilizând algoritmul de codare a lungimii de rulare și filtrele specifice imaginii,
  • DCTDecode , un filtru cu pierderi bazat pe standardul JPEG ,
  • CCITTFaxDecode , un filtru cu două niveluri (negru / alb) fără pierderi bazat pe standardul de compresie a faxurilor Grup 3 sau 4 Grup CCITT (ITU-T) definit în ITU-T T.4 și T.6,
  • JBIG2Decode , un filtru bi-nivel (negru / alb) cu pierderi sau fără pierderi bazat pe standardul JBIG2 , introdus în PDF 1.4 și
  • JPXDecode , un filtru cu pierderi sau fără pierderi bazat pe standardul JPEG 2000 , introdus în PDF 1.5.

În mod normal, tot conținutul imaginii dintr-un PDF este încorporat în fișier. Dar PDF permite stocarea datelor de imagine în fișiere externe prin utilizarea fluxurilor externe sau a imaginilor alternative . Subseturile standardizate de PDF, inclusiv PDF / A și PDF / X , interzic aceste caracteristici.

Text

Textul în PDF este reprezentat de elemente de text în fluxurile de conținut ale paginii. Un element text specifică faptul că caracterele trebuie desenate în anumite poziții. Caracterele sunt specificate folosind codificarea unei resurse de font selectate .

Un obiect font în PDF este o descriere a unui tipar digital . Poate fie să descrie caracteristicile unui tip de caractere, fie poate include un fișier de font încorporat . Ultimul caz este numit font încorporat, în timp ce primul este numit font neîncorporat . Fișierele de fonturi care pot fi încorporate se bazează pe formate de fonturi digitale standard utilizate pe scară largă: Tip 1 (și varianta sa comprimată CFF), TrueType și (începând cu PDF 1.6) OpenType . În plus, PDF acceptă varianta de tip 3 în care componentele fontului sunt descrise de operatorii grafici PDF.

Paisprezece caractere, cunoscute sub numele de 14 fonturi standard , au o semnificație specială în documentele PDF:

  • Times (v3) (cu caractere obișnuite, italice, aldine și italice aldine)
  • Curier (în regulat, oblic, îndrăzneț și oblic îndrăzneț)
  • Helvetica (v3) (în regulat, oblic, îndrăzneț și oblic îndrăzneț)
  • Simbol
  • Zapf Dingbats

Aceste fonturi sunt uneori numite baza de paisprezece fonturi . Aceste fonturi, sau fonturi de înlocuire adecvate cu aceleași valori, ar trebui să fie disponibile în majoritatea cititoarelor PDF, dar nu sunt garantate că sunt disponibile în cititor și pot fi afișate corect numai dacă sistemul le are instalate. Fonturile pot fi înlocuite dacă nu sunt încorporate într-un PDF.

În cadrul șirurilor de text, caracterele sunt afișate folosind coduri de caractere (numere întregi) care se mapează la glifele din fontul curent utilizând o codificare . Există o serie de codificări predefinite, inclusiv WinAnsi , MacRoman și multe codificări pentru limbile din Asia de Est și un font poate avea propria codificare încorporată. (Deși codificările WinAnsi și MacRoman sunt derivate din proprietățile istorice ale sistemelor de operare Windows și Macintosh , fonturile care utilizează aceste codificări funcționează la fel de bine pe orice platformă.) PDF poate specifica o codificare predefinită de utilizat, codificarea încorporată a fontului sau furnizarea un tabel de căutare a diferențelor față de o codificare predefinită sau încorporată (nerecomandat cu fonturile TrueType). Mecanismele de codificare din PDF au fost concepute pentru fonturile de tip 1, iar regulile pentru aplicarea acestora la fonturile TrueType sunt complexe.

Pentru fonturi mari sau fonturi cu glifuri non-standard, sunt utilizate codificările speciale Identity-H (pentru scrierea orizontală) și Identity-V (pentru verticală). Cu astfel de fonturi, este necesar să se furnizeze un tabel ToUnicode dacă se păstrează informații semantice despre caractere.

Transparenţă

Modelul de imagine original al PDF-ului a fost, la fel ca al lui PostScript, opac : fiecare obiect desenat pe pagină a înlocuit complet orice a fost marcat anterior în aceeași locație. În PDF 1.4, modelul de imagine a fost extins pentru a permite transparența. Când se folosește transparența, obiectele noi interacționează cu obiectele marcate anterior pentru a produce efecte de amestecare. Adăugarea transparenței la PDF a fost făcută prin intermediul unor noi extensii care au fost concepute pentru a fi ignorate în produsele scrise în PDF 1.3 și specificațiile anterioare. Ca rezultat, fișierele care utilizează o cantitate mică de transparență ar putea fi vizualizate în mod acceptabil de către spectatorii mai în vârstă, dar fișierele care utilizează pe scară largă transparența ar putea fi vizualizate incorect de un vizualizator mai vechi fără avertisment.

Extensiile de transparență se bazează pe conceptele cheie ale grupurilor de transparență , moduri de amestecare , formă și alfa . Modelul este strâns aliniat cu caracteristicile versiunii Adobe Illustrator 9. Modurile de amestecare se bazau pe cele utilizate de Adobe Photoshop la acea vreme. Când a fost publicată specificația PDF 1.4, formulele pentru calcularea modurilor de amestecare au fost păstrate secrete de către Adobe. De atunci au fost publicate.

Conceptul unui grup de transparență în specificațiile PDF este independent de noțiunile existente de „grup” sau „strat” în aplicații precum Adobe Illustrator. Aceste grupări reflectă relații logice între obiecte care sunt semnificative atunci când editează acele obiecte, dar nu fac parte din modelul de imagine.

Caracteristici suplimentare

Structura logică și accesibilitate

Un PDF „etichetat” (a se vedea clauza 14.8 din ISO 32000) include structura documentului și informații despre semantică pentru a permite extragerea și accesibilitatea fiabilă a textului . Din punct de vedere tehnic, PDF-ul etichetat este o utilizare stilizată a formatului care se bazează pe cadrul de structură logică introdus în PDF 1.3. PDF etichetat definește un set de tipuri de structuri standard și atribute care permit extragerea și reutilizarea conținutului paginii (text, grafică și imagini) în alte scopuri.

PDF-ul etichetat nu este necesar în situațiile în care un fișier PDF este destinat doar tipăririi. Deoarece caracteristica este opțională și din moment ce regulile pentru PDF-urile etichetate erau relativ vagi în ISO 32000-1, suportul pentru PDF-urile etichetate printre dispozitivele consumatoare, inclusiv tehnologia de asistență (AT), este inegal în acest moment. ISO 32000-2, cu toate acestea, include o discuție îmbunătățită despre PDF-ul etichetat, care se anticipează pentru a facilita adoptarea ulterioară.

Un subset de PDF standardizat ISO care vizează în mod special accesibilitatea, PDF / UA , a fost publicat pentru prima dată în 2012.

Grupuri de conținut opționale (straturi)

Odată cu introducerea versiunii PDF, 1.5 (2003) a apărut conceptul de Straturi. Straturile sau, deoarece sunt mai cunoscute în mod oficial Grupuri de conținut opționale (OCG), se referă la secțiuni de conținut dintr-un document PDF care pot fi vizualizate sau ascunse selectiv de către autori sau consumatori de documente. Această capacitate este utilă în desene CAD, lucrări de artă stratificate, hărți, documente în mai multe limbi etc.

Practic, acesta constă dintr-un dicționar opțional de proprietăți de conținut adăugat la rădăcina documentului. Acest dicționar conține o serie de grupuri de conținut opțional (OCG), fiecare descriind un set de informații și fiecare dintre acestea poate fi afișat sau suprimat individual, plus un set de dicționare opționale de configurare a conținutului, care oferă statutul (Afișat sau Suprimat) date OCG-uri.

Criptare și semnături

Un fișier PDF poate fi criptat , pentru siguranță, caz în care este necesară o parolă pentru a vizualiza sau edita conținutul. PDF 2.0 definește criptarea AES pe 256 de biți ca standard pentru fișierele PDF 2.0. Referința PDF definește, de asemenea, modalități prin care terții își pot defini propriile sisteme de criptare pentru PDF.

Fișierele PDF pot fi semnate digital, pentru a asigura autentificarea sigură; detalii complete despre implementarea semnăturilor digitale în PDF sunt furnizate în ISO 32000-2.

Fișierele PDF pot conține, de asemenea, restricții DRM încorporate care oferă controale suplimentare care limitează copierea, editarea sau tipărirea. Aceste restricții depind de software-ul cititorului pentru a le respecta, astfel încât securitatea pe care o oferă este limitată.

Securitatea standard oferită de Acrobat PDF constă din două metode diferite și două parole diferite: o parolă de utilizator , care criptează fișierul și împiedică deschiderea și o parolă de proprietar , care specifică operațiunile care ar trebui restricționate chiar și atunci când documentul este decriptat, care poate includ modificarea, tipărirea sau copierea textului și a graficelor din document sau adăugarea sau modificarea notelor de text și a câmpurilor AcroForm . Parola de utilizator criptează fișierul, în timp ce parola de proprietar nu, bazându-se în schimb pe software-ul clientului pentru a respecta aceste restricții. O parolă de proprietar poate fi ușor eliminată de software, inclusiv unele servicii online gratuite. Astfel, restricțiile de utilizare pe care autorul unui document le plasează pe un document PDF nu sunt sigure și nu pot fi asigurate odată ce fișierul este distribuit; acest avertisment este afișat atunci când se aplică astfel de restricții utilizând software-ul Adobe Acrobat pentru a crea sau edita fișiere PDF.

Chiar și fără a elimina parola, majoritatea cititorilor de PDF-uri freeware sau open source ignoră „protecțiile” permisiunii și permit utilizatorului să imprime sau să copieze fragmente din text ca și cum documentul nu ar fi limitat de protecția prin parolă.

Începând cu PDF 1.5, semnăturile cu drepturi de utilizare (UR) sunt utilizate pentru a activa caracteristici interactive suplimentare care nu sunt disponibile în mod implicit într-o anumită aplicație PDF Viewer. Semnătura este utilizată pentru a valida faptul că permisiunile au fost acordate de o autoritate care acordă bona fide . De exemplu, poate fi folosit pentru a permite unui utilizator:

  • Pentru a salva documentul PDF împreună cu un formular modificat și / sau date de adnotare
  • Importați fișiere de date de formulare în format FDF, XFDF și text (CSV / TSV)
  • Exportați fișierele de date ale formularului în formatele FDF și XFDF
  • Trimiteți datele formularului
  • Instantați pagini noi din șabloane de pagini denumite
  • Aplicați o semnătură digitală câmpului formularului de semnătură digitală existent
  • Creați, ștergeți, modificați, copiați, importați și exportați adnotări

De exemplu, Adobe Systems acordă permisiuni pentru a activa funcții suplimentare în Adobe Reader, utilizând criptografie cu cheie publică . Adobe Reader verifică dacă semnătura utilizează un certificat de la o autoritate de certificare autorizată Adobe. Orice aplicație PDF poate utiliza același mecanism în scopuri proprii.

În circumstanțe specifice, inclusiv sisteme neperfectate ale receptorului, informațiile pe care le vede receptorul unui document digital semnat pot fi manipulate de către expeditor după ce documentul a fost semnat de semnatar.

PAdES ( PDF Advanced Electronic Signatures ) este un set de restricții și extensii la PDF și ISO 32000-1, făcându-l potrivit pentru semnături electronice avansate . Acest lucru este publicat de ETSI sub numele de TS 102 778.

Fișierele atașate

Fișierele PDF pot avea atașamente de fișiere pe care procesoarele le pot accesa și deschide sau salva pe un sistem de fișiere local.

Metadate

Fișierele PDF pot conține două tipuri de metadate. Primul este Dicționarul de informații despre document, un set de câmpuri cheie / valoare precum autor, titlu, subiect, date de creare și actualizare. Acest lucru este opțional și este menționat din Infocheia din trailerul fișierului. Este definit un set mic de câmpuri și poate fi extins cu valori de text suplimentare, dacă este necesar. Această metodă este învechită în PDF 2.0.

În PDF 1.4, a fost adăugat suport pentru fluxurile de metadate, utilizând platforma extensibilă de metadate (XMP) pentru a adăuga metadate extensibile bazate pe standarde XML așa cum sunt utilizate în alte formate de fișiere. PDF 2.0 permite atașarea metadatelor la orice obiect din document, cum ar fi informații despre ilustrații încorporate, fonturi, imagini, precum și întregul document (atașarea la catalogul documentelor), utilizând o schemă extensibilă.

Documentele PDF pot conține, de asemenea, setări de afișare, inclusiv aspectul afișării paginii și nivelul de zoom într-un obiect Preferințe vizualizator. Adobe Reader folosește aceste setări pentru a înlocui setările implicite ale utilizatorului la deschiderea documentului. Adobe Reader gratuit nu poate elimina aceste setări.

Accesibilitate

Fișierele PDF pot fi create special pentru a fi accesibile persoanelor cu dizabilități. Formatele de fișiere PDF utilizate în 2014 pot include etichete, echivalente de text, subtitrări, descrieri audio și multe altele. Unele programe pot produce automat fișiere PDF etichetate , dar această caracteristică nu este întotdeauna activată în mod implicit. Cititorii de ecran de top , inclusiv JAWS , Window-Eyes , Hal și Kurzweil 1000 și 3000 pot citi PDF-uri etichetate. Mai mult, PDF-urile etichetate pot fi redefinite și mărite pentru cititorii cu deficiențe de vedere. Adăugarea etichetelor la fișierele PDF mai vechi și a celor generate de documente scanate poate prezenta unele provocări.

Una dintre provocările semnificative cu accesibilitatea PDF este că documentele PDF au trei vizualizări distincte, care, în funcție de crearea documentului, pot fi incompatibile între ele. Cele trei vizualizări sunt (i) vizualizarea fizică, (ii) vizualizarea etichetelor și (iii) vizualizarea conținutului. Vizualizarea fizică este afișată și tipărită (ceea ce majoritatea oamenilor consideră un document PDF). Vizualizarea etichetelor este ceea ce utilizează cititoarele de ecran și alte tehnologii de asistență pentru a oferi experiență de navigare și citire de înaltă calitate utilizatorilor cu dizabilități. Vizualizarea conținutului se bazează pe ordinea fizică a obiectelor din fluxul de conținut PDF și poate fi afișată de un software care nu acceptă pe deplin vizualizarea etichetelor, cum ar fi caracteristica Reflow din Adobe's Reader.

PDF / UA , Standardul internațional pentru PDF accesibil bazat pe ISO 32000-1 a fost publicat pentru prima dată ca ISO 14289-1 în 2012 și stabilește un limbaj normativ pentru tehnologia PDF accesibilă.

Multimedia

Rich Media PDF este un fișier PDF care include conținut interactiv care poate fi încorporat sau legat în fișier.

Formulare

Formulare interactive este un mecanism pentru a adăuga formulare în formatul de fișier PDF. PDF acceptă în prezent două metode diferite pentru integrarea formularelor de date și PDF. Ambele formate coexistă astăzi în specificația PDF:

  • AcroForms (cunoscut și sub numele de formulare Acrobat), introdus în specificația formatului PDF 1.2 și inclus în toate specificațiile PDF ulterioare.
  • Formulare XML Forms Architecture (XFA), introduse în specificația formatului PDF 1.5. Formularele Adobe XFA nu sunt compatibile cu AcroForms. XFA a fost depreciat din PDF cu PDF 2.0.

AcroForms au fost introduse în format PDF 1.2. AcroForms permit utilizarea de obiecte ( de exemplu , casete de text , butoane radio , etc. ) și un cod ( de exemplu , JavaScript ). Pe lângă tipurile de acțiuni PDF standard, formularele interactive (AcroForms) acceptă trimiterea, resetarea și importul de date. Acțiunea „trimitere” transmite numele și valorile câmpurilor de formulare interactive selectate către un localizator de resurse uniform (URL) specificat. Numele și valorile câmpurilor de formulare interactive pot fi trimise în oricare dintre următoarele formate (în funcție de setările marcajelor ExportFormat, SubmitPDF și XFDF ale acțiunii):

Formatul formularului HTML
Specificații HTML 4.01 din PDF 1.5; HTML 2.0 de la 1.2
Formulare date Formulare (FDF)
bazat pe PDF, utilizează aceeași sintaxă și are în esență aceeași structură de fișiere, dar este mult mai simplu decât PDF, deoarece corpul unui document FDF constă dintr-un singur obiect necesar. Formularul de date este definit în specificația PDF (din PDF 1.2). Formularul de date al formularului poate fi utilizat atunci când trimiteți datele formularului către un server, primiți răspunsul și le încorporați în formularul interactiv. Poate fi, de asemenea, utilizat pentru a exporta datele formularului în fișiere independente care pot fi importate înapoi în formularul interactiv PDF corespunzător. FDF a fost inițial definit în 1996 ca parte a ISO 32000-2: 2017.
XML Forms Data Format (XFDF)
(Specificația formatului de date XML Forms extern, versiunea 2.0; acceptată din PDF 1.5; a înlocuit formatul de trimitere a formularului „XML” definit în PDF 1.4) versiunea XML a Forms Data Format, dar XFDF implementează doar un subset de formulare care conțin FDF și adnotări. Unele intrări din dicționarul FDF nu au echivalente XFDF - cum ar fi Status, Encoding, JavaScript, cheile Page, EmbeddedFDFs, Differences și Target. În plus, XFDF nu permite reproducerea sau adăugarea de noi pagini pe baza datelor date; așa cum se poate face atunci când se utilizează un fișier FDF. Specificația XFDF este menționată (dar nu este inclusă) în specificația PDF 1.5 (și în versiunile ulterioare). Este descris separat în Specificațiile formatului de date XML Forms . Specificația PDF 1.4 a permis trimiterile de formulare în format XML, dar aceasta a fost înlocuită cu trimiteri în format XFDF în specificația PDF 1.5. XFDF este conform cu standardul XML. XFDF poate fi utilizat în același mod ca FDF; de exemplu, datele formularului sunt trimise către un server, modificările sunt făcute, apoi trimise înapoi și noile date ale formularului sunt importate într-o formă interactivă. Poate fi, de asemenea, utilizat pentru a exporta datele formularului în fișiere independente care pot fi importate înapoi în formularul interactiv PDF corespunzător. Începând cu august 2019, XFDF 3.0 este un standard ISO / IEC sub denumirea oficială ISO 19444-1: 2019 - Gestionarea documentelor - Format de date XML Forms - Partea 1: Utilizarea ISO 32000-2 (XFDF 3.0) . Acest standard este o referință normativă a ISO 32000-2.
PDF
întregul document poate fi trimis mai degrabă decât câmpuri și valori individuale, așa cum a fost definit în PDF 1.4.

AcroForms poate păstra valorile câmpului formularului în fișiere independente externe care conțin perechi cheie: valoare. Fișierele externe pot utiliza fișiere Forms Data Format (FDF) și XML Forms Data Format (XFDF). Semnăturile privind drepturile de utilizare (UR) definesc drepturile pentru importul fișierelor de date ale formularelor în formatele FDF, XFDF și text ( CSV / TSV ) și exportă fișierele de date ale formularelor în formatele FDF și XFDF.

În PDF 1.5, Adobe Systems a introdus un format proprietar pentru formulare; Adobe XML Forms Architecture (XFA). Formularele Adobe XFA nu sunt compatibile cu caracteristica AcroForms a ISO 32000, iar majoritatea procesoarelor PDF nu gestionează conținutul XFA. Specificația XFA este menționată din ISO 32000-1 / PDF 1.7 ca o specificație externă de proprietate și a fost în întregime depreciată din PDF cu ISO 32000-2 (PDF 2.0).

Licențierea

Oricine poate crea aplicații care pot citi și scrie fișiere PDF fără a trebui să plătească redevențe către Adobe Systems ; Adobe deține brevete pentru PDF, dar le licențiază pentru utilizare fără redevențe în dezvoltarea de software care respectă specificațiile sale PDF.

Securitate

În noiembrie 2019, cercetătorii de la Ruhr University Bochum și Hackmanit GmbH au publicat atacuri asupra PDF-urilor semnate digital. Au arătat cum să modificați conținutul vizibil într-un PDF semnat fără a invalida semnătura în 21 din 22 de vizualizatoare PDF desktop și 6 din 8 servicii de validare online, abuzând de defectele de implementare. În cadrul aceleiași conferințe, au arătat în plus cum să exfiltrăm textul complet al conținutului criptat în PDF-uri. În 2021, au arătat noi așa-numitele atacuri shadow asupra PDF-urilor care abuzează de flexibilitatea caracteristicilor prevăzute în specificație. Jens Müller a prezentat o prezentare generală a problemelor de securitate din fișierele PDF referitoare la refuzul de serviciu , divulgarea informațiilor , manipularea datelor și atacurile de executare a codului arbitrar .

Fișierele atașate PDF care transportă viruși au fost descoperite pentru prima dată în 2001. Virusul, numit OUTLOOK.PDFWorm sau Peachy , folosește Microsoft Outlook pentru a se trimite ca fișier Adobe PDF atașat. A fost activat cu Adobe Acrobat, dar nu cu Acrobat Reader.

Din când în când, noi vulnerabilități sunt descoperite în diferite versiuni ale Adobe Reader, ceea ce determină compania să emită remedieri de securitate. Alte cititoare de PDF sunt, de asemenea, susceptibile. Un factor agravant este că un cititor PDF poate fi configurat pentru a porni automat dacă o pagină web are un fișier PDF încorporat, oferind un vector pentru atac. Dacă o pagină web rău intenționată conține un fișier PDF infectat care profită de o vulnerabilitate în cititorul PDF, sistemul poate fi compromis chiar dacă browserul este sigur. Unele dintre aceste vulnerabilități sunt rezultatul standardului PDF care permite ca documentele PDF să fie scriptate cu JavaScript. Dezactivarea executării JavaScript în cititorul PDF poate ajuta la atenuarea unor astfel de exploitări viitoare, deși nu protejează împotriva exploatărilor din alte părți ale software-ului de vizualizare PDF. Experții în securitate spun că JavaScript nu este esențial pentru un cititor PDF și că beneficiul de securitate care decurge din dezactivarea JavaScript depășește orice problemă de compatibilitate cauzată. O modalitate de a evita exploatarea fișierelor PDF este să aveți un serviciu local sau web care să convertească fișierele într-un alt format înainte de vizualizare.

La 30 martie 2010, cercetătorul în domeniul securității, Didier Stevens, a raportat un exploit Adobe Reader și Foxit Reader care execută un executabil rău intenționat dacă utilizatorul îi permite să se lanseze atunci când este întrebat.

Software

Spectatori și editori

Vizualizatorii PDF sunt, în general, furnizați gratuit, iar multe versiuni sunt disponibile dintr-o varietate de surse.

Există multe opțiuni software pentru crearea PDF-urilor, inclusiv capacitățile de imprimare PDF încorporate în macOS , iOS și în majoritatea distribuțiilor Linux , LibreOffice , Microsoft Office 2007 (dacă este actualizat la SP2 ) și ulterior, WordPerfect 9, Scribus , numeroase drivere de imprimare PDF pentru Microsoft Windows , sistemul de tipărire pdfTeX , instrumentele DocBook PDF, aplicațiile dezvoltate în jurul Ghostscript și Adobe Acrobat în sine, precum și Adobe InDesign , Adobe FrameMaker , Adobe Illustrator , Adobe Photoshop . Google suită de birou on - line e Google Docs permite încărcarea și salvarea PDF. Unele aplicații web oferă instrumente gratuite de editare și adnotare PDF.

Free Software Foundation o dată gândit ca fiind unul dintre lor proiecte cu prioritate ridicată pentru a fi „ în curs de dezvoltare, cu o înaltă calitate gratuit și un set complet funcțional de biblioteci și programe care implementează formatul de fișier PDF și tehnologii asociate cu standardul ISO 32000.“ În 2011, însă, proiectul GNU PDF a fost eliminat din lista „proiectelor cu prioritate ridicată” datorită maturizării bibliotecii Poppler , care s-a bucurat de o utilizare mai largă în aplicații precum Evince cu mediul desktop GNOME . Poppler se bazează pe baza codului Xpdf . Există, de asemenea, biblioteci de dezvoltare comercială disponibile, așa cum sunt listate în Lista software-ului PDF .

Proiectul Apache PDFBox al Apache Software Foundation este o bibliotecă Java open source pentru lucrul cu documente PDF. PDFBox este licențiat sub licența Apache .

Tipărire

Procesoarele de imagini raster (RIP) sunt utilizate pentru a converti fișiere PDF într-un format raster adecvat pentru imagini pe hârtie și alte suporturi în imprimante, prese de producție digitale și preimprimare într-un proces cunoscut sub numele de rasterizare . RIP-urile capabile să proceseze PDF includ direct Adobe PDF Print Engine de la Adobe Systems și Jaws și Harlequin RIP de la Global Graphics .

În 1993, procesorul de imagine raster Jaws de la Global Graphics a devenit primul RIP de preimprimare a transportului care a interpretat PDF-ul în mod nativ, fără conversie în alt format. Compania a lansat un upgrade la Harlequin RIP cu aceeași capacitate în 1997.

Agfa-Gevaert a introdus și livrat Apogee, primul sistem de pre-imprimare bazat pe PDF, în 1997.

Multe imprimante offset comerciale au acceptat trimiterea fișierelor PDF pregătite pentru presare ca sursă de imprimare, în special subsetul PDF / X-1a și variațiile acestora. Trimiterea fișierelor PDF pregătite pentru presă înlocuiește nevoia problematică de primire a fișierelor de lucru native colectate.

În 2006, PDF-ul a fost acceptat pe scară largă ca format standard al lucrărilor de tipărire la Summit-ul de tipărire Open Source Development Labs . Este acceptat ca format de lucru de tipărire de sistemul de imprimare Common Unix, iar proiectele de aplicații desktop precum GNOME , KDE , Firefox , Thunderbird , LibreOffice și OpenOffice au trecut pentru a emite lucrări de imprimare în PDF.

Unele imprimante desktop acceptă, de asemenea, imprimarea directă PDF, care poate interpreta datele PDF fără ajutor extern.

Model de afișaj nativ

PDF-ul a fost selectat ca format „nativ” de metafișier pentru Mac OS X , înlocuind formatul PICT al vechiului Mac OS clasic . Modelul de imagine al stratului grafic Quartz se bazează pe modelul comun pentru Afișare PostScript și PDF, ducând la porecla Afișare PDF . Aplicația Preview poate afișa fișiere PDF, la fel ca versiunea 2.0 și versiunile ulterioare ale browserului web Safari . Suportul la nivel de sistem pentru PDF permite aplicațiilor Mac OS X să creeze automat documente PDF, cu condiția ca acestea să accepte arhitectura de imprimare standard OS. Fișierele sunt apoi exportate în format PDF 1.3 conform antetului fișierului. Când realizați o captură de ecran în versiunile Mac OS X 10.0 până la 10.3, imaginea a fost capturată și ca PDF; versiunile ulterioare salvează capturile de ecran ca fișier PNG , deși acest comportament poate fi setat înapoi la PDF, dacă se dorește.

Adnotare

Adobe Acrobat este un exemplu de software proprietar care permite utilizatorului să adnote, să evidențieze și să adauge note la fișierele PDF deja create. O aplicație UNIX disponibilă ca software gratuit (sub licența publică generală GNU ) este PDFedit . Freeware Foxit Reader , disponibil pentru Microsoft Windows , MacOS și Linux , permite adnotarea documentelor. PDF-XChange Viewer de la Tracker Software permite adnotări și marcaje fără restricții în alternativa gratuită. Apple a lui MacOS e integrat vizualizator PDF, previzualizare, nu permite , de asemenea , ca adnotări face open-source software - ul glet , cu interacțiunea urmă de sprijin cu LaTeX , SyncTeX și PDFSync și integrarea cu BibDesk software - ul de management de referință. Freeware Qiqqa poate crea un raport de adnotări care rezumă toate adnotările și notele pe care le-a făcut în biblioteca lor de PDF-uri. Instrumentul de verificare a textului exportă diferențe în documente ca adnotări și marcaje.

Există, de asemenea, sisteme de adnotări web care acceptă adnotarea în format PDF și alte documente. În cazurile în care se așteaptă ca PDF-urile să aibă toate funcționalitățile documentelor pe hârtie, este necesară adnotarea cu cerneală.

Alternative

Open XML Paper Specification este un format de concurente utilizat atât ca limbă de descriere a paginii și ca format nativ de imprimare derulator pentru Microsoft Windows începând cu Windows Vista .

Obiect mixt: Arhitectura conținutului documentului este un format concurent. MO: DCA-P face parte din Advanced Function Presentation .

Vezi si

Referințe

Lecturi suplimentare

linkuri externe