Dolby Digital Plus - Dolby Digital Plus

Sigla Dolby Digital Plus

Dolby Digital Plus , cunoscut și sub numele de Enhanced AC-3 (și prescurtat în mod obișnuit ca DD + sau E-AC-3 sau EC-3 ) este o schemă de compresie audio digitală dezvoltată de Dolby Labs pentru transportul și stocarea sunetului digital multi-canal. Este un succesor al Dolby Digital (AC-3), dezvoltat și de Dolby, și are o serie de îmbunătățiri, inclusiv suport pentru o gamă mai largă de rate de date (32 kbit / s până la 6144 kbit / s), număr crescut de canale și multi - suport pentru programe (prin intermediul fluxurilor secundare) și instrumente suplimentare (algoritmi) pentru reprezentarea datelor comprimate și contracararea artefactelor. În timp ce Dolby Digital (AC-3) acceptă până la cinci canale audio cu lățime de bandă completă la un bitrate maxim de 640 kbit / s, E-AC-3 acceptă până la 15 canale audio cu lățime de bandă completă la un bitrate maxim de 6.144  Mbit / s .

Setul complet de specificații tehnice pentru E-AC-3 (și AC-3) sunt standardizate și publicate în anexa E la ATSC A / 52: 2012, precum și în anexa E la ETSI TS 102 366 V1.2.1 (2008-2008) ), publicat de Advanced Television Systems Committee .

Detalii tehnice

Specificații

Dolby Digital Plus este capabil de următoarele:

  • Rata de biți codată: 0,032 până la 6,144 Mbit / s
  • Canale audio: 1,0 la 15,1 (adică de la mono la 15 canale cu gamă completă și un canal cu efecte de frecvență joasă)
  • Număr de programe audio pe flux de biți: 8
  • Rată de eșantionare: 32, 44,1 sau 48 kHz

Structura

Un serviciu Dolby Digital Plus constă din unul sau mai multe fluxuri secundare . Există trei tipuri de fluxuri secundare:

  • Sub-fluxuri independente, care pot conține un singur program de până la 5,1 canale. Până la opt sub-fluxuri dependente pot fi prezente într-un flux Dolby Digital Plus. Canalele prezente într-un flux secundar independent sunt limitate la canalele tradiționale 5.1: stânga (L), dreapta (R), centru (C), stânga Surround (Ls) și dreapta Surround (Rs), precum și o frecvență joasă Canal de efecte (Lfe).
  • Sub-fluxuri vechi, care conțin un singur program 5.1 și care corespund direct conținutului Dolby Digital. Cel mult un flux secundar moștenit poate fi prezent într-un flux DD +.
  • Sub-fluxuri dependente, care conțin canale suplimentare dincolo de canalele 5.1 tradiționale. Deoarece fluxurile secundare dependente au aceeași structură ca și fluxurile independente, fiecare flux secundar dependent poate conține până la cinci canale cu lățime de bandă completă și un canal cu frecvență joasă; cu toate acestea, aceste canale pot fi alocate diferitelor destinații de plasare a difuzoarelor. Metadatele din fluxul secundar descriu scopul fiecărui canal inclus.

Toate fluxurile DD + trebuie să conțină cel puțin un flux secundar independent sau un flux secundar vechi, care conține primul (sau singurul) canal 5.1 al programului audio primar. Sub-fluxuri independente suplimentare pot fi utilizate pentru programe audio secundare, cum ar fi coloane sonore în limbi străine, comentarii sau descrieri / voci în comun pentru persoanele cu deficiențe de vedere. Sub-fluxuri dependente pot fi furnizate pentru programele care au canale de sunet suplimentare dincolo de 5.1.

În cadrul fiecărui flux secundar, se prevede codificarea a cinci canale cu lățime de bandă completă, un canal cu frecvență joasă și un canal de cuplare. Canalul de cuplare este utilizat pentru informații cu frecvență medie-înaltă, care sunt comune mai multor canale cu lățime de bandă completă. Conținutul său este amestecat cu celelalte canale într-un mod prescris de metadate, nu este reprodus ca un canal discret de către decodor.

Dolby Digital Plus include metadate de flux de biți cuprinzătoare pentru controlul decodificatorului asupra intensității sonorului de ieșire (prin dialnorm), amestecării în jos și controlului intervalului dinamic reversibil (prin DRC).

Sintaxă

Dolby Digital Plus este nominal un protocol aliniat pe 16 biți, deși foarte puține câmpuri din sintaxă respectă limitele de octet sau cuvânt. Deoarece multe elemente de sintaxă sunt opționale sau cu lungime variabilă, inclusiv unele a căror prezență sau lungime depinde de calculele precedente complexe și există o redundanță redusă în sintaxă, DD + poate fi extrem de dificil de analizat corect, cu analize sintactice valide, dar incorecte, ușor de produs prin codificatoare defecte.

Un flux DD + este o colecție de pachete de sincronizare cu lungime fixă , fiecare dintre acestea corespunzând fie 256, 512, 768, fie 1536 eșantioane audio consecutive în domeniu de timp. (Carcasa eșantionului 1536 este cel mai frecvent caz și corespunde cu Dolby Digital; lungimile mai mici ale cadrelor sunt destinate utilizării în aplicații interactive cum ar fi jocurile video în care reducerea latenței codificatorului este o preocupare importantă). Fiecare cadru de sincronizare este decodabil independent și aparține unui sub-flux specific din cadrul serviciului. Un cadru de sincronizare constă din următoarele elemente de sintaxă (dintre care unele pot fi eliminate atunci când un serviciu Dolby Digital Plus este încapsulat într-un alt format sau transport):

  • Un cuvânt de sincronizare pe 16 biți, care are valoarea 0x0b77.
  • O secțiune Bitstream Info (BSI), care include metadate cheie, cum ar fi dimensiunea cadrului, identificatorul fluxului de biți (care specifică versiunea de sintaxă utilizată), modul canalului, identificatorul de flux secundar, nivelul de dialog codat (dialnorm) și metadatele pentru a ghida producerea cu decodor a unui downmix.
  • O secțiune Audio Frame, care conține informații de decodare comune tuturor blocurilor audio din cadrul sincronizării, inclusiv informațiile necesare pentru a determina modul în care sunt împachetate exponenții și mantisele .
  • Una, două, trei sau șase secțiuni de bloc audio. Aceste secțiuni conțin metadate suplimentare de decodare, precum și coeficienți de frecvență codați și cuantizați. Fiecare bloc audio corespunde la 256 de eșantioane PCM pe fiecare canal.
  • O secțiune finală care conține date auxiliare definite de utilizator, orice umplere necesară pentru a produce lungimi de sincronizare uniforme și un cod de verificare a redundanței ciclice de 16 biți pentru detectarea erorilor.

Stocarea coeficienților de transformare

În centrul Dolby Digital și al DD + se află o transformată de cosinus discret modificată (MDCT), care este utilizată pentru a transforma semnalul audio în domeniul frecvenței; în cadrul fiecărui bloc se pot transmite până la 256 de coeficienți de frecvență. Coeficienții sunt transmiși într-un format binar în virgulă mobilă, cu exponenți transmiși separat de mantise. Acest lucru permite o codificare extrem de eficientă.

Exponenții pentru fiecare canal sunt codați într-un format diferențial foarte ambalat, deltele dintre liniile de frecvență consecutive (altele decât primul) fiind date în flux. Sunt utilizate trei formate sau strategii de exponenți ; acestea sunt cunoscute sub numele de „D15”, „D25” și „D45”. În D15, fiecare coș are un exponent unic, în timp ce în D25 și D45, valorile delta corespund fie perechilor, fie cvadrurilor de coșuri de frecvență. Blocurile audio, altele decât primul dintr-un cadru de sincronizare, pot reutiliza suplimentar setul de exponenți al blocului anterior (acest lucru este necesar pentru canalele care utilizează Transformarea hibridă adaptivă).

Exponenții decodificați, împreună cu un set de parametri de metadate, sunt folosiți pentru a obține indicatorii de alocare a biților (BAP), care specifică numărul de biți alocați fiecărei mantise. Coșurile care corespund frecvențelor în care auzul uman este mai precis sunt alocate mai mulți biți; pubele care corespund frecvențelor la care oamenii sunt mai puțin sensibili sunt alocate mai puține. Oriunde între zero și 16 biți poate fi alocat pentru fiecare mantisă; dacă se transmit zero biți, o funcție dither poate fi opțional aplicată pentru a genera coeficientul de frecvență.

Algoritm

Dolby Digital Plus, la fel ca multe codecuri audio cu pierderi, utilizează o reprezentare puternic cuantificată a domeniului de frecvență al semnalului pentru a obține un câștig de codare ; această secțiune descrie funcționarea transformării de bază, precum și diverse "instrumente" opționale specificate de standard, care sunt utilizate pentru a obține fie o compresie mai mare, fie pentru a reduce artefacte de codificare sonore.

Transformarea cosinusului discret modificat

Atât codificatorul Dolby Digital, cât și DD + convertește un semnal audio multicanal în domeniul de frecvență utilizând transformarea cosinusului discret modificat (MDCT), cu o lungime de bloc comutabilă de 256 sau 512 eșantioane (acesta din urmă este utilizat cu semnale staționare, primul cu semnale tranzitorii ). Reprezentarea domeniului de frecvență este apoi cuantificată conform unui model psihoacustic și transmisă. Se utilizează un format în virgulă mobilă pentru coeficienții de frecvență, iar mantisele și exponenții sunt stocate și transmise separat, ambele fiind puternic comprimate.

Transformare hibridă adaptivă (AHT)

Pentru semnale foarte staționare, cum ar fi notele lungi în interpretarea muzicală, se folosește Transformarea hibridă adaptivă (AHT). Acest instrument este unic pentru Dolby Digital Plus (și nu este acceptat în Dolby Digital) și folosește o transformare de cosinus discretă de tip II (DCT) suplimentară pentru a combina șase blocuri de transformare adiacente (situate într-un cadru sincron) într-un bloc efectiv mai lung. În plus față de transformarea în două etape, este utilizată o structură de alocare a biților diferită și sunt implementate două modalități de reprezentare a mantisselor codificate: utilizarea cuantificării vectoriale , care oferă cel mai mare câștig de codificare și utilizarea cuantificării adaptate la câștig (GAQ) când este necesară o mai mare fidelitate a semnalului. Cuantificarea adaptabilă a câștigului poate fi activată independent pentru fiecare coș de frecvență dintr-un canal și permite codificarea mantiselor cu lungime variabilă.

Cuplare

Deoarece multe programe audio multicanal au un grad ridicat de corelație între canalele individuale, este de obicei utilizat un canal de cuplare. Informațiile de înaltă frecvență care sunt comune între două sau mai multe canale sunt transmise într-un canal separat (unul care nu este reprodus de un decodor, ci doar amestecat înapoi în canalele originale) cunoscut sub numele de canal de cuplare; împreună cu coeficienții cunoscuți sub denumirea de „coordonate de cuplare” care ghidează decodorul cu privire la modul de reconstruire a canalelor originale.

Dolby Digital Plus acceptă o versiune mai elaborată a instrumentului de cuplare cunoscut sub numele de cuplare îmbunătățită (ECPL). Acest algoritm, care este considerabil mai scump de procesat (atât pentru codificatoare, cât și pentru decodificatoare) permite includerea informațiilor de fază în coordonatele de cuplare, permițând păstrarea relațiilor de fază între canalele cuplate.

Extensie spectrală

Dolby Digital Plus oferă un alt instrument pentru frecvențe înalte. Deoarece componentele de înaltă frecvență sunt adesea armonici ale sunetelor cu frecvență mai joasă, Spectral Extension (SPX) permite sintetizarea componentelor de înaltă frecvență algoritmic din componentele cu frecvență mai joasă. Acest instrument este, de asemenea, unic pentru Dolby Digital Plus și nu este acceptat în Dolby Digital.

Rematrixing

Programele stereo sunt de obicei rematriculate și codificate ca un canal L + R și LR. Acest lucru se face atât pentru a crește câștigul de codificare (canalul LR poate fi de obicei puternic comprimat, iar nematrișarea ulterioară va determina anularea multor artefacte de compresie, cât și pentru a păstra relațiile de fază necesare pentru redarea corectă a materialului codat Dolby Surround .

Prelucrare tranzitorie pre-zgomot

Procesarea tranzitorie pre-zgomot (TPNP) este un instrument specific Dolby Digital Plus pentru a reduce artefactele rezultate ale cuantificării semnalului și a altor tehnici de compresie. Spre deosebire de celelalte instrumente descrise mai sus, care funcționează în domeniul frecvenței și preced conversia înapoi în eșantioane PCM, TPNP este un instrument care efectuează în esență o operație de tăiere și lipire pe fereastră a semnalului domeniului timp pentru a șterge anumite artefacte de cuantificare previzibile.

Relația cu Dolby Digital și Dolby Atmos

Fluxurile de biți Dolby Digital Plus nu sunt compatibile direct înapoi cu decodorele Dolby Digital vechi . Cu toate acestea, Dolby Digital Plus este un superset funcțional al Dolby Digital, iar decodoarele includ o componentă obligatorie care convertește direct (fără decodificare și recodificare) fluxul de biți Dolby Digital Plus într-un flux de biți Dolby Digital (care funcționează la 640 kbit / s) pentru transport prin conexiuni S / PDIF vechi (inclusiv S / PDIF prin HDMI) la decodoare externe (de exemplu AVR-uri etc.). Toate decodoarele Dolby Digital Plus pot decoda fluxurile de biți Dolby Digital.

Cu toate acestea, fluxurile de biți Dolby Atmos sunt codificate pentru a fi compatibile înapoi cu decodoarele Dolby Digital Plus și, ca atare, Dolby Atmos poate fi decodat de dispozitivele compatibile Dolby Digital Plus. Aceasta a fost comercializată de Dolby, ca variantă de compresie cu pierderi a Dolby Atmos sub eticheta „Dolby Digital Plus Atmos” pentru a o diferenția de originalul fără pierderi DolbyHD. Majoritatea fluxurilor de biți Dolby Digital Plus sunt acum codificate în codificare Atmos.


Compresie dinamică

Un obiectiv de proiectare al DD + este redarea de calitate într-o varietate de medii, variind de la cinematografele de acasă și alte medii controlate acustic în care este posibilă redarea cu o gamă dinamică ridicată, până la medii portabile și auto în care este prezent mult zgomot de fond și poate fi necesară o compresie a intervalului dinamic. pentru a face sonore toate părțile unui program audio.

DD + oferă următoarele moduri de operare pentru diferite medii de ascultare / vizualizare.

Moduri de funcționare a decodorului Dolby Digital Plus:

Mod Referință Loudness (LKFS) Cerere
Linia −31 LKFS Redare Home Theater - Oferă gamă dinamică completă de „cinema”
RF −20 LKFS Redarea difuzoarelor TV - Oferă o gamă dinamică tipică de „difuzare”
Portabil −11 LKFS Difuzor portabil și redare căști - Oferă un interval dinamic minim (similar tehnicilor de producție / mixare / masterizare a muzicii)

Notă: Toate modurile de operare ale decodorului (enumerate mai sus) sunt disponibile în fiecare decodor Dolby Digital Plus. Modul de operare implicit este guvernat de categoria dispozitivului și de aplicație. În unele dispozitive, utilizatorii pot avea, de asemenea, posibilitatea de a alege (prin meniu) să selecteze un mod alternativ care să se potrivească gustului și / sau aplicației lor specifice.

În plus, Dolby Digital și DD + conțin metadate suplimentare pentru a permite traducerea fără erori în canale aval cu restricții de gamă, cum ar fi modulația RF, unde amplitudinea excesivă a semnalului de ieșire poate duce la distorsiuni semnificative sau erori de modulație.

Incapsularea, utilizarea și stocarea fluxurilor Dolby Digital

Transport fizic pentru dispozitive de consum

IEC 61937-3: definește modul de transmitere a fluxurilor de biți Dolby Digital (AC-3) și Dolby Digital Plus (E-AC-3) printr-o interfață IEC 60958/61937 (S / PDIF). Cu toate acestea, interfața S / PDIF are o lățime de bandă insuficientă pentru a transporta fluxurile de biți Dolby Digital Plus (E-AC-3) la data de 3.0Mbit / s specificată de HD DVD; sunt posibile date mai mici.

Multe echipamente pentru consumatori și chiar unele echipamente profesionale nu recunosc Dolby Digital Plus ca un format codificat și vor trata semnalele DD + pe o interfață S / PDIF sau similară sau stocate într-un fișier .WAV sau într-un format similar de container, ca și cum ar fi ele au fost date PCM liniare. Acest lucru nu este problematic dacă datele sunt transmise neschimbate, dar orice scalare a câștigului sau conversia ratei de eșantionare, operațiuni care sunt inofensive din punct de vedere fonic pentru datele PCM, vor corupe și distruge un flux Dolby Digital Plus. (Codecurile mai vechi, cum ar fi DTS sau AC-3, sunt mai susceptibile de a fi recunoscute ca formate comprimate și protejate de astfel de procesări).

Dolby Digital Plus poate fi transmis prin HDMI 1.3 sau mai nou, conform IEC 61937-3.

Transport fizic pentru dispozitive și aplicații profesionale

Deoarece interfața AES-3 este analogul profesional cu S / PDIF, fluxurile Dolby Digital Plus pot fi transportate pe conexiuni AES-3 cu lățime de bandă suficientă și / sau peste alte interfețe care încapsulează AES-3 (cum ar fi SMPTE 259M și SMPTE 299M audio încorporat). Standardele suplimentare promulgate de SMPTE specifică codificarea transporturilor Dolby, inclusiv Dolby Digital, Dolby Digital Plus și Dolby E (un codec exclusiv profesional utilizat în aplicații audio / video) pe o interfață AES. Standardul SMPTE 337 specifică semnalizarea și transportul semnalelor care nu sunt audio PCM pe o interfață AES-3, iar standardul SMPTE 340-2008 specifică modul în care Dolby Digital Plus și Dolby Digital vor fi transmise pe acea interfață. Combinația dintre SMPTE 340-2008 și 337M permite ca fluxul de biți Dolby Digital Plus să fie stocat și transportat în cadrul fluxurilor de lucru profesionale, de contribuție și distribuție înainte de emisiile către consumatori.

Difuzarea consumatorilor în sistemele de televiziune digitală

Fie DD +, fie Dolby Digital este specificat de Advanced Television Systems Committee ca codec audio principal pentru sistemul de televiziune digitală ATSC și este utilizat în mod obișnuit pentru alte aplicații DTV (cum ar fi difuzarea prin cablu și satelit) în țările care utilizează ATSC pentru televiziunea digitală.

Pentru difuzare (emisie) către consumatori, fluxul de biți Dolby Digital Plus este ambalat într-un flux elementar MPEG și multiplexat (cu video) într-un flux de transport MPEG. În sistemele ATSC, specificațiile pentru transportul Dolby Digital Plus sunt descrise în ATSC A / 53 partea 3 și partea 6. În sistemele DVB, specificațiile pentru transportul Dolby Digital Plus sunt descrise în ETSI TS 101 154 și ETSI EN 300 468.

Dolby Digital Plus vede o utilizare tot mai mare în sistemele de televiziune digitală, în special în sistemele de cablu și satelit, ca înlocuitor pentru Dolby Digital. Multe astfel de aplicații nu profită de numărul său mai mare de canale sau de capacitatea de a suporta mai multe programe independente; în schimb, este folosit ca un codec cu eficiență mai mare decât AC-3.

HD DVD și disc Blu-ray

Atât standardul HD DVD acum defunct , cât și discul Blu-ray includ Dolby Digital Plus. Este o componentă obligatorie a HD DVD și o componentă opțională a Blu-ray. Numărul maxim de canale discrete codate este același pentru ambele formate: 7.1. Cu toate acestea, HD DVD și Blu-ray impun constrângeri tehnice diferite asupra codecurilor audio acceptate. Prin urmare, utilizarea DD + diferă substanțial între HD DVD și Blu-ray Disc.

Comparația ratei de biți Dolby Digital (AC-3) și Dolby Digital Plus (E-AC-3)
Codec DVD HD Disc Blu-ray
Decodare Canale Rată de biți Decodare Canale Rată de biți
AC-3 obligatoriu 1 la 5.1 448 kbit / s obligatoriu 1 la 5.1 640 kbit / s
E-AC-3 obligatoriu 1 la 7.1 3,024 Mbit / s opțional, disponibil numai pentru canalele din spate 6.1 la 7.1 1,664 Mbit / s
TrueHD obligatoriu
opțional
1 sau 2
3 până la 8
18,0 Mbit / s
18,0 Mbit / s
opțional 1 la 8 18,0 Mbit / s

Pe HD DVD, DD + este desemnat un codec audio obligatoriu. Un film HD DVD poate folosi DD + ca pistă audio primară (sau numai). Un player HD DVD este necesar pentru a suporta sunetul DD + prin decodare și ieșire pe mufele de ieșire ale playerului. Așa cum este stocat pe disc, fluxul de biți DD + poate transporta pentru orice număr de canale audio până la maximul permis, la orice rată de biți de până la 3,0 Mbit / s.

Pe discul Blu-ray, DD + este un codec opțional și este implementat ca o extensie la un „core” AC-3 5.1 audiotrack. Nucleul AC-3 este codificat la 640 kbit / s, poartă 5 canale primare (și 1 LFE) și poate fi redat independent ca pistă audio de film de către orice player Blu-ray Disc. Extensia de biți DD + este utilizată pe jucătorii care o acceptă prin înlocuirea canalelor din spate în configurarea 5.1 cu versiuni de fidelitate mai mare, împreună cu furnizarea unei posibile extensii de canale la 6.1 sau 7.1. Pistei audio complete li se permite o rată de biți combinată de 1,7 Mbit / s: 640 kbit / s pentru nucleul AC-3 5.1 și 1 Mbit / s pentru extensia DD +. În timpul redării, atât fluxul de biți de bază, cât și cel de extensie contribuie la ieșirea audio finală, conform regulilor încorporate în metadatele fluxului de biți.

Playere media și downmixing

În general, un flux de biți Dolby Digital Plus poate fi transportat numai pe o conexiune HDMI 1.3 sau mai mare. Receptoarele mai vechi acceptă versiuni anterioare de HDMI sau au suport doar pentru sistemul S / PDIF pentru audio digital sau intrări analogice.

Pentru legături non-HDMI 1.3, playerul poate decoda sunetul și apoi îl poate transmite printr-o varietate de metode diferite.

  • Versiunile anterioare de HDMI, cum ar fi HDMI 1.1, acceptă audio PCM , unde playerul decodează sunetul și îl transmite fără pierderi ca PCM prin HDMI către receptor.
  • Unele receptoare și playere acceptă sunet surround analogic, iar playerul poate decoda sunetul și îl poate transmite receptorului ca sunet analog.

Majoritatea receptorilor și jucătorilor acceptă S / PDIF. Această conexiune digitală cu lățime de bandă mai mică nu este capabilă să transmită audio PCM fără pierderi cu mai mult de două canale, dar un player poate transmite un receptor audio compatibil S / PDIF către receptor într-unul din următoarele moduri:

  • Playerele Blu-ray Disc pot profita de vechiul flux de biți 5.1 AC-3 încorporat în fluxul de biți E-AC-3, transmitând doar fluxul de biți AC-3 fără modificări.
  • Jucătorii care acceptă standardul HD DVD pot transcoda sunetul decodat într-un alt format. În funcție de metoda și opțiunile disponibile jucătorului, acest lucru se poate face cu o pierdere de calitate relativ mică. Decodorul de referință Dolby, disponibil pentru toți licențiații, exploatează moștenirea comună dintre AC-3 și E-AC-3 prin efectuarea operațiunii în domeniul frecvenței. Re-compresia hibridă evită decompresia inutilă end-to-end și recompresia ulterioară (E-AC-3 → LPCM → AC-3). În plus față de AC-3, unele playere HD DVD transcodează audio compatibil cu S / PDIF în audio DTS de 1,5 Mbit / s . În timp ce S / PDIF poate transporta Dolby Digital Plus la rate de biți mai mici, standardul HD DVD specifică o rată de biți pentru DD +, care este prea mare pentru ca o interfață S / PDIF să o poată transmite.

În cazul în care playerul trebuie să decodeze sunetul pentru un receptor care nu este HDMI 1.3, rezultatele ar trebui să fie previzibile. Specificația DD + definește în mod explicit modurile și mecanica de mixare descendentă , astfel încât orice câmp de sunet sursă (până la 14.1) poate fi reprodus în mod previzibil pentru orice mediu de ascultare (până la un singur canal).

Vezi si

Referințe