Procesare analitică online - Online analytical processing

Procesarea analitică online , sau OLAP ( / l Ć p / ), este o abordare de a răspunde multidimensională analitice (MDA) interoghează rapid în calcul . OLAP face parte din categoria mai largă de business intelligence , care cuprinde și baze de date relaționale , scrierea de rapoarte și extragerea datelor . Aplicațiile tipice ale OLAP includ rapoarte de afaceri pentru vânzări, marketing , raportare de gestionare, gestionarea proceselor de afaceri (BPM), bugetare și prognoză ,raportare financiară și domenii similare, cu noi aplicații emergente, cum ar fi agricultura .

Termenul OLAP a fost creat ca o ușoară modificare a termenului tradițional de prelucrare a tranzacțiilor online (OLTP).

Instrumentele OLAP permit utilizatorilor să analizeze datele multidimensionale interactiv din mai multe perspective. OLAP constă din trei operații analitice de bază: consolidare (roll-up), drill-down și feliere și tăiere. Consolidarea implică agregarea datelor care pot fi acumulate și calculate în una sau mai multe dimensiuni. De exemplu, toate birourile de vânzări sunt adunate la departamentul de vânzări sau la divizia de vânzări pentru a anticipa tendințele de vânzări. În schimb, drill-down-ul este o tehnică care permite utilizatorilor să navigheze prin detalii. De exemplu, utilizatorii pot vizualiza vânzările pe produse individuale care alcătuiesc vânzările unei regiuni. Felierea și tăierea în cuburi este o caracteristică prin care utilizatorii pot scoate (tăia) un set specific de date ale cubului OLAP și pot vizualiza (tăia cuburi) feliile din diferite puncte de vedere. Aceste puncte de vedere sunt uneori numite dimensiuni (cum ar fi examinarea acelorași vânzări de către vânzător, sau după dată, sau de către client, sau de produs, sau de regiune etc.).

Bazele de date configurate pentru OLAP utilizează un model de date multidimensional, permițând interogări complexe analitice și ad hoc cu un timp de execuție rapid. Împrumută aspecte ale bazelor de date de navigație , baze de date ierarhizate și baze de date relaționale.

OLAP este în mod obișnuit contrastat cu OLTP (procesarea tranzacțiilor online), care se caracterizează, în general, prin interogări mult mai puțin complexe, într-un volum mai mare, pentru a procesa tranzacțiile, mai degrabă decât în ​​scopul informării de afaceri sau raportării. În timp ce sistemele OLAP sunt optimizate pentru citire, OLTP trebuie să proceseze tot felul de interogări (citire, inserare, actualizare și ștergere).

Prezentare generală a sistemelor OLAP

La baza oricărui sistem OLAP se află un cub OLAP (numit și „cub multidimensional” sau hipercub ). Se compune din fapte numerice numite măsuri care sunt clasificate după dimensiuni . Măsurile sunt plasate la intersecțiile hipercubului, care este întins de dimensiuni ca un spațiu vectorial . Interfața obișnuită pentru manipularea unui cub OLAP este o interfață matricială, cum ar fi tabelele pivot într-un program de foaie de calcul, care efectuează operații de proiecție de-a lungul dimensiunilor, cum ar fi agregarea sau medierea.

Metadatele cubului sunt de obicei create dintr-o schemă stelară sau o schemă de fulgi de zăpadă sau o constelație de tabele dintr-o bază de date relațională . Măsurile sunt derivate din înregistrările din tabelul de date, iar dimensiunile sunt derivate din tabelele de dimensiuni .

Fiecare măsură poate fi considerată ca având un set de etichete sau meta-date asociate. O dimensiune este ceea ce descrie aceste etichete ; oferă informații despre măsură .

Un exemplu simplu ar fi un cub care conține vânzările unui magazin ca măsură și Data / Ora ca dimensiune . Fiecare vânzare are o etichetă de dată / oră care descrie mai multe despre acea vânzare.

De exemplu:

 Sales Fact Table
+-------------+----------+
| sale_amount | time_id  |
+-------------+----------+            Time Dimension
|      2008.10|     1234 |----+     +---------+-------------------+
+-------------+----------+    |     | time_id | timestamp         |
                              |     +---------+-------------------+
                              +---->|   1234  | 20080902 12:35:43 |
                                    +---------+-------------------+

Baze de date multidimensionale

Structura multidimensională este definită ca „o variație a modelului relațional care folosește structuri multidimensionale pentru a organiza datele și a exprima relațiile dintre date”. Structura este împărțită în cuburi, iar cuburile sunt capabile să stocheze și să acceseze date în limitele fiecărui cub. „Fiecare celulă dintr-o structură multidimensională conține date agregate legate de elemente de-a lungul fiecărei dimensiuni”. Chiar și atunci când datele sunt manipulate, acestea rămân ușor de accesat și continuă să constituie un format compact de bază de date. Datele rămân în continuare interdependente. Structura multidimensională este destul de populară pentru bazele de date analitice care utilizează aplicații de procesare analitică online (OLAP). Bazele de date analitice folosesc aceste baze de date datorită capacității lor de a oferi rapid răspunsuri la întrebări complexe de afaceri. Datele pot fi vizualizate din diferite unghiuri, ceea ce oferă o perspectivă mai largă a unei probleme, spre deosebire de alte modele.

Agregări

S-a susținut că pentru interogări complexe cuburile OLAP pot produce un răspuns în aproximativ 0,1% din timpul necesar pentru aceeași interogare pe datele relaționale OLTP . Cel mai important mecanism din OLAP care îi permite să obțină o astfel de performanță este utilizarea agregărilor . Agregările sunt construite din tabelul de informații prin schimbarea granularității pe dimensiuni specifice și agregarea datelor de-a lungul acestor dimensiuni, utilizând o funcție de agregare (sau funcție de agregare ). Numărul de agregări posibile este determinat de fiecare combinație posibilă de granularități ale dimensiunii.

Combinația dintre toate agregările posibile și datele de bază conține răspunsurile la fiecare interogare la care se poate răspunde din date.

Deoarece, de obicei, există multe agregări care pot fi calculate, adesea doar un număr predeterminat este calculat complet; restul se rezolvă la cerere. Problema alegerii agregărilor (vizualizărilor) de calculat este cunoscută sub numele de problema de selecție a vizualizărilor. Selecția vizualizării poate fi constrânsă de dimensiunea totală a setului de agregări selectat, de timpul pentru actualizarea acestora de la modificările din datele de bază sau de ambele. Obiectivul selecției vizualizării este de obicei de a minimiza timpul mediu pentru a răspunde la întrebările OLAP, deși unele studii minimizează și timpul de actualizare. Selecția vizualizării este NP-Complete . Au fost explorate multe abordări ale problemei, inclusiv algoritmi lacomi , căutare randomizată, algoritmi genetici și algoritm de căutare A * .

Unele funcții de agregare pot fi calculate pentru întregul cub OLAP prin precomputarea valorilor pentru fiecare celulă și apoi calcularea agregării pentru o acumulare de celule prin agregarea acestor agregate, aplicând un algoritm de divizare și cucerire la problema multidimensională pentru a le calcula eficient. De exemplu, suma totală a unei acumulări este doar suma sub-sumelor din fiecare celulă. Funcțiile care pot fi descompuse în acest mod se numesc funcții de agregare descompozabile și includ COUNT, MAX, MIN,și SUM, care pot fi calculate pentru fiecare celulă și apoi agregate direct; acestea sunt cunoscute sub numele de funcții de agregare auto-descompozabile. În alte cazuri, funcția agregată poate fi calculată prin calcularea numerelor auxiliare pentru celule, agregarea acestor numere auxiliare și, în cele din urmă, calcularea numărului total la sfârșit; exemplele includ AVERAGE(urmărirea sumei și numărului, împărțirea la sfârșit) și RANGE(urmărirea max și min, scăderea la sfârșit). În alte cazuri, funcția agregată nu poate fi calculată fără a analiza întregul set simultan, deși în unele cazuri pot fi calculate aproximări; exemplele includ DISTINCT COUNT, MEDIAN,și MODE; de exemplu, mediana unui set nu este mediana medianelor subseturilor. Acestea din urmă sunt dificil de implementat eficient în OLAP, deoarece necesită calcularea funcției agregate pe datele de bază, fie calculându-le online (lent), fie precomputându-le pentru eventuale lansări (spațiu mare).

Tipuri

Sistemele OLAP au fost clasificate în mod tradițional folosind următoarea taxonomie.

OLAP multidimensional (MOLAP)

MOLAP (procesare analitică multidimensională online) este forma clasică a OLAP și este uneori denumită doar OLAP. MOLAP stochează aceste date într-un spațiu de stocare multidimensional optimizat, mai degrabă decât într-o bază de date relațională.

Unele instrumente MOLAP necesită pre-calculul și stocarea datelor derivate, cum ar fi consolidările - operațiunea cunoscută sub numele de procesare. Astfel de instrumente MOLAP utilizează în general un set de date precalculat denumit cub de date . Cubul de date conține toate răspunsurile posibile la o gamă dată de întrebări. Ca urmare, au un răspuns foarte rapid la întrebări. Pe de altă parte, actualizarea poate dura mult timp, în funcție de gradul de pre-calcul. Precalcularea poate duce, de asemenea, la ceea ce este cunoscut sub numele de explozie de date.

Alte instrumente MOLAP, în special cele care implementează modelul funcțional de baze de date , nu pre-calculează datele derivate, ci fac toate calculele la cerere, altele decât cele care au fost solicitate anterior și stocate într-o memorie cache.

Avantajele MOLAP

  • Performanță rapidă a interogării datorită stocării optimizate, indexării multidimensionale și memorării în cache.
  • Dimensiunea mai mică a datelor pe disc comparativ cu datele stocate în baza de date relațională datorită tehnicilor de compresie.
  • Calcul automat al agregatelor de nivel superior ale datelor.
  • Este foarte compact pentru seturile de date de dimensiuni reduse.
  • Modelele matrice oferă indexare naturală.
  • Extragerea eficientă a datelor realizată prin pre-structurarea datelor agregate.

Dezavantaje ale MOLAP

  • În cadrul unor sisteme MOLAP, etapa de procesare (încărcarea datelor) poate fi destul de lungă, în special pe volume mari de date. Acest lucru este de obicei remediat făcând doar procesare incrementală, adică prelucrând doar datele care s-au schimbat (de obicei date noi) în loc să reproceseze întregul set de date.
  • Unele metodologii MOLAP introduc redundanța datelor.

Produse

Exemple de produse comerciale care utilizează MOLAP sunt Cognos Powerplay, Oracle Database OLAP Option , MicroStrategy , Microsoft Analysis Services , Essbase , TM1 , Jedox și icCube .

OLAP relațional (ROLAP)

ROLAP funcționează direct cu baze de date relaționale și nu necesită pre-calcul. Datele de bază și tabelele de dimensiuni sunt stocate ca tabele relaționale și sunt create tabele noi pentru a păstra informațiile agregate. Depinde de o schemă specializată. Această metodologie se bazează pe manipularea datelor stocate în baza de date relațională pentru a da aspectul funcționalității OLAP tradiționale de feliere și decupare. În esență, fiecare acțiune de tăiere și tăiere este echivalentă cu adăugarea unei clauze „WHERE” în ​​instrucțiunea SQL. Instrumentele ROLAP nu folosesc cuburi de date precalculate, ci pun în schimb interogarea către baza de date relațională standard și tabelele sale pentru a readuce datele necesare pentru a răspunde la întrebare. Instrumentele ROLAP prezintă capacitatea de a pune orice întrebare, deoarece metodologia nu se limitează la conținutul unui cub. ROLAP are, de asemenea, capacitatea de a detalia până la cel mai scăzut nivel de detaliu din baza de date.

În timp ce ROLAP utilizează o sursă de bază de date relațională, în general baza de date trebuie să fie atent concepută pentru utilizarea ROLAP. O bază de date care a fost proiectată pentru OLTP nu va funcționa bine ca o bază de date ROLAP. Prin urmare, ROLAP implică în continuare crearea unei copii suplimentare a datelor. Cu toate acestea, deoarece este o bază de date, o varietate de tehnologii pot fi utilizate pentru a popula baza de date.

Avantajele ROLAP

  • ROLAP este considerat a fi mai scalabil în gestionarea volumelor mari de date, în special a modelelor cu dimensiuni cu cardinalitate foarte mare (adică, milioane de membri).
  • Cu o varietate de instrumente de încărcare a datelor disponibile și posibilitatea de a regla fin codul de extragere, transformare, încărcare (ETL) la modelul de date particular, timpii de încărcare sunt în general mult mai scurți decât în cazul încărcărilor automate MOLAP .
  • Datele sunt stocate într-o bază de date relațională standard și pot fi accesate de orice instrument de raportare SQL (instrumentul nu trebuie să fie un instrument OLAP).
  • Instrumentele ROLAP sunt mai bune în gestionarea faptelor neagregabile (de exemplu, descrieri textuale). Instrumentele MOLAP tind să sufere de performanțe lente la interogarea acestor elemente.
  • Prin decuplarea stocării datelor de modelul multidimensional, este posibilă modelarea cu succes a datelor care altfel nu s-ar încadra într-un model dimensional strict.
  • Abordarea ROLAP poate utiliza controalele de autorizare a bazei de date , cum ar fi securitatea la nivel de rând, prin care rezultatele interogării sunt filtrate în funcție de criteriile prestabilite aplicate, de exemplu, unui anumit utilizator sau grup de utilizatori ( clauza SQL WHERE).

Dezavantaje ale ROLAP

  • Există un consens în industrie că instrumentele ROLAP au o performanță mai lentă decât instrumentele MOLAP. Cu toate acestea, consultați discuția de mai jos despre performanța ROLAP.
  • Încărcarea tabelelor agregate trebuie gestionată prin cod ETL personalizat . Instrumentele ROLAP nu ajută la această sarcină. Acest lucru înseamnă timp suplimentar de dezvoltare și mai mult cod de suportat.
  • Atunci când pasul de creare a tabelelor agregate este omis, performanța interogării suferă, deoarece trebuie interogate tabelele detaliate mai mari. Acest lucru poate fi remediat parțial adăugând tabele agregate suplimentare, totuși încă nu este practic să creați tabele agregate pentru toate combinațiile de dimensiuni / atribute.
  • ROLAP se bazează pe baza de date cu scop general pentru interogare și stocare în cache și, prin urmare, nu sunt disponibile mai multe tehnici speciale folosite de instrumentele MOLAP (cum ar fi indexarea ierarhică specială). Cu toate acestea, instrumentele moderne ROLAP profită de cele mai recente îmbunătățiri ale limbajului SQL , cum ar fi operatorii CUBE și ROLLUP, DB2 Cube Views, precum și alte extensii SQL OLAP. Aceste îmbunătățiri SQL pot atenua beneficiile instrumentelor MOLAP .
  • Deoarece instrumentele ROLAP se bazează pe SQL pentru toate calculele, acestea nu sunt potrivite atunci când modelul este greu de calculat care nu se traduce bine în SQL . Exemple de astfel de modele includ bugetarea, alocările, raportarea financiară și alte scenarii.

Performanța ROLAP

În industria OLAP, ROLAP este perceput de obicei ca fiind capabil să se adapteze la volume mari de date, dar suferă de performanțe de interogare mai lente, spre deosebire de MOLAP . OLAP Ancheta , cel mai mare studiu independent în toate produsele majore OLAP, fiind realizat timp de 6 ani (2001 și 2006) au constatat că în mod constant performanța companiilor care utilizează raportul ROLAP mai lent decât cele care utilizează MOLAP chiar și atunci când volumul de date au fost luate în considerare.

Cu toate acestea, la fel ca în cazul oricărui sondaj, există o serie de probleme subtile care trebuie luate în considerare la interpretarea rezultatelor.

  • Sondajul arată că instrumentele ROLAP au de 7 ori mai mulți utilizatori decât instrumentele MOLAP în cadrul fiecărei companii. Sistemele cu mai mulți utilizatori vor avea tendința de a suferi mai multe probleme de performanță în momentele de vârf de utilizare.
  • Există, de asemenea, o întrebare despre complexitatea modelului, măsurată atât în ​​numărul de dimensiuni, cât și în bogăția calculelor. Sondajul nu oferă o modalitate bună de a controla aceste variații ale datelor analizate.

Dezavantajul flexibilității

Unele companii selectează ROLAP deoarece intenționează să refolosească tabelele de baze de date relaționale existente - aceste tabele nu vor fi deseori concepute în mod optim pentru utilizarea OLAP. Flexibilitatea superioară a instrumentelor ROLAP permite acest lucru să funcționeze cu un design mai puțin optim, dar performanța suferă. În schimb, instrumentele MOLAP ar forța reîncărcarea datelor într-un design OLAP optim.

OLAP hibrid (HOLAP)

Compensarea nedorită dintre costul ETL suplimentar și performanța lentă a interogării a asigurat că majoritatea instrumentelor OLAP comerciale utilizează acum o abordare „OLAP hibrid” (HOLAP), care permite proiectantului modelului să decidă ce porțiune de date va fi stocată în MOLAP și care porțiune în ROLAP.

Nu există un acord clar în întreaga industrie cu privire la ceea ce constituie „OLAP hibrid”, cu excepția faptului că o bază de date va împărți datele între stocarea relațională și cea specializată. De exemplu, pentru unii furnizori, o bază de date HOLAP va utiliza tabele relaționale pentru a păstra cantitățile mai mari de date detaliate și va utiliza stocarea specializată pentru cel puțin unele aspecte ale cantităților mai mici de date mai agregate sau mai puțin detaliate. HOLAP abordează deficiențele MOLAP și ROLAP prin combinarea capabilităților ambelor abordări. Instrumentele HOLAP pot utiliza atât cuburi pre-calculate, cât și surse de date relaționale.

Partiționare verticală

În acest mod, HOLAP stochează agregări în MOLAP pentru performanțe rapide de interogare și date detaliate în ROLAP pentru a optimiza timpul de procesare a cubului .

Partiționare orizontală

În acest mod, HOLAP stochează unele felii de date, de obicei cea mai recentă (adică feliată în funcție de dimensiunea Time) în MOLAP pentru performanțe rapide de interogare și date mai vechi în ROLAP . Mai mult, putem stoca unele zaruri în MOLAP și altele în ROLAP , valorificând faptul că într-un cuboid mare, vor exista subregiuni dense și rare.

Produse

Primul produs care a oferit stocare HOLAP a fost Holos , dar tehnologia a devenit disponibilă și în alte produse comerciale, cum ar fi Microsoft Analysis Services , Oracle Database OLAP Option , MicroStrategy și SAP AG BI Accelerator. Abordarea hibridă OLAP combină tehnologia ROLAP și MOLAP, beneficiind de scalabilitatea mai mare a ROLAP și de calculul mai rapid al MOLAP. De exemplu, un server HOLAP poate stoca volume mari de date detaliate într-o bază de date relațională, în timp ce agregările sunt păstrate într-un magazin separat MOLAP. Serviciile OLAP Microsoft SQL Server 7.0 acceptă un server OLAP hibrid

Comparaţie

Fiecare tip are anumite beneficii, deși există un dezacord cu privire la specificul beneficiilor între furnizori.

  • Unele implementări MOLAP sunt predispuse la explozia bazei de date, un fenomen care determină utilizarea unor cantități mari de spațiu de stocare de către bazele de date MOLAP atunci când sunt îndeplinite anumite condiții comune: număr mare de dimensiuni, rezultate precalculate și date multidimensionale rare.
  • MOLAP oferă în general performanțe mai bune datorită optimizărilor de indexare și stocare specializate. De asemenea, MOLAP are nevoie de mai puțin spațiu de stocare în comparație cu ROLAP, deoarece stocarea specializată include de obicei tehnici de compresie .
  • ROLAP este în general mai scalabil. Cu toate acestea, pre-procesarea volumului mare este dificil de implementat eficient, deci este omisă frecvent. Prin urmare, performanța interogării ROLAP poate suferi enorm.
  • Deoarece ROLAP se bazează mai mult pe baza de date pentru a efectua calcule, are mai multe limitări în funcțiile specializate pe care le poate utiliza.
  • HOLAP încearcă să amestece cele mai bune dintre ROLAP și MOLAP. În general, poate pre-procesa rapid, poate scări bine și oferă o bună funcționare.

Alte tipuri

Următoarele acronime sunt uneori folosite, deși nu sunt la fel de răspândite ca cele de mai sus:

  • WOLAP - OLAP bazat pe web
  • DOLAP - Desktop OLAP
  • RTOLAP - OLAP în timp real
  • GOLAP - Grafic OLAP
  • CaseOLAP - OLAP semantic conștient de context, dezvoltat pentru aplicații biomedicale. Platforma CaseOLAP include preprocesarea datelor (de exemplu, descărcarea, extragerea și analizarea documentelor text), indexarea și căutarea cu Elasticsearch, crearea unei structuri funcționale a documentelor numită Text-Cube și cuantificarea relațiilor de categorie frază definite de utilizator folosind algoritmul de bază CaseOLAP.

API-uri și limbi de interogare

Spre deosebire de bazele de date relaționale , care aveau SQL ca limbaj de interogare standard și API-uri răspândite precum ODBC , JDBC și OLEDB , nu a existat o astfel de unificare în lumea OLAP de mult timp. Primul API standard real a fost specificația OLE DB pentru OLAP de la Microsoft, care a apărut în 1997 și a introdus limbajul de interogare MDX . Mai mulți furnizori OLAP - atât server, cât și client - l-au adoptat. În 2001, Microsoft și Hyperion au anunțat specificația XML pentru analiză , care a fost aprobată de majoritatea furnizorilor OLAP. Deoarece acest lucru a folosit și MDX ca limbaj de interogare, MDX a devenit standardul de facto. Din septembrie 2011, LINQ poate fi utilizat pentru interogarea cuburilor SSAS OLAP din Microsoft .NET.

Produse

Istorie

Primul produs care a efectuat interogări OLAP a fost Express, care a fost lansat în 1970 (și achiziționat de Oracle în 1995 din Information Resources). Cu toate acestea, termenul nu a apărut decât în ​​1993, când a fost inventat de Edgar F. Codd , care a fost descris ca „părintele bazei de date relaționale”. Lucrarea lui Codd a rezultat dintr-o scurtă misiune de consultanță pe care Codd a întreprins-o pentru fostul Arbor Software (mai târziu Hyperion Solutions și în 2007 achiziționată de Oracle), ca un fel de lovitură de marketing. Compania își lansase propriul produs OLAP, Essbase , cu un an mai devreme. Ca rezultat, „cele douăsprezece legi ale procesării analitice online” ale lui Codd au fost explicite în referința lor la Essbase. Au apărut unele controverse și, atunci când Computerworld a aflat că Codd a fost plătit de Arbor, a retras articolul. Piața OLAP a cunoscut o creștere puternică la sfârșitul anilor 1990, cu zeci de produse comerciale pe piață. În 1998, Microsoft a lansat primul său server OLAP - Microsoft Analysis Services , care a determinat adoptarea la scară largă a tehnologiei OLAP și a mutat-o ​​în mainstream.

Compararea produsului

Clienții OLAP

Clienții OLAP includ multe programe de calcul tabelar, cum ar fi Excel, aplicații web, SQL, instrumente de bord, etc. Mulți clienți acceptă explorarea interactivă a datelor în care utilizatorii selectează dimensiunile și măsurile de interes. Unele dimensiuni sunt utilizate ca filtre (pentru tranșarea și tăierea cuburilor de date) în timp ce altele sunt selectate ca axe ale unui tabel pivot sau al unei diagrame pivot. Utilizatorii pot varia, de asemenea, nivelul de agregare (pentru drilling-down sau roll-up) vizualizarea afișată. Clienții pot oferi, de asemenea, o varietate de widget-uri grafice, cum ar fi glisante, hărți geografice, hărți termice și multe altele, care pot fi grupate și coordonate ca tablouri de bord. O listă extinsă de clienți apare în coloana de vizualizare a tabelei de comparație a serverelor OLAP .

Structura pieței

Mai jos este o listă cu principalii furnizori OLAP în 2006, cu cifre în milioane de dolari SUA .

Vânzător Venituri globale Companie consolidată
Microsoft Corporation 1.806 Microsoft
Hyperion Solutions Corporation 1.077 Oracol
Cognos 735 IBM
Obiecte de afaceri 416 SAP
MicroStrategy 416 MicroStrategy
SAP AG 330 SAP
Carteză ( SAP ) 210 SAP
Applix 205 IBM
Infor 199 Infor
Oracle Corporation 159 Oracol
Alții 152 Alții
Total 5.700

Sursa deschisa

  • Serverul Mondrian OLAP este un server OLAP open-source scris în Java . Acceptă limbajul de interogare MDX , XML pentru analiză și specificațiile interfeței olap4j .
  • Apache Druid este un magazin popular de date distribuite open-source pentru interogări OLAP care este utilizat la scară largă în producție de diferite organizații.
  • Apache Kylin este un magazin de date distribuit pentru interogări OLAP dezvoltate inițial de eBay.
  • Cubes (server OLAP) este o altă implementare ușoară open-source a kitului de instrumente al funcționalității OLAP în limbajul de programare Python cu ROLAP încorporat.
  • Apache Pinot (incubare) este utilizat la LinkedIn, Uber, Slack și Microsoft pentru a furniza analize scalabile în timp real cu latență scăzută. Poate ingera date din surse de date offline (cum ar fi Hadoop și fișiere plate), precum și din surse online (cum ar fi Kafka). Pinot este conceput pentru a se scala pe orizontală.
  • ClickHouse este un SGBD orientat pe coloane destul de nou, axat pe procesarea rapidă și timpii de răspuns.

Vezi si

Bibliografie

  • Daniel Lemire (decembrie 2007). „Depozitarea datelor și bibliografie orientată spre cercetare OLAP-A” .
  • Erik Thomsen. (1997). Soluții OLAP: Construirea sistemelor de informații multidimensionale, ediția a II-a . John Wiley & Sons. ISBN 978-0-471-14931-6.

Referințe

Citații

Surse