Jednostavnim riječima, podatkovno skladište je skladište podataka ograničeno po opsegu i čiji se podaci mogu dobiti sumiranjem i odabirom podataka iz skladišta podataka ili uz pomoć različitih postupaka ekstrakcije, transformacije i učitavanja iz sustava izvornih podataka.
Tablica usporedbe
Osnova za usporedbu | Skladište podataka | Data Mart |
---|---|---|
Osnovni, temeljni | Skladište podataka je neovisno o aplikaciji. | Data Mart su specifični za primjenu sustava za podršku odlučivanju. |
Vrsta sustava | centralizirani | Decentralizirani |
Oblik podataka | Detaljan | sažeti |
Upotreba denormalizacije | Podaci su neznatno denormalizirani. | Podaci su visoko denormalizirani. |
Model podataka | Top-down | Odozdo prema gore |
Priroda | Fleksibilan, orijentiran na podatke i dug život. | Ograničen, orijentiran na projekt i kratak život. |
Vrsta korištene sheme | Konstelacija činjenica | Zvijezda i pahuljica |
Jednostavnost gradnje | Teško je graditi | Jednostavan za gradnju |
Definicija skladišta podataka
Pod pojmom skladišta podataka podrazumijeva se varijanta vremena, subjektno orijentirana, neponovljiva i integrirana skupina podataka koja pomaže u procesu odlučivanja uprave. Alternativno, to je spremište informacija prikupljenih iz više izvora, pohranjenih u jedinstvenu shemu, na jedinom mjestu koje omogućuje integraciju raznih aplikacijskih sustava. Nakon što se ti podaci prikupljaju, oni se čuvaju dugo vremena, dakle imaju dugi vijek trajanja i omogućuju pristup povijesnim informacijama.
Slijedom toga, skladište podataka korisniku pruža jedinstveno integrirano sučelje za podatke kroz koje korisnik može lako pisati upite za podršku odlučivanju. Skladište podataka pomaže u pretvaranju podataka u informacije. Projektiranje skladišta podataka uključuje pristup odozgo prema dolje.
Prikuplja informacije o temama koje obuhvaćaju cijelu organizaciju, kao što su kupci, prodaja, imovina, stavke, te je stoga njen raspon u cijeloj tvrtki. Općenito, u njoj se koristi shema konstelacija činjenica, koja obuhvaća širok raspon subjekata. Skladište podataka nije statična struktura i stalno se razvija .
Definicija Data Marta
Martina podataka može se pozvati kao podskup skladišta podataka ili podskupine podataka za cijelu tvrtku koja odgovaraju određenom skupu korisnika. Skladište podataka uključuje nekoliko odjela i logičkih podatkovnih centara koji moraju biti postojani u ilustraciji podataka kako bi se osigurala robusnost skladišta podataka. Data Mart je skup tablica koje se usredotočuju na jedan zadatak, a osmišljen je pomoću pristupa odozdo prema gore.
Kako su shema zvijezda i pahuljica usmjerena prema modeliranju jednog predmeta, to je razlog zašto se oni uobičajeno koriste u podatkovnom centru. Iako je shema zvijezda popularnija od sheme pahuljica. Ovisno o izvoru podataka, martovi podataka mogu se klasificirati u dvije vrste: ovisne i neovisne podatkovne centre.
Ključne razlike između skladišta podataka i Data Marta
- Skladište podataka je aplikacija neovisna, dok je data mart specifičan za primjenu sustava za podršku odlučivanju.
- Podaci se pohranjuju u jedno centralizirano spremište u skladištu podataka. Nasuprot tome, data mart pohranjuje podatke decentralno u korisničkom području.
- Skladište podataka sadrži detaljan oblik podataka. Nasuprot tome, data mart sadrži sažete i odabrane podatke.
- Podaci u skladištu podataka su neznatno denormalizirani, dok je u slučaju Data Marta visoko denormalizirano.
- Izgradnja skladišta podataka uključuje pristup odozgo prema dolje . Suprotno tome, pri izradi podatkovnog centra koristi se pristup odozdo prema gore .
- Skladište podataka je fleksibilno, informacijski orijentirano i dugogodišnje. Naprotiv, data mart je restriktivan, projektno orijentiran i ima kraće postojanje.
- Shema konstelacija činjenica se obično koristi za modeliranje skladišta podataka, dok je u shemi podataka mart najpopularnija shema.
Zaključak
Skladište podataka osigurava pregled poduzeća, jedinstveni i centralizirani sustav pohrane, inherentnu arhitekturu i aplikativnu neovisnost, dok je Data mart podskup podatkovnog skladišta koje pruža pogled odjela, decentralizirano pohranjivanje. Budući da je skladište podataka vrlo veliko i integrirano, postoji visok rizik od neuspjeha i poteškoća u njegovom izgradnji. S druge strane, data mart je jednostavan za izgradnju i povezan rizik kvara je također manje, ali data mart može doživjeti fragmentaciju.