Točka koja razlikuje tablicu faktora i tablicu dimenzija jest da tablica dimenzija sadrži atribute duž kojih se mjere uzimaju u tablici činjenica . Postoje i neki drugi čimbenici koji stvaraju razlike između tablice činjenica i tablice dimenzija da bi ih vidjeli, pogledajmo dolje u tablici usporedbe.
Tablica usporedbe
Osnova za usporedbu | Tablica činjenica | Tablica dimenzija |
---|---|---|
Osnovni, temeljni | Tablica činjenica sadrži mjerenje duž atributa tablice dimenzija. | Tablica dimenzija sadrži atribute duž kojih tablica činjenica izračunava metriku. |
Atributi i zapisi | Tablica činjenica sadrži manje atributa i više zapisa. | Tablica dimenzija sadrži više atributa i manje zapisa. |
Veličina tablice | Tablica činjenica raste okomito. | Tablica dimenzija raste horizontalno. |
Ključ | Tablica činjenica sadrži primarni ključ koji je spoj primarnih ključeva svih tablica dimenzija. | Svaka tablica dimenzija sadrži primarni ključ. |
Stvaranje | Tablica činjenica se može kreirati samo kada su tablice dimenzija završene. | Prvo je potrebno izraditi tablice dimenzija. |
Shema | Shema sadrži manji broj tablica činjenica. | Shema sadrži veći broj tablica dimenzija. |
Značajke | Tablica činjenica može sadržavati podatke u numeričkom i tekstualnom obliku. | Tablica dimenzija uvijek sadrži atribute u tekstualnom obliku. |
Definicija tablice činjenica
Tablica Fact je tablica koja sadrži mjerenja duž atributa tablica dimenzija. Može sadržavati informacije na najnižoj mogućoj razini. Neka tablica činjenica sadrži samo sažete podatke, nazvane Tablica zbrojenih činjenica . Tablica činjenica gotovo sadrži podatke označene datumom . Razgovarajmo o karakteristikama tablice činjenica.
Spojni ključ
Tablica činjenica sadrži Concatenated ključ koji je spajanje primarnih ključeva svih tablica dimenzija. Uvezani ključ tablice činjenica mora jedinstveno identificirati redak u tablici činjenica.
Data Grain
Podatkovna zrna pokazuju koliko su duboko pohranjene tablice u stvarnosti. Zrno podataka mora biti na najvišoj mogućoj razini.
Aditivne mjere
Atributi tablice činjenica mogu biti potpuno aditivni ili polu-aditivi . Potpuno aditivne mjere su one koje se mogu lako sažeti za sve dimenzije u tablici. Na primjer, quantity_ordered je atribut koji se može zbrojiti za sve dimenzije. Kao, možemo uzeti ukupnu količinu, za određenog kupca, regiju, datum, brand, itd. Semi-aditivne mjere su one koje se mogu zbrajati po nekim dimenzijama tablice činjenica, ali ne u svim dimenzijama. Na primjer, iznos bilance se ne može sažeti tijekom vremenske dimenzije jer se mijenja tijekom vremena.
Prosječni podaci
Ponekad možemo vidjeti zapise u tablici činjenica koja ima atribute s nultim mjerama . Na primjer, možda ne postoji narudžba na odmoru. Dakle, atributi za ovaj datum imat će nulte mjere. Za takvu vrstu evidencija ne moramo pohranjivati mjeru jer ne pruža nikakve informacije.
Izgrađene dimenzije
Ponekad možete naići na neke dimenzije u tablici činjenica, koje uopće nisu aditivne. Primjerice, broj narudžbe, customer_id, ne možete dodati ove vrste dimenzija. Međutim, u slučaju, morate pronaći narudžbu koju je izvršio određeni korisnik u ovom mjesecu; tada će vam trebati customer_id za povezivanje pretraživanja. Ove vrste ako se atributi ili dimenzije tablice činjenica nazivaju Degenerated Dimension .
Definicija tablice dimenzija
Tablica dimenzija je ključna komponenta za Start Schema. Tablica dimenzija sadrži atribute koji predstavljaju dimenzije, uz koje se mjerenje uzima u tablici činjenica. Nadalje, raspravit ćemo neke karakteristike tablice dimenzija.
Atributi i tipke
Svaka tablica dimenzija mora imati primarni ključ koji jedinstveno identificira svaki zapis tablice. Uobičajeno je primijetiti da tablica dimenzija sadrži mnogo atributa. Dakle, čini se da je širok, tj. Kada stvorite tablicu dimenzija, naći ćete je da se širi horizontalno .
Vrijednosti atributa
Vrijednosti atributa u tablici dimenzija rijetko su brojčane, većinu vremena kada ćete u atributima pronaći vrijednosti u tekstualnom formatu . Na primjer, naziv proizvoda, marka, kategorija, podkategorija itd.
Odnos između atributa
Često možete promatrati, atributi na koje naiđete u tablici dimenzija nisu izravno povezani. Na primjer, Product_brand ne mora ništa učiniti s paketom_datuma, ali i dalje može biti atribut tablice dimenzija proizvoda.
Normalizacija
Tablica dimenzija ne bi trebala biti normalizirana . To je zato što bi normaliziranje tablice stvorilo mnoge među-tablice. Kada upit preuzme atribut iz tablice dimenzija i oporavi mjerenja po tome za tablicu činjenica, upit mora proći kroz one među-tablice koje postaju neučinkovite. Stoga tablice dimenzija nisu normalizirane.
Bušenje, valjanje
Atributi tablice dimenzija omogućuju vam da dobijete detalje prelaskom s više razine skupnih atributa na atribute niže razine. Na primjer, ako želite pronaći cjelokupnu prodaju u regiji, možete pronaći podatke o prodaji po državi, gradu, pošti. Možete čak i zavrsiti da biste pronašli ukupnu prodaju najprije zipom, a zatim gradom, a zatim državom.
Višestruka hijerarhija
Često tablica dimenzija nudi višestruke hijerarhije. Na primjer, imamo tablicu dimenzija proizvoda za odjelni dućan. Sada imamo dva odjela marketinga i računovodstva.
Odjel za marketing će u atributima tablice dimenzija proizvoda analizirati u određenoj hijerarhiji kako bi dobio mjerenja za tablicu činjenica.
S druge strane, odjel za računovodstvo će analizirati među atributima tablice dimenzija proizvoda u različitim hijerarhijama kako bi dobio mjerenja za tablicu činjenica.
Dakle, tablica dimenzija mora imati višestruke hijerarhije ili razinu agregiranja atributa kako bi korisnik mogao svladati bilo koju od višestrukih hijerarhija.
ploče
Iako tablica dimenzija ima previše atributa, ima manje zapisa.
Ključne razlike između tablice činjenica i tablice veličine
- Tablica činjenica sadrži mjerenja duž dimenzije / atributa tablice dimenzija.
- Tablica činjenica sadrži više zapisa i manje atributa u odnosu na tablicu dimenzija, dok tablica dimenzija sadrži više atributa i manje zapisa.
- Tablica veličine tablice povećava se vertikalno, dok veličina tablice dimenzionalne tablice raste horizontalno.
- Svaka tablica dimenzija sadrži primarni ključ za identifikaciju svakog zapisa u tablici, dok tablica činjenica sadrži ulančani ključ koji je kombinacija svih primarnih ključeva svih tablica dimenzija.
- Tablica dimenzija mora se zabilježiti prije stvaranja tablice činjenica.
- Shema sadrži manje tablica činjenica, ali više tablica dimenzija.
- Atributi u tablici činjenica su numerički i tekstualni, ali atributi tablice dimenzija imaju samo tekstualne atribute.
Zaključak:
Oba su podjednako važna za stvaranje sheme, ali tablica dimenzija mora biti zabilježena prije tablice činjenica. Kako je nemoguće izraditi tablicu činjenica s dimenzijama.