Kaj je navpična zbirka podatkov?

Navpična baza podatkov je tista, pri kateri je fizična postavitev podatkov stolpec za stolpcem in ne vrstica za vrstico. Namesto da bi bili podatki v navpični bazi podatkov razporejeni v vodoravne strukture zapisov in obdelani navpično, so v vertikalnih strukturah, znanih kot predikatna drevesa ali P-drevesa, obdelani vodoravno.

Podatkovno rudarjenje

Vodoravne zbirke podatkov so primerne za aplikacije, pri katerih je zahtevani rezultat skupek vodoravnih zapisov, manj pa za aplikacije, kot je rudarjenje podatkov, kjer raziskovalce običajno zanimajo rezultati, ki jih je mogoče izraziti jedrnato. P-drevesa pa so zelo primerna za podatkovno rudarjenje. P-drevesa se običajno ustvarijo z razgradnjo vsakega atributa ali stolpca tabele vodoravnih zapisov v ločene bitne vektorje ali podatkovne strukture matrike. P-drevesa so lahko enodimenzionalna, dvodimenzionalna ali večdimenzionalna; če imajo podatki, ki jih je treba shraniti v zbirki podatkov, naravne dimenzije - na primer geoprostorski podatki ali geografski podatki - se dimenzije drevesa P ujemajo z dimenzijami podatkov.

Izvedba

Podatki v navpični zbirki podatkov se obdelujejo s hitrimi logičnimi operatorji, kot sta AND, OR, izključno OR in dopolnilo. Poleg tega je mogoče z razvrščanjem podatkov po stolpcih namesto po vrsticah izvajati poizvedbe ali iskanja po podatkih brez dostopa do strani na trdem disku, na katere poizvedba ne vpliva, in tako povečati hitrost iskanja podatkov . To je pomemben vidik pri rudarjenju podatkov v zelo velikih skladiščih podatkov.

Velikost strani

Druga prednost vertikalnih baz podatkov je, da omogočajo shranjevanje podatkov na velikih straneh. Velika velikost strani pomeni, da je mogoče z enim postopkom branja pridobiti veliko število ustreznih podatkovnih postavk. Nasprotno pa ena sama operacija branja v vodoravni zbirki podatkov ne pridobi samo ustreznih podatkovnih postavk, temveč tudi atribute ali stolpce, ki niso pomembni za zadevno poizvedbo, in daje prednost majhnim velikostim strani.

Znanstvene aplikacije

Vertikalne zbirke podatkov so se v zadnjih letih znova zanimale za znanstveno skupnost. Število sočasnih uporabnikov v aplikacijah znanstvenih zbirk podatkov je običajno veliko manjše kot v komercialnih aplikacijah, vendar uporabniki običajno oddajajo bolj zapletene, nepredvidene poizvedbe. Poleg tega morajo aplikacije znanstvenih baz podatkov navadno zagotavljati bolj avtomatiziran odziv na zapletene poizvedbe zaradi pomanjkanja osebja za baze podatkov in sistemov. Znanstveni uporabniki običajno raje delajo z namenskimi lastnimi računalniškimi sistemi, zato morajo biti aplikacije znanstvenih baz podatkov prenosljive med različnimi modeli računalnikov. Vertikalne zbirke podatkov so v vseh teh okoliščinah boljše kot njihove vodoravne.