Wat is een verticale database?

Een verticale database is er een waarin de fysieke lay-out van de gegevens kolom voor kolom is in plaats van rij voor rij. In plaats van te worden gerangschikt in horizontale recordstructuren en verticaal verwerkt, worden gegevens in een verticale database gerangschikt in verticale structuren, ook wel predikaatbomen of P-bomen genoemd, en horizontaal verwerkt.

Datamining

Horizontale databases zijn geschikt voor toepassingen waarbij het gevraagde resultaat een reeks horizontale records is, maar minder voor toepassingen zoals datamining, waar onderzoekers doorgaans geïnteresseerd zijn in resultaten die beknopt kunnen worden uitgedrukt. P-trees daarentegen zijn zeer geschikt voor datamining. P-trees worden meestal gemaakt door elk attribuut of elke kolom van een tabel met horizontale records te ontbinden in afzonderlijke bitvectoren of arraygegevensstructuren. P-bomen kunnen eendimensionaal, tweedimensionaal of multidimensionaal zijn; als de gegevens die in de database moeten worden opgeslagen natuurlijke afmetingen hebben - bijvoorbeeld geospatiale gegevens of geografische informatie - worden de afmetingen van de P-boom aangepast aan die van de gegevens.

Prestatie

Gegevens in een verticale database worden verwerkt via snelle logische operatoren, zoals AND, OR, exclusieve OR en complement. Bovendien is het, door de gegevens kolomgewijs in plaats van rijgewijs te rangschikken, mogelijk om query's of zoekopdrachten op de gegevens uit te voeren zonder toegang te krijgen tot pagina's op een harde schijf die niet worden beïnvloed door de query en zo de snelheid van het ophalen van gegevens te verhogen . Dit is een belangrijke overweging bij datamining in zeer grote datarepository's.

Pagina grootte

Een ander voordeel van verticale databases is dat ze het mogelijk maken om gegevens op grote pagina's op te slaan. Een groot paginaformaat betekent dat een groot aantal relevante gegevensitems in één leesbewerking kan worden opgehaald. Daarentegen haalt een enkele leesbewerking op een horizontale database niet alleen relevante gegevensitems op, maar ook attributen of kolommen die niet relevant zijn voor de betreffende zoekopdracht en die kleine paginaformaten begunstigt.

Wetenschappelijke toepassingen

Verticale databases hebben de afgelopen jaren hernieuwde belangstelling gekregen van de wetenschappelijke gemeenschap. Het aantal gelijktijdige gebruikers in wetenschappelijke databasetoepassingen is doorgaans veel kleiner dan in commerciële toepassingen, maar gebruikers hebben de neiging om complexere, onvoorziene vragen in te dienen. Bovendien moeten wetenschappelijke databasetoepassingen doorgaans een meer geautomatiseerd antwoord bieden op complexe vragen vanwege het ontbreken van database- en systeemondersteunend personeel. Wetenschappelijke gebruikers werken doorgaans het liefst met speciale, interne computersystemen, dus wetenschappelijke databasetoepassingen moeten overdraagbaar zijn tussen verschillende computermodellen. Verticale databases zijn in al deze opzichten beter dan hun horizontale tegenhangers.