Skip to Content

Data Modeling

Een integraal onderdeel van business intelligence is het data modelleren. Het modelleren betekent dat architectuur en structuur van de data wordt vastgelegd. Modelleren van de data is belangrijk omdat hierdoor de functionele mogelijkheden en de prestatie van een data warehouse grotendeels bepaald worden, alsmede de effectiviteit de uiteindelijke analyses, rapporten of dashboards.

Het modelleren van een data warehouse kan op verschillende manieren gebeuren. De meest bekende methoden hierin zijn Data Vault en het dimensioneel modelleren volgens Kimball.

Een essentiële stap bij data modelleren is het analiseren van de informatiebehoeften van de organisatie. Deze behoeften bepalen uiteindelijk welke gegevens worden gebruikt in een analyse (kubes), rapportage of dashboard. Het modelleren van een data warehouse verschilt sterk van het modelleren van een transactie gerichte database omdat in een data warehouse gegevens dimensioneel d.w.z. op historische basis, bewaard worden.

Bij het analyseren van de informatiebehoeften komen o.a. de volgende vragen aan bod:

  1. Wat zijn de bepalende 'facts' in een organisatie? Dit kunnen feiten zijn waarop een organisatie stuurt, zoals bijvoorbeeld omzet, aantal klachten, aantal verkochte producten of verzendingen (retail), aantal operaties (ziekenhuis) etc.;
  2. Wat zijn de bijbehorende 'measures' ? Wat zijn de numerieke definities en waarden van een feit? Numerieke waarden zijn noodzakelijk omdat calculaties moeten worden uitgevoerd in het data warehouse, bijvoorbeeld de stuksprijs van product, of een telling van het aantal gebeurtenissen;
  3. Wat zijn de bijbehorende dimensies? De dimensies vormen de minimum representatie van de feiten, zoals per product, winkelfiliaal an datum, enz. De dimensies bevatten ook beschrijvende attributen, waarmee een verder classificatie mogelijk wordt, zoals bijv. geslacht of woonplaats;
  4. Wat zijn de hierarchieën? De hierarchieën zijn te herkennen als deelverzameling bijv. regio, stad, wijk of winkelfiliaal.

Kijkje in de toekomst

Data mining is een onderdeel van business intelligence. Business intelligence software kijkt doorgaans naar historische gegevens en is daarom terugblikkend. Data mining software, daarentegen, is vooruitblikkend. Met behulp van data mining software kunnen patronen worden ontdekt in data die een voorspellende waarde hebben en daarom kunnen worden gebruikt om effectievere managementbeslissingen te nemen.

Data mining oplossingen vindt steeds meer toepassingen binnen een groeiend aantal organisaties. Hier liggen een aantal ontwikkelingen aan ten grondslag:

  • computer hardware wordt steeds krachtiger: steeds meer meer computerkracht tegen lagere kosten maakt het mogelijk om een groter aantal gegevens te analyseren
  • betere software op basis van voortschrijdende kennis op het gebied van kunstmatige intelligentie, statistiek en machine learning

Aan de twee bovenstaande ontwikkelingen kan nog een derde ontwikkeling worden toegevoegd. Data mining is traditioneel het domein geweest van sofwarebedrijven als SAS en SPSS, met dure en specialistische software. In de afgelopen jaren is echter ook open source data mining software in opkomst. Net als op andere gebieden wordt de data mining softwaremarkt hierdoor opgeschud. Met software-applicaties zoals RapidMiner en KNIME komt data mining steeds meer binnen bereik van organisaties, zonder zich direct te commiteren aan een dure software-applicatie.

Hoe krijg ik stuurinformatie uit mijn data?



Business Intelligence gaat over de beschikbaarheid van data en het omvormen ervan tot (stuur-) informatie of KPI's (Key Performance Indicator).

  • Data Integratie
  • Data Warehousing
  • Analyse
  • Data Mining
  • Rapportage en dashboard
  • Pentaho
  • Jaspersoft
  • Talend
  • RapidMiner
  • BIRT
  • MySQl
  • PostgreSQL