Elvira Nusias
BI-konsult
Till att börja med kan det vara bra att veta vad ett datalager, eller data warehouse, faktiskt är och vad det är bra till. Vad är skillnaden mellan ett datalager och en data lake? Och hur skiljer det sig egentligen från en databas? Begreppen är många och det kan ibland vara svårt att vid en första anblick veta skillnaderna. Låt oss börja förklara!
En organisation har ofta data samlat i flera olika system. Det kan till exempel vara ett CRM-system för att hantera kunddata, ett kassasystem, ett ordersystem och många fler beroende på bransch och storlek på företag. Problemet med detta är att data som lagras i olika system inte går att jämföra eller analysera sinsemellan. Ett datalager löser detta problem som en central förvaringsplats för data som kommer från de olika källorna.
Nu kanske du undrar vad skillnaden är mellan ett datalager och en databas. Skillnaden ligger i syftet med de båda. Syftet med en databas är mer inriktat till att förvara aktuella data. Om en förändring sker så görs den förändringen utan hänsyn till att kunna se hur det har sett ut tidigare. Det finns en enda bild av den data som är aktuell. Syftet med ett datalager är däremot att även samla i historisk data. Det de har gemensamt är att både databaser och datalager sparar strukturerade data vilket gör att datakvaliteten kan försäkras. I en data lake går det inte att säkra kvaliteten på data på samma sätt. Däremot går det att lagra olika former av data i en data lake. Det går att spara strukturerade data, alltså tabeller, men även ostrukturerade så som till exempel video-filer eller semistrukturerade filer som exempelvis json-filer.
Fördelarna med ett datalager är flera. Vi har redan nämnt att det är essentiellt att samla data från olika system på ett ställe för att kunna utföra analyser. För att kunna vara säker på att analyser ger ett relevant och riktigt resultat är det av oerhörd vikt att de data som analyserna baseras på har bra kvalitet. Därför är det också en stor fördel att kunna säkra kvaliteten av data genom bearbetningen av data på väg till datalagret. Datalagrets arkitektur och dess tydliga ramar säkrar att all data sparas organiserat och följer den gemensamma struktur som datalagret har.
Ett datalager byggs upp genom att först hämta in data från källorna, därefter transformera det och sedan ladda in det i datalagret. På engelska brukar denna process förkortas till ETL (eller ELT) vilket står för Extract, Transform och Load. För att beskriva tillvägagångssättet lite mer ingående så är första steget att avgöra vilka data som är relevanta från de olika källsystemen och sedan hämta in dessa. Sedan görs transformeringar vilket innefattar bearbetning, validering och tvättning av data. Tvättningen av data kan med andra ord beskrivas som en ”städning” eller ”rengöring” av de data som hämtats in. Detta görs för att strukturera upp och göra det mer enhetligt. När informationen blir mer strukturerad så är det också lättare att använda de data som finns i datalagret till analyser och rapportering. Efter att transformeringarna har slutförts laddas all data till sist in i ett datalager. Med en noggrann transformeringsprocess kommer du nu ha ett välorganiserat datalager!
En modern datalager arkitektur byggs i molnet. Detta har flera fördelare. Bland annat att det går att skala upp och ned kapacitet efter användning och att kostnaderna dras in för lagring och underhåll.
Med ett datalager får organisationen en enda källa till all sin företagskritiska data. Detta innebär att hela organisationen hämtar ut data från samma källa vilket minskar fel som till exempel kan uppstå då en ändring görs på ett ställe men inte på ett annat.
Datalagret är en viktig del i beslutstöd, eller Business Intelligence som det också kallas, och hjälper företaget att göra nytta av sin data. Tack vare BI-verktyg som Power BI kan företag visualisera sin data och på så sätt lättare förstå den. De kan till exempel använda insikter från sin data till att effektivisera sina processer, som beslutsunderlag i små som stora beslut, för att förbättra sina erbjudanden, för att hitta sina brister och åtgärda dem eller upptäcka nya möjligheter som gör organisationen starkare bland konkurrenterna. Möjligheterna är många och det finns mycket att vinna i att göra sin verksamhet mer datadriven!
Kostnadsfri e-guide: En modern arkitektur för en datadriven kultur
För företag finns det mycket att vinna på att göra verksamheten mer datadriven. Men för att lyckas med det krävs en modern BI-arkitektur. I vår nya guide tittar vi närmare på förutsättningarna som behöver finnas på plats för att bli mer datadriven, på riktigt. Ladda ner vår kostnadsfria e-guide via formuläret nedan!
Boka gärna in ett möte med oss där vi kan berätta mer om hur vi kan hjälpa just din verksamhet att bli mer datadriven. Vi erbjuder bland annat möten, demos, behovsanalyser och startpaket.
Kontakta oss