Automatizált adattárház építés a Rapid Platform segítségével
Adattárház építés minimális tapasztalattal
10 hónap munkatapasztalattal rendelkező junior BI tanácsadóként azt a feladatot kaptam, hogy alakítsak ki egy komplett adattárházat, adatpiacot, és populáljam be adatokkal.
Tekintve, hogy kevés tapasztalattal rendelkeztem a területen, ez a feladat elsőre hosszú időt, és sok energiát igénylő kihívásnak tűnt. Természetesen nem egyedül kellett abszolválnom. Egy Senior kolléga segített elindulni, valamint figyelte és támogatta a feladatvégzés folyamatát. Ez nem változtatott azon a tényen, hogy egy komplex folyamatot kellett megértenem és véghez vinnem tapasztalat hiányában.
Ezért is lepődtem meg, mikor megismertem a Rapid platformot. Nem gondoltam, hogy egy adattárház építéséhez hasonlóan hosszú és sokszor meglehetősen összetett folyamat olyan szintig automatizálható és leegyszerűsíthető, amilyen a Rapid Platform segítségével lehetséges.
Projekt előkészületek
A szoftver használatához csupán erre volt szükség:
- meg kellett értenem a folyamat lépéseit,
- meg kellett értenem az adattárház struktúráját és definiálni a forrásrendszerből elhozandó objektumokat
- ezeket az objektumokat fel kellett vinni egy egyszerű Excel alapú konfigurációs fájlba.
Az Abylon Rapid Platform megoldás haszna nem csak az Üzleti Intelligencia fejlesztőknek nyújtott könnyebbségben rejlik, hanem az ezzel járó jelentős költségcsökkenésben. Az automatizmusok által felszabadított időt és energiát a feladat és az adatok mélyebb megértésére, és ezen keresztül a tényleges értéket teremtő feladatokra fordíthattam, mint például a megfelelő adatmodell kialakítása és finomítása, valamint a későbbiekben ezekre a modellekre analitikai jelentések készítése.
Pár szó a fejlesztői környezetről
Egy Microsoft stack alapú fejlesztői környezetben könnyedén kivitelezhető egy adattárház automatizációs megoldás az Abylon eszközével.
- MS Visual Studio megoldáson keresztül könnyedén megtalálható a konfigurációs fájl, amelyben a fentebb említettek szerint beállíthatók a szükséges paraméterek. Itt található még egy-egy, a kapcsolatokat és környezeteket tároló konfigurációs fájl is.
- A Rapid platform egy eszközének betöltése után, egy egyszerű PowerShell paranccsal legeneráltam a STAGE, DWH rétegeket definiáló file-okat a megoldás részeként.
- Visual Studio-ban a megoldás build-elése után, egy másik Rapid Platform parancsot megfuttatva, a kapcsolatok helyes definiálása esetén, a megadott SQL szerverre kitelepül az adott adatmodell struktúra. Ezután létrehoztam a különböző olap modelleket, amelyeket VS-ben, valamint Tabular editorban tudtam kialakítani. Ezt az adatbázishoz hasonlóan egy ara parancs segítségével ki tudtam telepíteni egy Analysis Services szerverre.
- Ezek után már csak az adatáttöltésre volt szükség, amelynek mikéntjét szintén a konfigurációban határoztam meg. A STAGE rétegből a DWH rétegbe való adatáttöltéshez szükséges tárolt eljárások automatikusan generálódtak le. Ezen tárolt eljárások meghívása egyszerűen felvehető „execution plan item”-ekként a konfigurációs file-ba, különböző „Execution plan”-ek részeként, amelyek egy SQL job segítségével könnyedén meghívhatók és beütemezhetők. A később, manuálisan létrehozott, DM réteget töltő tárolt eljárások is egyszerűen felvehetők a konfigurációs fájl ETL folyamatokat definiáló részébe, amelyek így az SQL job futtatásakor, az „Execution Plan” részeként lefutnak. Így egyetlen job futtatásával lehetőség nyílik a teljes adattárház adatainak betöltésére.
Így jött létre egy automatikusan frissülő adattárház, amelyben a szükséges adatok historizáltan elérhetőek, valamint az OLAP kockák, amelyekre kapcsolódva el is indulhatott a különféle analitikai riportok készítése.
Az általam tapasztalt előnyök
Azon felül, hogy rengeteg terhet levesz a fejlesztők válláról az adattárház automatizálás, az ügyfelek számára is jelentős előny, hiszen nagyban csökkenthetők a megvalósításra szánt ráfordítások.
Az automatizációk által nyújtott előnyök
- Idő-, Energia- és pénzbeli költségcsökkenés
- Emberi hibák számának jelentős csökkenése
- Nincs szükség SSIS ismeretre, tanulásra, automatikus mapping
Egyszerű használat
- Adattárház építésben kisebb tapasztalattal rendelkező kezdőként is gyorsan megérthető és elsajátítható felhasználóbarát felület
- Segít megérteni komplex folyamatokat egészükben
- Test explorer támogatja a fejlesztést, debuggingot
Rugalmasság
- Tapasztalatom szerint az Abylon Rapid Platform amellett, hogy számos feladatot automatizál, igen rugalmas is. A különböző ügyfelek sajátos igényeire optimalizálható, kisebb változtatásokkal.
Mit mondanak róla az ügyfelek?
Amennyiben felkeltettem az érdeklődéseteket az Abylon Rapid Platformra épülő adattárház fejlesztő megoldásunk (korábbi nevén Rapid Analytics) iránt akkor az alábbi bejegyzés, ügyfélinterjú és esettanulmány is érdekes lehet:
A bejegyzés szerzője:
Tamásovics Zsombor - Junior BI tanácsadó az Abylon Consulting-nál Linkedin Profile
Érdekes volt a bejegyzés?
Iratkozzon fel hírlevelünkre, hogy értesüljön új témábavágó cikkeinről, híreinkről.