Mi az adattárolás?
Az adattárolás nagy mennyiségű információ elektronikus tárolása egy vállalkozás vagy szervezet által. Az adattárolás az üzleti intelligencia létfontosságú eleme, amely elemzési technikákat alkalmaz az üzleti adatokra.
Az adattárolás fogalmát 1988-ban vezették be az IBM kutatói, Barry Devlin és Paul Murphy. Az adatok tárolási igénye a számítógépes rendszerek bonyolultabbá válásával és egyre növekvő mennyiségű adatkezeléssel fejlődött. Az adattárolás kulcsfontosságú könyve a WH Inmon "Az adattárház kiépítése" című kiadása, amelyet először 1990-ben adtak ki, és azóta többször is újra kinyomtatják.
Hogyan működik az adattárolás
Az adattárolás célja, hogy nagyobb betekintést nyújtson a vállalat teljesítményéhez, ha több heterogén forrásból összevont adatokat hasonlít össze. Az adattárház célja tranzakciós forrásokból származó történeti adatok lekérdezése és elemzése.
Miután az adatokat beépítették a raktárba, azok nem változnak és nem módosíthatók, mivel az adattárház elemzi az események már megtörténtét, az adatok időbeli változására összpontosítva. A tárolt adatokat biztonságos, megbízható, könnyen visszakereshető és könnyen kezelhető módon kell tárolni.
Vannak bizonyos lépések az adattárház létrehozásához. Az első lépés az adatkitermelés, amely magában foglalja nagy mennyiségű adat gyűjtését több forráspontból. Az adatok összeállítása után az adatok tisztításán megy keresztül, amely során az adatokat hibákon átfésültetik, és a talált hibákat kijavítják vagy kizárják.
A megtisztított adatokat ezután adatbázis-formátumból átalakítják raktári formátumba. A raktárban történő tárolás után az adatok válogatáson, konszolidáción, összefoglalón stb. Zajlanak, hogy összehangoltabbak és könnyebben használhatók legyenek. Idővel több adat kerül a raktárba, mivel a több adatforrás frissül.
Kulcs elvihető
- Az adattárolás nagy mennyiségű információ elektronikus tárolása egy vállalkozás vagy szervezet által.Az adattárházat tranzakciós forrásokból származó történeti adatok lekérdezésének és elemzésének futtatására tervezték üzleti intelligencia és adatbányászat céljából. betekintés egy vállalat teljesítményébe, összehasonlítva több heterogén forrásból származó adatokat.
Különleges megfontolások: Adatbányászat
A vállalkozások tárolhatnak adatokat feltáráshoz és adatbányászathoz, olyan információs mintákat keresve, amelyek elősegítik üzleti folyamataik fejlesztését. A megfelelő adattárolási rendszer megkönnyítheti a vállalat különböző részlegeinek hozzáférését egymás adataihoz.
Például egy adattár lehetővé teszi a vállalat számára, hogy könnyen felmérje az értékesítési csapat adatait, és segítséget nyújthat az értékesítés javításával vagy az osztály korszerűsítésével kapcsolatos döntések meghozatalában. Az üzleti vállalkozás dönthet úgy, hogy az ügyfelek kiadási szokásaira összpontosít, hogy termékeit jobban pozicionálja és növelje az eladásokat.
Adatraktározással a cég összegyűjti történelmi adatait ügyfeleinek az elmúlt időszakban - mondjuk 20 év alatt -, és ezekre az adatokra elemzést végezhet. Az így kapott információk betekintést nyújthatnak a fogyasztók preferenciáiba; a nap, hónap vagy év ideje, ha nagyobb az értékesítés; vagy az év legnagyobb kiadást igénylő ügyfele.
A hatékony adattárolás és -kezelés teszi a folyamatokat is lehetővé, például utazási foglalások kezdeményezése és automatizált bankjegyek használata.
Az adatbányászási folyamat öt lépésből áll:
- A szervezetek adatokat gyűjtenek és adattárházukba töltenek be. Ezt követően tárolják és kezelik az adatokat, akár házon belüli szerveren, akár a felhőn. A vállalkozás elemzői, menedzsment csapatok és információs technológiai szakemberek hozzáférnek az adatokhoz és meghatározzák, hogyan kívánják megszervezni. Ezután az alkalmazás szoftver rendezi az adatokat a felhasználó eredményei alapján. A végfelhasználó végül az adatokat könnyen megosztható formátumban, például grafikonon vagy táblázatokban nyújtja be.
Adattárolás és adatbázisok
Az adattárház nem feltétlenül ugyanaz a koncepció, mint egy standard adatbázis. Az adatbázis egy tranzakciós rendszer, amelyet úgy állítottak be, hogy figyelje és frissítse a valós idejű adatokat, hogy csak a rendelkezésre álló legfrissebb adatok legyenek elérhetők. Az adattárház úgy van programozva, hogy egy strukturált adatot egy ideig összevonja. Például az adatbázisnak csak a legfrissebb ügyfél címe lehet, míg az adattárháznak lehetnek minden olyan címe, amelyen az ügyfél az elmúlt 10 évben él.