Těžba dat vs. skladování dat
Proces dolování dat se týká odvětví informatiky, které se zabývá extrakcí vzorů z velkých datových souborů. Tyto sady se pak kombinují pomocí statistických metod a z umělé inteligence. Dolování dat v moderním podnikání je zodpovědné za přeměnu prvotních dat na zdroje umělé inteligence. S údaji je manipulováno, a je tedy schopen vydat spolehlivá rozhodnutí, která lze použít při rozhodování. To dává podnikům výhodu oproti konkurenci v tom, že mají soubory dat, na které se lze spolehnout při poskytování informací. Dolování dat je také používáno organizacemi v profilovacích postupech, včetně marketingu, vědeckého objevování a odhalování podvodů.
S těžbou dat mohou být spojeny další běžné termíny, jako je rybolov dat, bagrování dat nebo dokonce snooping dat. Všechny tyto poukazují na různé variace datové těžby, které se používají při vzorkování malých datových souborů, které mohou být příliš malé na to, aby se vytvořily statistické závěry. Ty jsou však klíčové pro nastínění platnosti používaných dat a mohou být použity při vytváření hypotézy, když se těšíme na dosažení dané datové populace..
Datový sklad, na druhé straně, je termín, který popisuje systém v organizaci, který se používá při sběru dat. Tato data shromážděná datovým skladem jsou to, co poskytují transakční systémy, jako jsou faktury, záznamy o nákupu nebo dokonce záznamy o půjčce. Datové záznamy jsou převzaty z jednotlivých míst vytvoření a jsou seskupeny pod jednou střechou, tedy datovým skladem. Tato data se poté vykazují a hlášení se provádí souhrnně, aby uživatelům obchodních informací pomohla při přijímání platných rozhodnutí. Úložiště dat pro efektivní práci vyžaduje zdroj dat, databázi a nástroj pro podávání zpráv.
Lze tedy říci, že datový sklad je databáze, která se používá ke specifickým účelům vykazování dat, která byla analyzována. Tato data pocházejí z různých systémů, které byly sestaveny pro podávání zpráv.
Pro splnění této funkce udržuje datový sklad funkce ve třech různých vrstvách. Patří sem inscenace, integrace a přístup. V pracovním procesu jsou nezpracovaná data ukládána vývojáři pouze za účelem analýzy a podpory. Integrační vrstva se používá pro integraci dat a pro získání úrovně abstrakce od uživatelů dat. A konečně, přístupová vrstva je důležitá při získávání dat od různých uživatelů dat.
Těžba dat i skladování dat lze označit za nástroje, které se používají ke shromažďování obchodních informací. Hlavním rozdílem mezi těmito dvěma způsoby je způsob shromažďování obchodních informací. Lze tedy říci, že data, která byla dobře skladována, lze těžit a je tedy možné je snadno využívat. Datový sklad je tedy zodpovědný za usnadnění práce při těžbě dat při ukládání všech relevantních dat, která je třeba těžit v centrálním místě, spíše než v případě, kdy těžba dat musí neustále hledat data na různých místech. To pomáhá šetřit čas strávený těžbou dat a prostředky použité při těžbě.
souhrn
Dolování dat je proces extrakce dat z velkých datových souborů.
Skladování dat je proces sdružování všech relevantních dat dohromady.
Dolování dat i skladování dat jsou nástroje pro sběr business intelligence.
Dolování dat je specifické při sběru dat.
Skladování dat je nástroj, který šetří čas a zvyšuje efektivitu tím, že spojuje data z různých míst z různých oblastí organizace.
Datový sklad má tři vrstvy, jmenovitě pracovní, integrační a přístupový.