Těžba dat vs. skladování dat
Pojmy „dolování dat“ a „skladování dat“ se vztahují k oblasti správy dat. Jedná se o programy sběru dat, které se používají hlavně ke studiu a analýze statistik, vzorců a dimenzí v obrovském množství dat.
Těžba dat
Pojem „dolování dat“ se používá pro proces, který zahrnuje analýzu dat z hlediska různých perspektiv a shrnutí těchto údajů do užitečných informací. Software dolování dat zpracovává informace tak, aby reguloval data buď při snižování nákladů nebo při zvyšování výnosů, nebo obojí.
Postupy dolování dat sledují hloubkovou studii a shromažďování informací pomocí identifikace konkrétních trendů na základě údajů a dotazů generovaných uživatelem. Hlavním cílem softwaru pro dolování dat je identifikovat neobvyklé vzorce, odhalit podvody týkající se zejména financí a generovat řízené programy pro zlepšení marketingu..
Software pro dolování dat se používá hlavně kvůli obrovskému množství shromážděných údajů. Data se vlévají skenery, přímou odpovědí na poštu, bankomaty, protokoly webového serveru, demografická data, kamery s uzavřeným okruhem, transakcemi kreditními kartami a mnoha dalšími zdroji. Všechny tyto informace musí být ověřeny a shrnuty před provedením jakékoli analýzy. Tento proces je klasifikován jako datové sklady. Dalším krokem je třídění těchto informací pomocí různých postupů integrovaných do těžby dat.
Software pro dolování dat využívá různé kroky. Prvním krokem je předběžné zpracování dat, které zahrnuje: výběr dat, čištění dat, odstranění šumu a transformaci dat. Po vytvoření těchto společných informačních jednotek se vygenerují nová pole. Dalším krokem je konstrukce modelu dolování dat. Zde je vygenerován potenciální model pro shrnutí užitečných informací. Posledním krokem je vyhodnocení modelu dolování dat.
Těžba dat je v současné době nezbytná zejména kvůli rostoucí konkurenci v podnikání. Společnosti si konkurují, pokud jde o služby, personalizaci, bezpečnost a podnik v reálném čase.
Skladování dat
Skladování dat je proces sběru a ukládání dat, který lze později analyzovat na těžbu dat. Datový sklad je propracovaný počítačový systém s velkou úložnou kapacitou. Data ze všech zdrojů jsou směrována do tohoto zdroje, kde jsou data čištěna k odstranění konfliktních a nadbytečných informací. Proces skladování dat umožňuje centralizovaný přístup k datům.
Propracované a složité techniky sběru a zpracování dat jsou hlavními zdroji pro organizace k vytvoření účinného a efektivního zařízení pro skladování dat. Jedná se o zásadní přínos pro společnosti, aby si udržely svou ziskovost, efektivitu a konkurenční výhody. Shromážděná data jsou předávána procesem zvaným Data Life Cycle Management.
Skladování dat používá techniky pro systémy správy relativních databází, jako je extrakce, načítání, transformace a relační online zpracování aplikací. Existují čtyři charakteristiky technik skladování dat. Jsou to: předmětový design, integrace s daty, energeticky nezávislý obraz stavů, zobrazení dat a časové varianty dat.
Souhrn: