DBMS vs dolování dat
DBMS (Database Management System) je kompletní systém používaný pro správu digitálních databází, který umožňuje ukládání obsahu databáze, vytváření / údržbu dat, vyhledávání a další funkce. Na druhou stranu je Data Mining oborem informatiky, který se zabývá extrakcí dříve neznámých a zajímavých informací ze surových dat. Data použitá jako vstup pro proces dolování dat se obvykle ukládají do databází. Uživatelé, kteří mají sklon ke statistikám, používají dolování dat. Používají statistické modely k hledání skrytých vzorců v datech. Horníci údajů mají zájem najít užitečné vztahy mezi různými datovými prvky, což je pro podniky v konečném důsledku výhodné.
DBMS
DBMS, někdy nazývaná také správce databází, je sbírka počítačových programů, která je vyhrazena pro správu (tj. Organizaci, ukládání a načítání) všech databází, které jsou nainstalovány v systému (tj. Pevný disk nebo síť). Ve světě existují různé typy systémů správy databází a některé z nich jsou navrženy pro správnou správu databází konfigurovaných pro specifické účely. Nejoblíbenějšími komerčními systémy správy databází jsou Oracle, DB2 a Microsoft Access. Všechny tyto produkty poskytují prostředky pro přidělování různých úrovní oprávnění různým uživatelům, což umožňuje, aby DBMS byla centrálně řízena jedním administrátorem nebo aby byla přidělena několika různým lidem. V každém systému správy databází jsou čtyři důležité prvky. Jsou to modelovací jazyk, datové struktury, jazyk dotazů a mechanismus pro transakce. Modelovací jazyk definuje jazyk každé databáze hostované v DBMS. V současné době je v praxi několik populárních přístupů, jako je hierarchický, síťový, relační a objektový. Datové struktury pomáhají organizovat data, jako jsou jednotlivé záznamy, soubory, pole a jejich definice a objekty, jako jsou vizuální média. Jazyk dotazů na data udržuje bezpečnost databáze sledováním přihlašovacích údajů, přístupových práv k různým uživatelům a protokolů pro přidávání dat do systému. SQL je populární dotazovací jazyk, který se používá v systémech správy relačních databází. Konečně mechanismus, který umožňuje transakce, pomáhá souběžnosti a multiplicitě. Tento mechanismus zajistí, že stejný záznam nebude modifikován více uživateli současně, a tím zachová integritu dat v kontaktu. Kromě toho poskytuje DBMS také zálohu a další zařízení.
Těžba dat
Dolování dat je také známé jako Zjišťování znalostí v datech (KDD). Jak je uvedeno výše, jedná se o počítačové odvětví, které se zabývá extrakcí dříve neznámých a zajímavých informací ze surových dat. Kvůli exponenciálnímu růstu dat, zejména v oblastech jako je podnikání, se dolování dat stalo velmi důležitým nástrojem pro převedení tohoto velkého množství dat na obchodní inteligenci, protože manuální extrakce vzorců se v posledních několika desetiletích zdála nemožná. Například se v současné době používá pro různé aplikace, jako je analýza sociálních sítí, detekce podvodů a marketing. Dolování dat se obvykle zabývá následujícími čtyřmi úkoly: shlukování, klasifikace, regrese a asociace. Shlukování identifikuje podobné skupiny z nestrukturovaných dat. Klasifikace jsou pravidla učení, která lze použít na nová data a obvykle budou zahrnovat následující kroky: předzpracování dat, navrhování modelování, výběr učení / funkce a vyhodnocení / ověření. Regrese je nalezení funkcí s minimálními chybami pro modelování dat. A asociace hledá vztahy mezi proměnnými. Dolování dat se obvykle používá k zodpovězení otázek, jaké jsou hlavní produkty, které by mohly příští rok ve Wal-Martu pomoci dosáhnout vysokého zisku?
Jaký je rozdíl mezi DBMS a Data mining?
DBMS je plnohodnotný systém pro bydlení a správu sady digitálních databází. Dolování dat je však technika nebo koncept v oblasti informatiky, který se zabývá získáváním užitečných a dříve neznámých informací ze surových dat. Tato surová data jsou většinou uložena ve velmi rozsáhlých databázích. Těžba dat proto využívá stávající funkce DBMS ke zpracování, správě a dokonce předzpracování nezpracovaných dat před a během procesu těžby dat. Samotný systém DBMS však nelze použít k analýze dat. Některé databáze DBMS však v současné době mají vestavěné nástroje nebo funkce pro analýzu dat.