În lumea afacerilor de azi, folosirea calculatoarelor în procesele de afaceri de zi cu zi şi înregistrarea datelor au devenit omniprezente. Cu apariţia erei electronice a apărut şi un produs practic „de nepreţuit” – data.
După cum din ce în ce mai mulţi directori descoperă pe zi ce trece, companiile pot strânge şi analiza date şi pot astfel obţine informaţii de valoare despre proprii clienţi.
Data mining este procesul folosit în administrarea acestei mari cantităţi de date şi reducerea ei la cunoştinţe folositoare. Data mining are o aplicabilitate nelimitată, incluzând vânzări şi marketing, sprijinirea clienţilor, dezvoltare bazată pe cunoaştere, detectarea fraudelor pe orice domeniu etc.
Data mining – oarecum un nume neobişnuit – se referă la mineritul datelor pentru a afla „piatra preţioasă” ce se ascunde în interiorul datelor. Este important a se nota că, oarecum, data mining este doar o singură parte a procesului de descoperire a cunoştinţelor în procesul bazelor de date, cu toate că e un proces foarte complex.
Aplicarea procesului de descoperire de cunoştinţe asupra unor baze de date largi cu scopul extragerii de tipare sau cunoştinţe ascunse în date poartă numele de KDD – Knowledge Discovery in Databases. În mod general, KDD este folosit în baze de date a căror dimensiune mare împiedică omul să identifice manual tiparele menţionate şi să extragă cunoştinţele de valoare.
Deşi încă la început de dezvoltare, KDD este unul din domeniile în rapidă creştere în cercetarea din computer science şi industrie. KDD se foloseşte acum la o multitudine de aplicaţii, precum marketing, detectarea fraudelor, realizarea profilului clientului pentru adresarea acestuia cu reclame personalizate, descoperirea de noi tendinţe ale pieţei, clasificarea datelor.
Această listă creşte în mod foarte rapid, odată ce cercetătorii descoperă noi folosiri pentru această metodă puternică de analiză a datelor.
Definit in mod formal de către Fayyad, Piatetsky-Shapiro, Smyth, and Ramasamy (1996), KDD reprezintă „procesul netrivial de identificare a tiparelor valide, noi, potenţial folositoare şi de înţeles ascunse în date.”
Sursa:
Baritchi, A., Data Mining and Knowledge Discovery, în Raisinghani, M., Business Intelligence in the Digital Economy – Opportunities, Limitations and Risks, Idea Group INC., 2004