What's Data Mining
Data Mining
التنقيب فى البيانات و هو يعتمد على التسلسل الهرمى فى Data Pyramids و الذى يتمثل فى الأتى :
· Data
· Information
· Knowledge
· Wisdom
الـ DM يكون فى مرحلة Knowledge لذا يطلق على الـ DM ما يسمى بالـ Knowledge Discovery و عشان اقدر أوصل للمرحلة دى لازم نمر بمراح الـ Process الخاص بالـ DM و و أحنا بنعمل mining in large data base و الـ Process بتحمل صفتين و هما كالاتى (Interactive – iterative ) هى كالاتى :
Data Integrated
و هى مرحلة تجميع البياناتبصورة موحدة بسبب مصادرها المختلفة
Data Cleaning
و هى مرحلة معالجة و تنظيف البيانات من أى مشاكل
Data Warehouse
وهى مرحلة تجميع البيانات فى مكان موحد يطلق علية Data Warehouse
Selection " Task Relevant Data"
وفى هذه المرحلة يتم تحديد البيانات المطلوبة أستخراج منها المعلومات المطلوبة
Data Mining
و هى مرحلة الوصول للمعلومات المطلوبة
Pattern Evaluation "Knowledge"
و هى مرحلة رؤية لأخر مرحلة فى الـ DM و الوثوق بالنتيجة و أذا وجد شىء يحتمل نسبة الخطء يتم أعادة الـ Process مرة أخرى أذا لم نصل للـ Pattern المطلوب و هذا ما يسمى بالـ Iterative هكذ يكون قد تم الـ Data Mining Task و يوجد نوعين من الـ Task و هما كالاتى :
Predictive "Classifications – Prediction"
لمعرفة التصنيف او القيمة المفقودة
Descriptive "Association Rules - Clustering – Outlier Analysis"
ما هى القاعدة او العلاقة او سبب التشابة
يوجد عدة تحديات سوف تواجهنا اثناء تنفيذ الـ DM Task و هى كالاتى :-
· Scalability
· Dimensionality
· Heterogeneous and complex data "Integrated Data"
· Data Quality " Cleaning Data"
· Data Distribution
· Privacy Preservation
تعالوا بقى نكلم عن الـ Data Preparation and Processing
و هى ان نبدء نعمل Integrated ثم نقوم بعمل cleaning ثم يتم نقل الـ Data إلى data warehouse وهنا يكون أسمها clean data ثم نقوم بعمل selection للـ data المطلوبة و دا بيكون مرتبط بالـ Goal Identification و نقوم بنقلها Transformation للبدء بالعمل عليها