‏إظهار الرسائل ذات التسميات Data Mining. إظهار كافة الرسائل
‏إظهار الرسائل ذات التسميات Data Mining. إظهار كافة الرسائل

الاثنين، 17 مايو 2021

What's Data Mining





What's Data Mining

Data Mining





التنقيب فى البيانات و هو يعتمد على التسلسل الهرمى فى Data Pyramids و الذى يتمثل فى الأتى :

· Data

· Information

· Knowledge

· Wisdom




الـ DM يكون فى مرحلة Knowledge لذا يطلق على الـ DM ما يسمى بالـ Knowledge Discovery و عشان اقدر أوصل للمرحلة دى لازم نمر بمراح الـ Process الخاص بالـ DM و و أحنا بنعمل mining in large data base و الـ Process بتحمل صفتين و هما كالاتى (Interactive – iterative ) هى كالاتى :
 Data Integrated

و هى مرحلة تجميع البياناتبصورة موحدة بسبب مصادرها المختلفة
 Data Cleaning

و هى مرحلة معالجة و تنظيف البيانات من أى مشاكل
 Data Warehouse

وهى مرحلة تجميع البيانات فى مكان موحد يطلق علية Data Warehouse
 Selection " Task Relevant Data"

وفى هذه المرحلة يتم تحديد البيانات المطلوبة أستخراج منها المعلومات المطلوبة
 Data Mining

و هى مرحلة الوصول للمعلومات المطلوبة
 Pattern Evaluation "Knowledge"

و هى مرحلة رؤية لأخر مرحلة فى الـ DM و الوثوق بالنتيجة و أذا وجد شىء يحتمل نسبة الخطء يتم أعادة الـ Process مرة أخرى أذا لم نصل للـ Pattern المطلوب و هذا ما يسمى بالـ Iterative هكذ يكون قد تم الـ Data Mining Task و يوجد نوعين من الـ Task و هما كالاتى :
 Predictive "Classifications – Prediction"

لمعرفة التصنيف او القيمة المفقودة

 Descriptive "Association Rules - Clustering – Outlier Analysis"

ما هى القاعدة او العلاقة او سبب التشابة

يوجد عدة تحديات سوف تواجهنا اثناء تنفيذ الـ DM Task و هى كالاتى :-

· Scalability

· Dimensionality

· Heterogeneous and complex data "Integrated Data"

· Data Quality " Cleaning Data"

· Data Distribution

· Privacy Preservation

تعالوا بقى نكلم عن الـ Data Preparation and Processing

و هى ان نبدء نعمل Integrated ثم نقوم بعمل cleaning ثم يتم نقل الـ Data إلى data warehouse وهنا يكون أسمها clean data ثم نقوم بعمل selection للـ data المطلوبة و دا بيكون مرتبط بالـ Goal Identification و نقوم بنقلها Transformation للبدء بالعمل عليها