این متن شامل 46 صفحه می باشد
دادهكاويعبارتاستازفرآيندخودكارکشفدانشواطلاعاتازپايگاههايداده اي.
اينفرآيندتكنيكهاييازهوشمصنوعيرابررويمقاديرزياديدادهاعمالمي كندتاروندها , الگوهاو روابطمخفيراكشفكند. ابزار هايدادهكاويبرايكشفدانشيااطلاعاتازدادههابهكاربراتكا نمي كنند،بلكهفرآيندپيشگوييواقعيتهاراخودكارمي سازند. اينتكنولوژينوظهور،اخيرًابهطورفزايندهايدرتحليلهامورداستفادهقرارميگيرد.
كلمات كليدي :
Data mining, Predictive data mining, Exploration data analysis,
Data warehousing, Olap, neural network, Deployment , machine
Learning, Meta-learning, Bagging , Boosting , clustering , Eda
Drill-down analysis, Stacket generalization , classification
مقدمه :
امروزه با حجم عظيمي از داده ها روبرو هستيم. براي استفاده از آنها به ابزارهاي كشف دانش نياز داريم. داده كاوي به عنوان يك توانايي پيشرفته در تحليل داده و كشف دانش مورد استفاده قرار مي گيرد. داده كاوي در علوم (ستاره شناسي،...)در تجارت (تبليغات، مديريت ارتباط با مشتري،...) در وب (موتورهاي جستجو،...) در مسايل دولتي (فعاليتهاي ضد تروريستي،...) كاربرد دارد. عبارت داده كاوي شباهت به استخراج زغال سنگ و طلا دارد. داده كاوي نيز اطلاعات را كه در انبارهاي داده مدفون شده است، استخراج مي كند.
در واقع هـــــدف از داده كاوي ايجاد مدل هايي براي تصميم گيري است. اين مدلها رفتارهاي آينده را براساس تحليلهاي گذشته پيش بيني مي كنند. به كاربردن داده كاوي به عنوان اهرمي براي آماده سازي داده ها و تكميل قابليتهاي انباره داده ، بهترين موقعيت را براي به دست آوردن برتريهاي رقابتي ايجاد مي كند.
داده كاوي (Data mining) :
داده كاوي (Data mining) يك فرايند تحليلي است كه جهت كاوش داده ها (معمولاً حجم بالاي داده ها و يا داده هاي تجاري و مربوط به بازار) و جستجوي الگوهاي پايدار يا روابط سيستماتيك مابين متغيرها بكار ميرود وسپس با اعمال الكو هاي شناسايي شده به زير مجمو عه هاي جديد صحت داده هاي بدست آمده بررسي ميگردد. هدف نهايي داده كاوي پيشگويي است.
سازمانهامعموًلاروزانهمقدارزياديدادهرادرانجامعملياتتجاريخودتوليدوجمعآوريميكنند.
امروزهبراياينپايگاههايدادهشركتيعجيبنيستكهمقداردادههايآندرحدترابايتباشد.بااينحالعليرغمثروتاطلاعاتيعظيمذخيرهشدهحدسزدهميشودكهفقط٪٧كلداده هاييكهجمعآوري مي شودمورداستفادهقرارميگيرد. بدينترتيبمقدارقابلتوجهيدادهكهبدونشكحاوياطلاعات ارزشمندسازمانياستتاحدزياديدستنخوردهباقيميماند. درمحيطتجاريعصراطلاعات،كههرروز رقابتي ترمي شود مي توانبااستخراجاطلاعاتازداده هاياستفادهنشدهبهتصميمگيري هاياستراتژيكدست يافت. درطولتاريختحليلدادههاازطريقرگرسيونوديگرتكنيكهايآماريانجامشدهاست. براي استفادهازاينتكنيكها،لازماستكهتحليلگرمدليخلقكندوفرآيندگردآوريدانشراسازماندهد.
اماامروزهاينروشهابهتنهاييكافينيستندوبايدازروشهايخودكاراستفادهكرد.
دادهكاويعبارتاستازفرآيندخودكارکشفدانشواطلاعاتازپايگاههايداده اي.
اينفرآيندتكنيكهاييازهوشمصنوعيرابررويمقاديرزياديدادهاعمالمي كندتاروندها،الگوهاو روابطمخفيراكشفكند. ابزار هايدادهكاويبرايكشفدانشيااطلاعاتازدادههابهكاربراتكا نمي كنند،بلكهفرآيندپيشگوييواقعيتهاراخودكارمي سازند. اينتكنولوژينوظهور،اخيرًابهطور
فرايندهايدرتحليلهامورداستفادهقرارميگيرد
داده كاوي پيشگويانه رايج ترين نوع داده كاوي است و با برنامه هاي كاربردي تجاري در ارتباط مستقيم است . فرايند داده كاوي از سه مرحله تشكيل شده است.
ا- كاوش اوليه (initial exploration )
2-ساختن مدل يا شناسايي الگو بوسيلة سنجيدن اعتبار وصحت داده ها
3-گسترش
1- مرحله كاوش(Exploration) :
اين مرحله معمولاً با آماده سازي داده ها آغاز مي شود كه تشكيل شده است از پاكسازي داده ها (cleaning data) ،تغير شكل داده ها، انتخاب زير مجموعه اي از ركورد ها (در زماني كه مجموعه اي از داده ها با حجم بالايي از فيلد ها موجود است) و انجام دادن برخي عمليات اوليه جهت قرار دادن متغير ها در يك بازة قابل مديريت،كه بستگي به روش آماري اي كه مورد نظراست دارد و پس ازآن به طبيعت مسئله تحت بررسي مربوط مي شود.
مرحلهُ اول فرآيند داده كاوي مي تواند در هر جايي از گسترة ، انتحاب يك روش مستقيم پيشگويي تا يك روش تجزيه و تحليل با جزئيات وزحمت بالا قرار داشته باشد .(جهت كسب اطلاعات وسيع تر به قسمت EDA مراجعه كنيد).
مبلغ قابل پرداخت 20,000 تومان
برچسب های مهم