كاوش دادهها
داده كاوي به بهره گيري از ابزارهاي تجزيه و تحليل دادهها به منظور كشف الگوها و روابط معتبري كه تا كنون ناشناخته بودهاند اطلاق ميشود. اين ابزارها ممكن است مدلهاي آماري، الگوريتمهاي رياضي و روشهاي ياد گيرنده (Machine Laming Method) باشند كه كار اين خود را به صورت خودكار و بر اساس تجربهاي كه از طريق شبكههاي عصبي (Neural Networks) يا درختهاي تصميم گيري (Decision Trees) به دست ميآورند بهبود ميبخشد. داده كاوي منحصر به گردآوري و مديريت دادهها نبوده و تجزيه و تحليل اطلاعات و پيش بيني را نيز شامل ميشود برنامههاي كاربردي كه با بررسي فايلهاي متن يا چند رسانهاي به كاوش دادهها مي پردازند پارامترهاي گوناگوني را در نظر ميگيرد كه عبارت اند از:
- رابطه (Association): الگوهايي كه بر اساس آن يك رويداد به ديگري مربوط ميشود مثلاً خريد قلم به خريد كاغذ.
- ترتيب (Sequence): الگويي كه به تجزيه و تحليل توالي رويدادها پرداخته و مشخص ميكند كدام رويداد، رويدادهاي ديگري را در پي دارد مثلاً تولد يك نوزاد و خريد پوشك.
- دسته بندي(Classification): شناسايي الگوهاي جديد مثلاً همزماني خريد چسب و پوشه
- خوشه بندي(Clustering): كشف و مستند سازي مجموعهاي از حقايق ناشناخته مثلاً موقعيت جغرافيايي خريد محصولي با مارك خاص
- پيش بيني(Forecasting):كشف الگوهايي كه بر اساس آنها پيش بيني قابل قبولي از رويدادهاي آتي ارايه ميشود، مثلاً رابطه عضويت در يك باشگاه ورزشي با شركت ذر كلاسهاي ورزشي.
- مصورسازي (visualization): مصورسازي داده ها يكي از قدرتمندترين و جذابترين روش هاي اكتشاف در داده ها مي باشد.
برنامههاي كاربردي كه در زمينه تجزيه و تحليل اطلاعات به كار ميروند از امكاناتي چون پرس و جوي ساخت يافته (Structured query) كه در بسياري از بانكهاي اطلاعاتي يافت ميشود و از ابزارهاي تجزيه و تحليل آماري برخوردارند اما برنامههاي مربوط به داده كاوي در عين برخورداري از اين قابليتها از نظر نوع با آنها تفاوت دارند. بسياري از ابزارهاي ساده براي تجزيه و تحليل دادهها روشي بر پايه راستي آزمايي (verifiction)را به كار ميبرند كه در آن فرضيهاي بسط داده شده آنگاه دادهها براي تاييد يا رد آن بررسي ميشوند. به طور مثال ممكن است اين نظريه مطرح شود كه فردي كه يك چكش خريده حتماً يك بسته ميخ هم خواهد خريد. كارايي اين روش به ميزان خلاقيت كاربر براي ارايه فرضيههاي متنوع و همچنين ساختار برنامه بكار رفته بستگي دارد. در مقابل در داده كاوي روشهايي براي كشف روابط بكار برده ميشوند و به كمك الگوريتمهايي روابط چند بعدي بين دادهها تشخيص داده شده و آنهايي كه يكتا (unique) يا رايج هستند شناسايي ميشوند. به طور مثال در يك فروشگاه سختافزار ممكن است بين خريد ابزار توسط مشتريان با تملك خانه شخصي يا نوع خودرو، سن، شغل، ميزان درآمد يا فاصله محل اقامت آنها با فروشگاه رابطهاي برقرار شود.
در نتيجه قابليتهاي پيچيدهاش براي موفقيت در تمرين داده كاوي دو مقدمه مهم است يكي فرمول واضحي از مشكل كه قابل حل باشد و ديگري دسترسي به داده متناسب. بعضي از ناظران داده كاوي را مرحلهاي در روند كشف دانش در پايگاه دادهها ميدانند (KDD). مراحل ديگري در روند KDD به صورت تساعدي شامل، پاكسازي داده، انتخاب داده انتقال داده، داده كاوي، الگوي ارزيابي، و عرضه دانش ميباشد. بسياري از پيشرفتها در تكنولوژي و فرايندهاي تجاري بر رشد علاقهمندي به داده كاوي در بخشهاي خصوصي و عمومي سهمي داشتهاند. بعضي از اين تغييرات شامل:
- رشد شبكههاي كامپيوتري كه در ارتباط برقرار كردن پايگاهها داده مورد استفاده قرار ميگيرند.
- توسعه افزايش تكنيكهايي بر پايه جستجو مثل شبكههاي عصبي و الگوريتمهاي پيشرفته.
- گسترش مدل محاسبه كلاينت سروري كه به كاربران اجازه دسترسي به منابع دادههاي متمركز شده را از روي دسك تاپ ميدهد.
- و افزايش توانايي به تلفيق داده از منابع غير متناجس به يك منبع قابل جستجو ميباشد.
علاوه بر پيشرفت ابزارهاي مديريت داده، افزايش قابليت دسترسي به داده و كاهش نرخ نگهداري داده نقش ايفا ميكند. در طول چند سال گذشته افزايش سريع جمع آوري و نگه داري حجم اطلاعات وجود داشتهاست. با پيشنهادهاي برخي از ناظران مبني بر آنكه كميت دادههاي دنيا به طور تخميني هر ساله دوبرابر ميگردد. در همين زمان هزينه ذخيره سازي دادهها بطور قابل توجهي از دلار براي هر مگابايت به پني براي مگابايت كاهش پيدا كردهاست. مطابقا قدرت محاسبهها در هر ۱۸ – ۲۴ ماه به دوبرابر ارتقاء پيدا كردهاست اين در حالي است كه هزينه قدرت محاسبه رو به كاهش است. داده كاو به طور معمول در دو حوزه خصوصي و عمومي افزايش پيدا كردهاست. سازمانها داده كاوي را به عنوان ابزاري براي بازديد اطلاعات مشتريان كاهش تقلب و اتلاف و كمك به تحقيقات پزشكي استفاده ميكنند. با اينهمه ازدياد داده كاوي به طبع بعضي از پياده سازي و پيامد اشتباه را هم دارد.اينها شامل نگرانيهايي در مورد كيفيت دادهاي كه تحليل ميگردد، توانايي كار گروهي پايگاههاي داده و نرمافزارها بين ارگانها و تخطيهاي بالقوه به حريم شخصي ميباشد.همچنين ملاحظاتي در مورد محدوديتهايي در داده كاوي در ارگانها كه كارشان تاثير بر امنيت دارد، ناديده گرفته ميشود.
از شما دوستان عزیز که این مطلب آموزشی را دنبال نموده اید تشکر می کنیم و شما را دعوت میکنیم که برای فراگیری داده کاوی مطالب ما را دنبال کنید.این مطالب برای افزایش دانش شما در سایت قرار داده شده و کمک زیادی در یادگیری شما در انجام پروژه داده کاوی خواهد نمود.
فریلنسر هستم و مهارت انجام پروژه ای را دارم!
اگر شما فریلنسر هستید و توانایی انجام پروژه ای را در یک رشته یا حوزه ای خاص دارید برای فعالیت در سایت کافه پروژه و کسب درآمد می توانید در سایت ثبت نام کنید و پروژه هایی با مهارت انتخاب خود را مشاهده کنید.جهت ثبت نام و ثبت رزومه خود در سایت از طریق دکمه پایین صفحه در سایت عضو شوید:
نحوه سفارش پروژه در سایت کافه پروژه :
اگر پروژه ای دارید که میخواهید آن را برون سپاری کنید کافی است در سایت کافه پروژه ثبت نام کنید و پروژه خود را ثبت نمایید.پروژه شما هر چه که باشد حتما مجری برای آن وجود دارد.جهت ثبت نام و ثبت سفارش پروژه خود برروی دکمه زیر کلیک نمایید.

بدون دیدگاه