كاوش داده‌ها

داده كاوي به بهره گيري از ابزارهاي تجزيه و تحليل داده‌ها به منظور كشف الگوها و روابط معتبري كه تا كنون ناشناخته بوده‌اند اطلاق مي‌شود. اين ابزارها ممكن است مدلهاي آماري، الگوريتم‌هاي رياضي و روش‌هاي ياد گيرنده (Machine Laming Method) باشند كه كار اين خود را به صورت خودكار و بر اساس تجربه‌اي كه از طريق شبكه‌هاي عصبي (Neural Networks) يا درخت‌هاي تصميم گيري (Decision Trees) به دست مي‌آورند بهبود مي‌بخشد. داده كاوي منحصر به گردآوري و مديريت داده‌ها نبوده و تجزيه و تحليل اطلاعات و پيش بيني را نيز شامل مي‌شود برنامه‌هاي كاربردي كه با بررسي فايل‌هاي متن يا چند رسانه‌اي به كاوش داده‌ها مي پردازند پارامترهاي گوناگوني را در نظر مي‌گيرد كه عبارت اند از:

  • رابطه (Association): الگوهايي كه بر اساس آن يك رويداد به ديگري مربوط مي‌شود مثلاً خريد قلم به خريد كاغذ.
  • ترتيب (Sequence): الگويي كه به تجزيه و تحليل توالي رويدادها پرداخته و مشخص مي‌كند كدام رويداد، رويدادهاي ديگري را در پي دارد مثلاً تولد يك نوزاد و خريد پوشك.
  • دسته بندي(Classification): شناسايي الگوهاي جديد مثلاً همزماني خريد چسب و پوشه
  • خوشه بندي(Clustering): كشف و مستند سازي مجموعه‌اي از حقايق ناشناخته مثلاً موقعيت جغرافيايي خريد محصولي با مارك خاص
  • پيش بيني(Forecasting):كشف الگوهايي كه بر اساس آنها پيش بيني قابل قبولي از رويدادهاي آتي ارايه مي‌شود، مثلاً رابطه عضويت در يك باشگاه ورزشي با شركت ذر كلاسهاي ورزشي.
  • مصورسازي (visualization): مصورسازي داده ها يكي از قدرتمندترين و جذابترين روش هاي اكتشاف در داده ها مي باشد.

برنامه‌هاي كاربردي كه در زمينه تجزيه و تحليل اطلاعات به كار مي‌روند از امكاناتي چون پرس و جوي ساخت يافته (Structured query) كه در بسياري از بانك‌هاي اطلاعاتي يافت مي‌شود و از ابزارهاي تجزيه و تحليل آماري برخوردارند اما برنامه‌هاي مربوط به داده كاوي در عين برخورداري از اين قابليت‌ها از نظر نوع با آنها تفاوت دارند. بسياري از ابزارهاي ساده براي تجزيه و تحليل داده‌ها روشي بر پايه راستي آزمايي (verifiction)را به كار مي‌برند كه در آن فرضيه‌اي بسط داده شده آنگاه داده‌ها براي تاييد يا رد آن بررسي مي‌شوند. به طور مثال ممكن است اين نظريه مطرح شود كه فردي كه يك چكش خريده حتماً يك بسته ميخ هم خواهد خريد. كارايي اين روش به ميزان خلاقيت كاربر براي ارايه فرضيه‌هاي متنوع و همچنين ساختار برنامه بكار رفته بستگي دارد. در مقابل در داده كاوي روشهايي براي كشف روابط بكار برده مي‌شوند و به كمك الگوريتم‌هايي روابط چند بعدي بين داده‌ها تشخيص داده شده و آنهايي كه يكتا (unique) يا رايج هستند شناسايي مي‌شوند. به طور مثال در يك فروشگاه سخت‌افزار ممكن است بين خريد ابزار توسط مشتريان با تملك خانه شخصي يا نوع خودرو، سن، شغل، ميزان درآمد يا فاصله محل اقامت آنها با فروشگاه رابطه‌اي برقرار شود.

در نتيجه قابليت‌هاي پيچيده‌اش براي موفقيت در تمرين داده كاوي دو مقدمه مهم است يكي فرمول واضحي از مشكل كه قابل حل باشد و ديگري دسترسي به داده متناسب. بعضي از ناظران داده كاوي را مرحله‌اي در روند كشف دانش در پايگاه داده‌ها مي‌دانند (KDD). مراحل ديگري در روند KDD به صورت تساعدي شامل، پاكسازي داده، انتخاب داده انتقال داده، داده كاوي، الگوي ارزيابي، و عرضه دانش مي‌باشد. بسياري از پيشرفت‌ها در تكنولوژي و فرايندهاي تجاري بر رشد علاقه‌مندي به داده كاوي در بخش‌هاي خصوصي و عمومي سهمي داشته‌اند. بعضي از اين تغييرات شامل:

  • رشد شبكه‌هاي كامپيوتري كه در ارتباط برقرار كردن پايگاهها داده مورد استفاده قرار مي‌گيرند.
  • توسعه افزايش تكنيكهايي بر پايه جستجو مثل شبكه‌هاي عصبي و الگوريتم‌هاي پيشرفته.
  • گسترش مدل محاسبه كلاينت سروري كه به كاربران اجازه دسترسي به منابع داده‌هاي متمركز شده را از روي دسك تاپ مي‌دهد.
  • و افزايش توانايي به تلفيق داده از منابع غير متناجس به يك منبع قابل جستجو مي‌باشد.

علاوه بر پيشرفت ابزارهاي مديريت داده، افزايش قابليت دسترسي به داده و كاهش نرخ نگهداري داده نقش ايفا مي‌كند. در طول چند سال گذشته افزايش سريع جمع آوري و نگه داري حجم اطلاعات وجود داشته‌است. با پيشنهادهاي برخي از ناظران مبني بر آنكه كميت داده‌هاي دنيا به طور تخميني هر ساله دوبرابر مي‌گردد. در همين زمان هزينه ذخيره سازي داده‌ها بطور قابل توجهي از دلار براي هر مگابايت به پني براي مگابايت كاهش پيدا كرده‌است. مطابقا قدرت محاسبه‌ها در هر ۱۸ – ۲۴ ماه به دوبرابر ارتقاء پيدا كرده‌است اين در حالي است كه هزينه قدرت محاسبه رو به كاهش است. داده كاو به طور معمول در دو حوزه خصوصي و عمومي افزايش پيدا كرده‌است. سازمانها داده كاوي را به عنوان ابزاري براي بازديد اطلاعات مشتريان كاهش تقلب و اتلاف و كمك به تحقيقات پزشكي استفاده مي‌كنند. با اينهمه ازدياد داده كاوي به طبع بعضي از پياده سازي و پيامد اشتباه را هم دارد.اينها شامل نگراني‌هايي در مورد كيفيت داده‌اي كه تحليل مي‌گردد، توانايي كار گروهي پايگاههاي داده و نرم‌افزارها بين ارگانها و تخطي‌هاي بالقوه به حريم شخصي مي‌باشد.همچنين ملاحظاتي در مورد محدوديتهايي در داده كاوي در ارگان‌ها كه كارشان تاثير بر امنيت دارد، ناديده گرفته مي‌شود.

از شما دوستان عزیز که این مطلب آموزشی را دنبال نموده اید تشکر می کنیم و شما را دعوت میکنیم که برای فراگیری داده کاوی مطالب ما را دنبال کنید.این مطالب برای افزایش دانش شما در سایت قرار داده شده و کمک زیادی در یادگیری شما در انجام پروژه داده کاوی خواهد نمود.

فریلنسر هستم و مهارت انجام پروژه ای را دارم!

اگر شما فریلنسر هستید و توانایی انجام پروژه ای را در یک رشته یا حوزه ای خاص دارید برای فعالیت در سایت کافه پروژه و کسب درآمد می توانید در سایت ثبت نام کنید و پروژه هایی با مهارت انتخاب خود را مشاهده کنید.جهت ثبت نام و ثبت رزومه خود در سایت از طریق دکمه پایین صفحه در سایت عضو شوید:

نحوه سفارش پروژه در سایت کافه پروژه :

اگر پروژه ای دارید که میخواهید آن را برون سپاری کنید کافی است در سایت کافه پروژه ثبت نام کنید و پروژه خود را ثبت نمایید.پروژه شما هر چه که باشد حتما مجری برای آن وجود دارد.جهت ثبت نام و ثبت سفارش پروژه خود برروی دکمه زیر کلیک نمایید.

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *