مسعود بينش
www.mgt.blogfa.com
چکيده
تغيير روند توجه سازمانها از منابع مالي به سرمايههاي انساني٬ فراهم آمدن زمينههاي تراكم و حتي انفجار اطلاعات از طريق فناوري اطلاعات و ارتباطات در سازمانها٬ الزام و اهميت مديرت دانش را بيش از گذشته به رخ كشيده است. استخراج اطلاعات مناسب از ميان انبوه دادهها و تبديل آنها به دانش مورد نياز سازمان، بويژه در تصميمگيريهاي سازماني٬ نيازمند استفاده از روشهاي نوين در اين حوزه است. داده كاوي يكي از اين ابزار و رويكردهاست كه در فضاي مديريت دانش سازمانها به كشف دانش از پايگاه دادهها كمك ميكند.
مديريت دانش
امروزه در عصر يادگيري٬ كاركنان را ارزشمندترين منبع سازمان به حساب ميآورند. كاركنان٬ حجم عظيم دادهها٬ اطلاعات و دانش سازمان را توليد ميكنند و بهكار ميبندند.از اينرو٬ مديريت دانش در كنار مديريت منابع انساني در سازمانهاي نوين٬ ضرورت يافته است. مديريت دانش٬ رويكردي سيستمي و يكپارچه است كه براي تمامي دارائيهاي اطلاعاتي سازمان اعم از: مستندات٬ پايگاه دادهها٬ خطمشيها٬ رويهها و تجربيات كاركنان و سازمان را دربر ميگيرد و به اشتراك ميگذارد. مديريت دانش، سكوي تسهيل كننده استخراج٬ ذخيرهسازي٬ يكپارچهسازي٬ انتقال٬ مشاهده٬ تجزيه و تحليل و استفاده از دانش در سازمان است. مديريت دانش درجهت حفظ٬ تجزيه و تحليل٬ سازماندهي٬ بهبود و تسهيم تجارب كسب و كار٬ بهعنوان ابزار٬ روش و راهبرد در سازمان بهكارميرود. در واقع، مديريت دانش متدلوژي استخراج سيستمي و استفاده از دانش در سازمان است كه از طريق همين دانش و سرمايه فكري٬ ثروت و ارزش ميآفريند. در نگرش سيستمي به مديريت دانش٬ سه مؤلفه اصلي منابع انساني٬ فرايندها و فناوري دخالت و با يكديگر همپوشاني دارند (شكل 1) .
نسبت مديريت دانش و دادهكاوي
ابزار متفاوتي براي بهكارگيري مديريت دانش در سازمان٬ استفاده ميشود. يكي از مهمترين آنها٬ دادهكاوي است. هنگامي كه طراحي مجدد فرايندهاي كسب و كار (BRP) مورد نظر است٬ دادهكاوي بهعنوان تكنيك٬ درخدمت مديريت دانش قرار ميگيرد. درهربنگاه صنعتي٬ اقتصادي و تجاري نيز دانش با ارزش در مورد مشتري٬ محصول و بازار را ميتوان از طريق دادهكاوي بهدست آورد. با بزرگترشدن حجم دادهها و اطلاعات سازمانها٬ اهميت اين مسئله روزبهروز بيشتر ميشود. وقتي حجم دادهها زياد است٬ از سيستمهاي پايگاه دادهها (DBS/DBMS) براي مديريت آنها استفاده ميشود. در حالت زيادبودن حجم دادهها٬ دادهكاوي براي استخراج و بهدست آوردن دانش بهكار ميآيد. وقتي حجم دانش زياد است از سيستم مديريت دانش (KMS) استفاده ميشود.
داده كاوي
پيشينه طرح موضوع دادهكاوي به دهه 1980 و به صورت جدي، به دهه 1990 برميگردد. پيش از آن٬ از سيستمهاي جمعآوري و مديريت دادهها و اصطلاحاً لايروبي دادهها استفاده ميشد٬ اما به مرور زمان٬ استخراج و كشف سريع و دقيق اطلاعات با ارزش و پنهان از پايگاه دادهها بهعنوان دادهكاوي مورد توجه قرار گرفت. به اين شكل بود كه فرايند دادهكاوي به عنوان فرايند آماري و تجزيه و تحليل درفرايند كشف دانش در پايگاه دادهها (KDD) 1 پررنگ شد٬ به حدي كه گاه٬ دادهكاوي (DM) بهعنوان مترادف كشف دانش در پايگاه دادهها(KDD) مورد استفاده قرار ميگرفت. امروزه فرايند استخراج اطلاعات معتبر٬ از پيش ناشناخته٬ قابل فهم و قابل اعتماد از پايگاه دادههاي بزرگ و استفاده از آن در تصميمگيري و در فعاليتهاي تجاري دادهكاوي ناميده ميشود. در تعاريف متعدد و متنوع براي دادهكاوي برموضوعاتي نظير: استخراج دانش كلان٬ كاوش در دادهها٬ تجزيه و تحليل دادهها و يافتن روابط و الگوهاي مطمئن بين دادهها تاكيد ميشود. هدف نهايي دادهكاوي٬ ايجاد سيستمهاي پشتيباني تصميمگيري سازماني است. دادهكاوي به استخراج اطلاعات مفيد و دانش از حجم زياد دادهها ميپردازد. دادهكاوي٬ الگوهاي حاوي اطلاعات را در دادههاي موجود جستوجو ميكند. اين الگوها و الگوريتمها، ميتوانند توصيفي باشند يعني دادهها را توصيف كنند و يا جنبه پيشبيني داشته باشند، يعني از متغيرها براي پيشبيني ارزشهاي ناشناخته ساير متغيرها بهكار روند. دادهكاوي توصيفي، بهدنبال يافتن اگرها در فعاليتها يا اقدامات گذشته است و دادهكاوي پيشبينانه با نگاه به سابقه٬ رفتار آينده را پيشبيني ميكند.
دادهكاوي چه هست و چه نيست
موارد زير در حوزه دادهكاوي قرار ميگيرند:
• استخراج يا كاوش دانش از ميان حجم عظيم دادهها
• استخراج اطلاعات و مدل كردن الگوهاي پنهاني در ميان انبوه دادهها
• استخراج اطلاعات غيرمنتظره٬ ناشناخته و بالقوه مفيد از دادهها.
• استخراج اطلاعات يا الگوهاي مفيد و جالب از دادهها در پايگاه دادههاي بزرگ
موارد زير در محدوده دادهكاوي قرار نميگيرند:
• انبارش دادهها
• پردازش قياسي دادهها
• سيستمهاي خبره (ES)
• فرايند تجزيه و تحليل مستقيم
• ابزار تجزيه و تحليل آماري
• مشاهدهگري دادهها
حوزههاي دادهكاوي
دادهكاوي در سه حوزه مستقل به كار ميرود و در آنها ريشه دوانده است:
1. آمار كلاسيك و الگوهاي آماري
2. هوش مصنوعي
3. يادگيري خودكار و شبكههاي عصبي
در دادهكاوي٬ هوش مصنوعي٬ يادگيري خودكار٬ تئوري پايگاه دادهها و علم آمار درهم آميخته شده است. براي انجام دادهكاوي از ابزار مختلف نظير: تفكيك كردن٬ دستهبندي٬ درخت تصميمگيري٬ تحليل قواعد وابستگي٬ تحليل خوشهها و الگوريتمهاي عمومي استفاده ميشود (شكل2).
مراحل فرايند
هدف دادهكاوي٬ تجزيه و تحليل اكتشافي دادهها٬ كشف الگوها و قواعد و الگوريتمها٬ مدلسازي پيشبينانه و جستوجوي انحرافات است. براي انجام اين هدف٬ فرايند دادهكاوي درجهت كشف دانش در مراحل مختلف انجام ميشود (شكل 3) كه عبارت است از:
1. اولين گام در دادهكاوي٬ شناسايي هدف و فهم حوزه كاربرد آن است و مشخص ميكند كه چهكاري٬ در چه حوزهاي انجام خواهد شد
2. انتخاب دادهها يعني تعيين اهداف براي تجزيه و تحليل و كشف آن
3. آمادهسازي دادهها شامل تميزسازي دادهها
4. اتخاذ بهترين روش دادهكاوي براي دستيابي به اهداف
5. اجراي دادهكاوي يعني بهكارگيري الگوريتم
6. ارزيابي و اعتبارسنجي يافتهها
7. استفاده از نتايج و تثبيت و تحكيم دانش كشف شده
8. تصميم گيري براساس دانش كشف شده.
شكل ( 3 )
طراحي سيستم دادهكاوي
اگر از دادهكاوي براي مهندسي مجدد كسب و كار استفاده شود٬ مراحلي كه ذكر شد به صورت زير قابل استفاده خواهند بود :
1. فهم و درك كسب و كار شامل تعيين اهداف كسب و كار٬ ارزيابي موقعيت٬ تعيين هدف دادهكاوي و طرح پروژه.
2. فهم و درك داده شامل جمعآوري دادهها٬ توصيف دادهها٬ كيفيت داده و صحهگذاري٬ آناليز اكتشافي دادهها.
3. آمادهسازي داده شامل انتخاب٬ ساخت و انتقال متغيرها٬ يكپارچهسازي و فرمتدهي دادهها
4. ساختن مدل و صحهگذاري شامل طرح اوليه٬ ساخت مدل و ارزيابي مدل
5. ارزيابي و تغيير شامل ارزيابي نتايج٬ فرايند بازنگري و تعيين مراحل بعدي
6. جاريسازي شامل اجراي طرح٬ تدوين گزارش نهائي٬ پايش و نگهداري طرح و بازنگري آن
موانع و چالشها
با وجود مزاياي فراوان كه دادهكاوي براي مديريت دانش سازمانها و دستيابي به دانش براي تصميمگيري سازماني دارد٬ اين حوزه با موانع و چالشهايي روبهروست كه عبارتند از:
1. فقدان داده براي پشتيباني تجزيه و تحليل
2. قدرت محدود محاسبه براي بهدست آوردن محاسبات رياضي مورد نياز الگوريتمهاي دادهكاوي
3. عدم مطلوبيت و جذابيت بيشتر الگوها
4. خطر وجود دادههاي آلوده و كسب نتايج كاملاً غلط.
5. تمركز بيش از حد برالگوريتمها
6. هزينه نسبتاً گران سرمايهگذاري در همه حوزهها
7. عدم پوشش كامل همه حوزهها
كاربرد دادهكاوي
امروزه دادهكاوي در حوزههاي بسيار متنوع و متفاوت استفاده ميشود:
حوزه علم: شيمي٬ فيزيك٬ داروسازي٬ تجزيه و تحليل تصاوير پزشكي٬ تعيين نوع رفتار با بيماران و پيشگويي ميزان موفقيتهاي اعمال پزشكي٬ تعيين ميزان موفقيت روشهاي درماني در برخورد با بيماريهاي سخت٬ بيوشيمي٬ حسگرهاي كنترل در اقمار مصنوعي٬ بيوعلم شامل توصيف ژنها و تقسيمبندي گروه پروتئينها و توسعه داروها.
خرده فروشي: تجزيه و تحليل سبد خريد بازار٬ تعيين الگوهاي خريد مشتريان
بانكداري: پيشبيني الگوهاي كلاهبرداري از طريق كارتهاي اعتباري٬ تعيين ميزان استفاده از كارتهاي اعتباري براساس گروههاي اجتماعي
فروش و بازاريابي: تجزيه و تحليل سهام و سرمايه٬ تعيين مشتريان وفادار٬ مديريت ريسك و پيشبيني فروش
بيمه: تجزيه و تحليل دعاوي و پيشگويي ميزان جريمه بيمه نامههاي جديد توسط مشتريان.
حوزههاي ديگر نظير: ورزش و سرگرمي٬ فضانوردي و ديگر حوزههاي علم.
منابع
1. O.Folorunso, A.ogunde/ "The electronic journal of K.M. " , vol. 2,2004
2. B. Fernandez / et. Al., "Knowledge management"/ cho. 12, 2004.
3. N.Balac/ "introduction to data mining" , 2006.