گفتگو با دکتر جمال شهرابی عضو هیات علمی دانشگاه صنعتی امیرکبیر

کشف دانش پنهان درون داده‌ها

دانش داده‌کاوی از جمله علوم جدیدی محسوب می‌شود که طیف کاربردی بسیار گسترده‌ای دارد و طی چند سال اخیر جهان را متحول کرده است. این علم در واقع یکی از روش‌های سودمند در یافتن اطلاعات مفید در بین حجم عظیمی از اطلاعات است.
کد خبر: ۲۱۳۷۱۸
داده‌کاوی با کشف الگوها و روابط بین داده ها، ارزش‌های پنهانی آنها را آشکار می‌کند بنابراین با کشف این ارزش‌ها می‌توان ارزش‌های دیگر متغیرها را پیش‌بینی کرد و در امر تصمیم‌گیری از آنها بهره برد.

برای آشنایی با این علم که طی چند سال گذشته همواره جزو 10 دانش برتر جهان قرار گرفته است، با دکتر جمال شهرابی، عضو هیأت علمی دانشگاه صنعتی امیرکبیر صحبت کردیم و درباره این علم کمتر شناخته شده در کشور گفتیم و شنیدیم.

ابتدا بهتر است از این سوال شروع کنم:دانش داده‌کاوی چیست؟

دانش داده‌کاوی فرآیند کشف دانش پنهان درون داده‌هاست که با برخورداری از دامنه وسیع زمینه‌های تخصصی با توصیف، تشریح، پیش‌بینی و کنترل پدیده‌های گوناگون پیرامونی، امروزه دارای کاربرد بسیار وسیع در حوزه‌های مختلف از جمله صنعتی، پزشکی، ارتباطات، کشاورزی، انرژی، علوم اجتماعی، فرهنگی، سیاسی، اقتصادی، بازرگانی، دفاعی و آموزشی و... است به گونه‌ای که امروزه محدودیتی برای کاربرد این دانش در نظر گرفته نشده و زمینه‌های کاری این دانش را در تمامی عرصه‌های برخوردار از داده می‌دانند. داده‌کاوی در واقع پل ارتباطی میان علم آمار، علم رایانه، هوش مصنوعی، الگوشناسی، فراگیری ماشین و بازنمایی بصری داده است؛ به عبارت دیگر داده‌کاوی فرآیندی پیچیده برای شناسایی الگوها و مدل‌های صحیح، جدید و به صورت بالقوه مفید، در حجم وسیعی از داده است، به طریقی که این الگوها و مدل‌ها برای انسان‌ها قابل درک باشند و البته به صورت یک محصول قابل خریداری نیست، بلکه یک رشته علمی و فرآیندی است که باید به صورت یک پروژه پیاده‌سازی شود.

اما آیا به کارگیری این علم در عرصه‌های مختلف زندگی واقعا ضروری است؟

در طول دهه گذشته با پیشرفت روزافزون کاربرد پایگاه داده‌ها، حجم داده‌های ثبت شده به طور متوسط هر 5 سال 2 برابر می‌شود. در این میان سازمانهایی موفقند که بتوانند حداقل 7 درصد داده‌هایشان را تحلیل کنند. این در حالی است که تحقیقات انجام یافته نشان داده است سازمان‌ها کمتر از یک درصد داده‌هایشان را برای تحلیل استفاده می‌کنند. به عبارت دیگر در حالی که غرق در داده‌ها هستند، تشنه دانش می‌باشند. به همین سبب از آنجا که امروزه تمامی عرصه‌های زندگی ما برخوردار از داده است، با بکارگیری دانش داده‌کاوی و کشف دانش پنهان درون این داده‌ها می‌توان از این دانش در عرصه‌های مختلف زندگی بهره برد.

کاربرد اصلی این علم در چه حوزه‌هایی بیشتر احساس می‌شود؟

بنابر اعلام دانشگاهMIT  دانش نوین داده‌کاوی (Data mining )  دارای کاربردهای بسیار وسیع وگسترده در حوزه‌های مختلف است به گونه‌ای که امروزه حد و مرزی برای کاربرد این دانش در نظر گرفته نمی‌شود و زمینه‌های کاری این دانش را از ذرات کف اقیانوس‌ها تا اعماق فضا می‌دانند. به عبارت دیگر در تمام زمینه‌هایی که داده جمع‌آوری شده دارد یا امکان برداشت داده وجود دارد دانش داده‌کاوی دارای کاربرد است. البته در برخی از حوزه‌ها که زودتر از این دانش بهره برده‌اند کاربرد داده‌کاوی ملموس‌تر است. به طور مثال امروزه، کاربرد داده‌کاوی در بانک‌ها، مراکز صنعتی و کارخانجات بزرگ، مراکز درمانی و بیمارستان‌ها، مراکز تحقیقاتی، بازاریابی هوشمند، صنعت بورس و بیمه، ایمنی و تحلیل ریسک، کلیه زیرشاخه‌های مهندسی بویژه مهندسی صنایع و بسیاری از موارد دیگر است.

کاوش روی داده‌ها در این علم چگونه انجام می‌شود؟

کاوش داده‌ها به معنی کنکاش داده‌های موجود در پایگاه داده و انجام تحلیل‌های مختلف روی آن به منظور استخراج اطلاعات است. داده‌کاوی فرآیندی تحلیلی است که برای کاوش داده‌ها ‌  معمولا حجم عظیمی از داده‌ها صورت می‌گیرد و یافته‌ها ‌با ‌به‌‌کارگیری الگوهایی‌،‌ احراز اعتبار می‌شوند.

هدف اصلی از این کاوش و در نهایت اعتبار سنجی آنها با الگوهای مشخص چیست؟

فرآیند داده‌کاوی سرانجام به ایجاد مدل‌های توصیفی، تشریحی، پیش‌بینی و کنترلی منجر می‌شود. داده‌کاوی با ساخت مدل‌های توصیفی پدیده‌های پیرامونی را توصیف می‌کند، با مدل‌های تشریحی روابط علی  معلولی و عوامل موثر بر وقوع یک پدیده شناسایی و میزان اهمیت و تاثیرگذاری هر کدام بر وقوع پدیده معلوم می‌شود، با ایجاد مدل پیش‌بینی چگونگی وقوع و یا عدم وقوع یک پدیده پیش‌بینی شده و سرانجام با ساخت مدل‌های کنترلی نسبت به کنترل پدیده‌های پیرامونی در جهت مطلوب خود اقدام می‌گردد. به صورت دقیق‌تر می‌توان گفت: کاوش داده‌ها شناسایی الگوهای صحیح، بدیع، سودمند و قابل درک از داده‌های موجود در یک پایگاه داده است که با استفاده از پردازش‌های معمول قابل دستیابی نیستند.

امروزه با توجه به تنوع زیاد مخاطبان، مشتریان، بازارها، تنوع و پیچیدگی خدمات و محیط‌های کسب و کار، دسترسی به اطلاعات مناسب برای تصمیم گیری صحیح ضروری است. از این‌رو استفاده از راهکار‌های مناسب برای طبقه‌بندی و تولید اطلاعات از میان انبوهی از داده‌ها برای سازمان‌ها  ضروری و حیاتی است. علم داده‌کاوی پاسخی به این نیاز برای کشف دانش پنهان داده‌ها و تامین اطلاعات مورد نیاز مدیران است. دانش داده‌کاوی ابزاری است که مدیران را قادر می‌سازد سریع‌تر نسبت به آینده عمل کنند، به‌جای آن که واکنش‌پذیر باشند؛ فعال باشند و به جای آن‌که حدس بزنند؛  مطمئن باشند. واضح است که با داشتن این قابلیت، سازمان‌ها قادر هستند دانش ارزشمندی را از داده‌هایشان به دست آورند.

دانش داده‌کاوی سازمان‌ها را قادر می‌سازد از سرمایه داده‌هایشان بهره‌برداری کنند. این ابزار برای پشتیبانی فرآیند تصمیم‌گیری استفاده می‌شود. داده‌کاوی با پردازش جامع داده و انجام فرآیند تصمیم‌سازی از طریق استخراج دانش با ارزش از داده، تصمیم‌گیری را برای مدیران سازمان تسهیل می‌کند.

با توجه به کاربردهای گسترده، آیا تاکنون این علم در دنیا توانسته جایگاه خود را بیابد؟

داده‌کاوی جزو پر سرعت‌ترین دانش‌های دنیاست. دانش‌داده‌کاوی یکی از 10 دانش در حال توسعه‌ای است که دهه آینده را با انقلاب تکنولوژیک مواجه خواهد کرد و از این نظر در سال‌های اخیر در دنیا گسترش فوق‌العاده سریعی داشته است. دانش داده‌کاوی سازمان‌ها را قادر می‌کند تا از سرمایه داده‌هایشان بهره‌برداری کنند. این ابزار برای پشتیبان فرآیند تصمیم‌گیری استفاده می‌شود. داده‌کاوی با پردازش جامع داده و انجام فرآیند تصمیم سازی از طریق استخراج دانش با ارزش از داده، تصمیم‌گیری را برای مدیران سازمان تسهیل می‌کند.

در کشور ما چطور؟ از چه زمانی این علم مورد توجه قرارگرفت؟

در ایران به خاطر پیشرفت IT در سال‌های اخیر خوشبختانه داده‌ها برای اهداف عملیاتی  جمع‌آوری می‌شود اما متاسفانه بکارگیری دانش داده‌کاوی برای استخراج دانش درون داده‌هایی که با هزینه بسیار جمع‌آوری می‌شود کمتر انجام می‌پذیرد. در سال 83 که معرفی و بسط دانش داده‌کاوی توسط دانشگاه صنعتی امیرکبیر و موسسه پژوهشی داده‌پردازان گیتا آغاز شد، تعداد افراد کمی از دانش داده‌کاوی اطلاع داشتند، اما در حال حاضر، خوشبختانه با تلاش‌های انجام گرفته در سطح مردم عادی نیز آشنایی با داده‌کاوی وجود دارد و این نشان می‌دهد حتی مردم عادی نیز به لزوم این دانش پی برده‌اند. ایجاد باور داده‌کاوی در صنعت و به کارگیری این دانش در کل کشور، از جمله اهداف جاری دبیرخانه کنفرانس داده‌کاوی ایران است که ان‌شاءالله این مهم با کمک دولت و رسانه‌های ارتباط جمعی حاصل خواهد شد.

در حال حاضر در آستانه دومین همایش هستیم. آیا به طور قطع برگزاری برنامه‌ها،کارگاه‌ها و نشست‌هایی در این خصوص می‌تواند نقش موثری در گسترش این علم داشته باشد؟

بله، اولین کنفرانس داده‌کاوی ایران با هدف بسط و گسترش دانش داده‌کاوی در کشور طی 29 و 30 آبان ماه سال 1386 با موفقیت برگزار شد. در این رخداد مهم علمی که با شرکت بیش از 500 نفر از اساتید، پژوهشگران، دانشجویان و همچنین مدیران و کارشناسان صنعت برگزار می‌شد، از میان 342 مقاله رسیده به کنفرانس، با داوری‌های دقیق اعضای هیات علمی کنفرانس 134‌مقاله پذیرفته و ارائه شد. مولفان بیش از 96 درصد از مقالات پذیرفته شده، اعضای هیات علمی یا دانشجویان تحصیلات تکمیلی دانشگاه‌های ممتاز کشور بودند که این نشان از سطح بسیار بالای علمی و کیفی کنفرانس داشت. از پایان کنفرانس، دبیرخانه دائمی کنفرانس داده‌کاوی ایران نسبت به برگزاری مستمر نشست‌ها، سمینار‌ها و کارگاه‌های تخصصی داده‌کاوی و انجام پژوهش‌های کاربردی داده‌کاوی در صنعت اقدام کرد. پیشنهاد ایجاد دوره کارشناسی ارشد داده‌کاوی در دانشگاه صنعتی امیرکبیر از جمله دیگر اقدامات دبیرخانه کنفرانس در بسط و توسعه این دانش در کشور است که مراحل قانونی تصویب و اجرا را می‌گذراند. حالا پس از گذشت یک سال دومین کنفرانسمانند کنفرانس اول با حمایت علمی 9 دانشگاه برتر کشور و پشتیبانی شبکه 2 سیما و سازمان‌ها و وزارتخانه‌های پیشرو در عرصه داده‌کاوی برگزار می‌شود. همچنین در 3 روز پیش از کنفرانس طی روزهای 18، 19 و 20 آبان ماه 24 کارگاه آموزشی تخصصی داده‌کاوی در چهار سطح مقدماتی، متوسط، پیشرفته و کاربردی تخصصی برگزار خواهد شد.

در ضمن امسال برای اولین بار در کشور کارگاه‌های آموزشی تخصصی کاربردهای دانش داده‌کاوی به صورت ویژه و کاملا کاربردی در پنج حوزه بانک، بیمه و بورس، بازاریابی، مهندسی، ایمنی و تحلیل ریسک، صنعت نفت و گاز برگزار خواهد شد.

در پی فراخوان کنفرانس حدود 450 مقاله به دبیرخانه واصل شده که 170 مقاله پذیرفته شده است. علاقه‌مندان می‌توانند برای کسب اطلاعات بیشتر و ثبت‌نام در کنفرانس و کارگاه‌های تخصصی به سایت کنفرانس به نشانی 
http://www.irandatamining.ir  مراجعه کنند.

بهاره صفوی

newsQrCode
ارسال نظرات در انتظار بررسی: ۰ انتشار یافته: ۰

نیازمندی ها