در تپش این هفته، ماجرای فریب و تعرض در پوشش عرفانهای دروغین و رمالی را بررسی کردیم
جستجو برای بسیاری از افراد مثل مصرف اکسیژن است. درک موفقیتهایی که گوگل در آنالیز مستندات وب، ابر محاسبات و تبلیغات اینترنتی کسب کرده است، بسیار ساده و در عین حال مفید است. این در حالی است که برخی از کارآفرینان عرصه هوش مصنوعی معتقدند گوگل پایان تاریخ نیست. بلکه تکنیکهای آن میتواند راهی بهسوی آینده را به ما نشان دهد.
کارشناسان تکنیکهای هوش مصنوعی معتقدند روزی خواهد رسید که مردم میتوانند طرح یک داستان یا فهرست تمام سیاستمدارانی که نظری مخالف با نظر شما در اطراف خود طی 5 سال گذشته داشتهاند را جستجو کنند. تکنیکهای هوش مصنوعی مثل پردازش زبان طبیعی، تشخیص اشیا و یادگیری آماری ماشین، بار دیگر ذهنیت جستجوگران وب را به آتش خواهد کشاند.
از نظر موتور جستجو، وب اساسا بدنهای از واژگان در میلیاردها صفحه همراه با ابرلینکهایی است که آن واژگان را به هم وصل میکنند. یکی از موفقیتهای بزرگ گوگل اتصال موثر آن کلمات، اندازهگیری ارتباط بهوسیله ظاهر واژگان یک صفحه و تعداد ابرلینکهایی که به آن صفحه اشاره میکنند یا میزان محبوبیت آن است.
بهعنوان یک قاعده باید گفت موتورهای جستجو کلمات را نمیفهمند، آنها تنها برای تطبیق دادن واژگان کلیدی یک صفحه، نزدیک بودن واژگان یا لینک شدن به صفحههای دیگر را بررسی میکنند.
در نتیجه موتورهای جستجو نکات زبان بشر را از دست میدهند. برای مثال گوگل برای جستجوی یک عبارت ساده مثل «کتابهای نوشته شده توسط کودکان» بهدنبال صفحههایی میگردد که کلمههای «کتابها» و «کودکان» را شامل میشوند و کلمات ربط را به این دلیل که در تمام صفحهها به مقدار زیاد استفاده شدهاند، در نظر نمیگیرد. البته این کلمات در برخی موارد کلا معنای عبارت را عوض میکنند. همانطور که عبارت «کتابهای نوشته شده توسط کودکان» با عبارت «کتابهایی درباره کودکان» و «کتابهای کودکان» فرق میکند.
یکی از بزرگترین موانعی که سر راه ساخت هوش مصنوعی در موتور جستجو قرار دارد، این است که پیادهسازی آن در مقیاس بزرگ تقریبا غیرممکن است. برای اینکه نتایج کارآمدی محاسبه شود، نیازمند نیروی محاسباتی سختافزاری و نرمافزاری بسیار است و این عمل فوقالعاده گران تمام خواهد شد. ولی قانون مور هزینهها را برای کامپیوترها، پردازندهها و پهنای باند پایین میآورد و فرصتهای زیادی را فراهم میکند. همچنین جستجو یک کسبوکار پرمنفعت است. گوگل سالانه تقریبا 6 میلیارد دلار از تبلیغاتی که به نتایج آن لینک شدهاند، درآمد کسب میکند.
گرفتن نبض جستجو
برای مثال سایت Medstory تکنیکهای هوش مصنوعی را برای یکی از نواحی دانش که همان بهداشت و سلامت است، بهکار برده که صنعتی پر از تغییرات است و باعث میشود مردم نتوانند همیشه اطلاعات بهروزی داشته باشند.
تمرکز روی یک بدنه بخصوص دانش بسیار اقتصادیتر و کارآمدتر است. روشهایی که Medstory برای بیرون کشیدن دانش بیشتر از علم پزشکی برای مشتریان و پزشکان استفاده میکند، میتواند در صنایع دیگر مثل سرمایهگذاری یا سرگرمی نیز استفاده شود.
سطح تکنیکهای Medstory همانند گنجی از دانش است که به یکباره به کاربر داده میشود. در غیر این صورت کاربر وب برای بهدستآوردن آنها باید ساعتها یا روزها وقت صرف کند.
برای مثال بعد از جستجوی عبارت «کلسترول پایین» مجموعهای از نتایج که به موضوعات دیگری مثل دارو، علائم و اطلاعات تغذیه تقسیم میشوند، بازگردانیده میشود. در داخل هر زیرموضوع فهرستی از موارد مربوط به کلسترول پایین یافت میشود. برای مثال در تغذیه بیشترین لینکهای مرتبط با این موضوع، روغن زیتون است. اگر ماوس را روی آن ببرید صفحهای حاوی اطلاعات روغن زیتون و فواید آن برای کلسترول بالا باز میشود! اگر به همین ترتیب جستجو کنید شاید روزها برای پیدا کردن یک مطلب مفید وقت نیاز داشته باشید!
تطبیق عکس
تصور کنید عکسی از یک مبل راحتی را آپلود میکنید و از موتور جستجو میخواهید یکی شبیه به آن را پیدا کند. این ابزار ممکن است هم مبلهای شبیه را برای شما نمایش دهد و هم فروشگاههایی که میتوانید از آنها مبل بخرید.
در حال حاضر بیشتر موتورهای جستجوی تصویر به کلمات کلیدی یا توضیحات متنی که به تصویر پیوست شدهاند، تکیه میکنند تا بتوانند فهرستی از نتایجی که با پرسوجو مطابقت دارند را برگردانند. اگر تصویر توضیحات کافی نداشته باشد این روش کاربرد ندارد. سایت Riya که بنا بهدلایلی در حال حاضر کار نمیکند، توسط هوش مصنوعی درون تصویر را نگاه میکرد تا اطلاعاتی درباره کیفیت آن استخراج کند. این سایت از یکسری الگوریتم برای محاسبه تراکم، الگوها و بافتهای تصاویر استفاده میکرد و آنها را در یک نمایش ریاضی از تصویر قرار میداد که آن را امضای دیداری مینامند. هر تصویر از بیش از 6000 عدد تشکیل میشود و این موتور جستجو بهوسیله هوش مصنوعی، وب را بهدنبال امضاهای مشابه میگشت.
محمد حسین کردونی
منبع: cnet
در تپش این هفته، ماجرای فریب و تعرض در پوشش عرفانهای دروغین و رمالی را بررسی کردیم
گزارش «جامجم» درباره دستاوردهای زبان فارسی در گفتوگو با برخی از چهرههای ادب معاصر
معاون وزیر بهداشت: