در تپش این هفته، ماجرای فریب و تعرض در پوشش عرفانهای دروغین و رمالی را بررسی کردیم
اگر برایتان داشتن اطلاعاتی راجع به این سیستم جالب توجه است، خوب است بدانید که یکی از محققان دانشگاه امیرکبیر موفق به طراحی آن شده است. جالب آنکه در بیشتر پروژههایی که پیش از این برای زبان فارسی، انجام گرفته است، تشخیص در سطح حروف مجزا است. ولی در پروژه ذکر شده تشخیص در سطح کلمه انجام میشود.
گفتگوی ما را با محمد علی بزرگزاده، دانش آموخته کارشناسی ارشد و مجری این طرح بخوانید.
منظور از نرمافزار تشخیص بر خط (online) چیست؟ از سیستم عملکرد آن برایمان بگوئید ؟
کاری که این نرمافزار انجام میدهد، بسیار ساده است. کاربر، یک کلمه فارسی را مینویسد و نرمافزار تشخیص میدهدکه کدام کلمه فارسی نوشته شده است. البته این کلمه میبایست از قبل در فرهنگ لغات نرمافزار تعریف شده باشد، زیرا جستجو تنها روی کلمات موجود در فرهنگ لغات انجام میپذیرد.
اساساً تشخیص دستنوشته، یک موضوع معروف و کاربردی است که مدتهاست بر روی آن کار میشود. تشخیص دستنوشته، خود به دو دسته برخط (online) و برونخط (offline) تقسیم میشود. تفاوت این دو روش در ورودیهای آنهاست. در تشخیص برخط دستنوشته، کلیه اطلاعات مربوط به جهت حرکت قلم در زمان نگارش موجود است، زیرا ورودی سیستم، توسط یک قلم دیجیتال تهیه میشود، اما در روش برونخط، ورودی، تصویری اسکنشده از یک دستنوشه است که شامل اطلاعات جهت و ترتیب نگارش نیست. البته هر کدام از این دو روش کاربردهای خاص خود را دارد.
این نرمافزار چه خدماتی را به کاربر ارائه میدهد؟
این نرمافزار، در حقیقت کاربر را از تایپ کردن بینیاز میکند. خیلی از افراد، سریعتر مینویسند و کندتر تایپ میکنند بنابراین این نرمافزار میتواند به آنها کمک نماید تا در وقت صرفهجویی کنند. نکته دیگر این که امروزه کامپیوترها خیلی کوچک شدهاند. آنقدر کوچک که برای صفحهکلید فضای مناسبی وجود ندارد. مثلاً دستگاههای PDA یا موبایلها را در نظر بگیرید. در این دستگاهها، یا تعداد کلیدها کم است و کاربر مجبور است برای تایپ یک حرف یک کلید را چند بار بزند و یا اینکه کلیدها آنقدر کوچک هستند که تایپ کردن با آنها سخت است. به همین علت است که در مدلهای جدید این دستگاهها، صفحه نمایش به تماس انگشت کاربر و یا قلم حساس است و میتوان با قلم بر روی آن نوشت. در حال حاضر، تعداد زیادی از این دستگاهها، قابلیت تشخیص حروف یا کلمات دستنوشته انگلیسی را دارند. البته دقت تشخیص، در همه آنها یکسان نیست.
از چه زمانی موارد مشابه این نرمافزار در دنیا مورد استفاده قرار گرفته است؟
اولین سیستمها، حروف چاپی را تشخیص میدادند. میتوانم بگویم حتی قبل از اینکه کامپیوتر اختراع شود. اولین اختراعهای ثبتشده در این زمینه مربوط به سالهای 1929 و 1933 هستند. در آن سالها از یک فناوری اپتومکانیکی برای تشخیص حروف استفاده میشد به این صورت که ماسکهای مکانیکی مختلفی از مقابل تصویر حرف عبور میکردند و نور از یک سو به آن تابانده میشد و از سوی دیگر توسط یک آشکارساز نوری دریافت میگردید. وقتی یک انطباق کامل صورت میگرفت، نور به آشکارساز میرسید و حرف ورودی بازشناسی میشد.
با اختراع کامپیوتر و عمدتاً از دهه 50 میلادی به بعد کارهای فراوانی انجام گرفته است. هم در زمینه تشخیص حروف چاپی و هم حروف دستنویس و هم کلمات چاپی و دستنویس. تحقیقات بر روی تشخیص دستنوشته زبانهای فارسی و عربی نیز بیش از 20 سال قدمت دارد اما باید در نظر داشته باشید که هیچکدام از سیستمها دقت صد درصد ندارند. بنابراین، این مسأله به هیچوجه حلشده تلقی نمیشود و همواره میتوان سرعت و دقت شناسایی را افزایش داد.
سیستم طراحی شده چطور کلمات فارسی را تشخیص میدهد؟
از آنجایی که این سیستم، قرار است به مرحله تجاری برسد، من در جواب دادن به این سوال، دارای محدودیتهایی هستم. اما میتوانم بگویم در این سیستم نیز مانند تعدادی از سیستمهای مشابه، از طریق مقایسه اجزاء کلمه با دستنوشتههای دیگری که به دادههای آموزشی موسوم است، یک کلمه تشخیص داده میشود. اهمیت فراوان دارد که دادههای آموزشی از افراد مختلف با دستخطهای متنوع، تهیه شده باشد. هرچه این دادههای آموزشی جامعتر باشد، شناسایی نیز دقیقتر خواهد بود. تعداد کلمات فارسی، خیلی زیاد است و مسلم است که نمیتوانیم برای کلیه کلمات فارسی، داده آموزشی تهیه کنیم بنابراین، دادههای آموزشی، بجای کلمات، حروف متصل و مجزا و علائم خواهند بود که هر کلمه ازترکیب و کنارهم قرار گرفتن آنها، حاصل میشود.
شیوه نوشتن بر روی پد برای اینکه نرمافزار بتواند تشخیص دهد،چگونه است؟
شرایط خاصی وجود ندارد، همانطور که شما با قلم بر روی کاغذ مینویسید. در واقع از مزایای این نرمافزار نیز همین است که شرایط محدودکنندهای در نحوه نگارش کلمات وجود ندارد.
همراه برخی نرمافزارها، دستورالعملهایی داده میشود که اینطور بنویسید و آنطور ننویسید. اما در این نرمافزار سعی شده است که شرایط محدودکننده، وجود نداشته باشد.
نرمافزار طراحی شده قابلیت پیاده سازی روی چه سیستمهایی را دارد؟
هم روی کامپیوترهای خانگی و هم روی دستگاههای PDA و موبایلها.
آیا این نرمافزار قابلیت سازگاری با گوشیهای موجود در بازار را دارد؟
البته نه روی همه گوشیهای موجود در بازار، اما روی تعدادی از آنها میتواند نصب شود. بستگی به حجم حافظه و سرعت پردازش گوشی دارد.
آیا پروژه شما صرفا در حد طرح مطرح شده است؟
در مراحل تحقیقاتی این پروژه، نتایج خوبی بدست آوردیم، به همین علت مصمم شدیم از طریق همکاری دانشگاه با یک شرکت تجاری، این پروژه را تجاری کنیم.
همانطور که میدانید موفقیت در یک کار تجاری، قواعد خاص خود را دارد و کار تجاری با کار تحقیقاتی در یک محیط آکادمیک متفاوت است.
پونه شیرازی
در تپش این هفته، ماجرای فریب و تعرض در پوشش عرفانهای دروغین و رمالی را بررسی کردیم
گزارش «جامجم» درباره دستاوردهای زبان فارسی در گفتوگو با برخی از چهرههای ادب معاصر
معاون وزیر بهداشت: