طراحی نرم‌افزار تشخیص بر خط کلمات فارسی

تو بنویس، من می‌خوانم‌

آیا برایتان جالب نیست که تنها با یک قلم نوری روی پد کامپیوتر شخصی یا موبایلتان با همان سرعتی که می‌شنوید،به فارسی بنوسید و نرم‌افزار هم قادر به تشخیص آنچه نوشته‌اید ، باشد؟ در واقع با به‌کارگیری چنین نرم‌افزاری، کاربران می‌توانند به جای تایپ کلمات از طریق صفحه کلید آنها را با قلم نوری بنویسند و نرم‌افزار، دستنویس نگارش یافته را شناسایی کرده و آن را به قالب‌ تایپ شده در می‌آورد.
کد خبر: ۱۶۶۵۶۴

اگر برایتان داشتن اطلاعاتی راجع به این سیستم جالب توجه است، خوب است بدانید که یکی از محققان دانشگاه امیرکبیر موفق به طراحی آن شده است. جالب آن‌که در بیشتر پروژه‌هایی که پیش از این برای زبان فارسی، انجام گرفته است، تشخیص در سطح حروف مجزا است. ولی در پروژه ذکر شده تشخیص در سطح کلمه انجام می‌شود.

گفتگوی ما را با محمد علی بزرگ‌زاده، دانش آموخته کارشناسی ارشد و مجری این طرح بخوانید.

منظور از نرم‌افزار تشخیص بر خط‌  (online) چیست؟ از سیستم عملکرد  آن برایمان بگوئید ؟

کاری که این نرم‌افزار انجام می‌دهد، بسیار ساده است. کاربر، یک کلمه فارسی را می‌نویسد و نرم‌افزار تشخیص می‌دهدکه کدام کلمه فارسی نوشته شده است. البته این کلمه می‌بایست از قبل در فرهنگ لغات نرم‌افزار تعریف شده باشد، زیرا جستجو تنها روی کلمات موجود در فرهنگ لغات انجام می‌پذیرد.

اساساً تشخیص دستنوشته، یک موضوع  معروف و کاربردی است که مدت‌هاست بر روی آن کار می‌شود. تشخیص دستنوشته، خود به دو دسته برخط (online)  و برون‌خط (offline) تقسیم می‌شود. تفاوت این دو روش در ورودی‌های آنهاست. در تشخیص برخط دستنوشته، کلیه اطلاعات مربوط به جهت حرکت قلم در زمان نگارش موجود است، زیرا ورودی سیستم، توسط یک قلم دیجیتال تهیه می‌شود، اما در روش برون‌خط، ورودی، تصویری اسکن‌شده از یک دستنوشه است  که شامل اطلاعات جهت و ترتیب نگارش نیست. البته هر کدام از این دو روش کاربردهای خاص خود را دارد.

این نرم‌افزار چه خدماتی را به کاربر ارائه می‌دهد؟

این نرم‌افزار، در حقیقت کاربر را از تایپ کردن بی‌نیاز می‌کند. خیلی از افراد، سریع‌تر می‌نویسند و کندتر تایپ می‌کنند بنابراین این نرم‌افزار می‌تواند به آنها کمک نماید تا در وقت صرفه‌جویی کنند. نکته دیگر این که امروزه کامپیوترها خیلی کوچک شده‌اند. آنقدر کوچک که برای صفحه‌کلید فضای مناسبی وجود ندارد. مثلاً دستگاه‌های PDA یا موبایل‌ها را در نظر بگیرید. در این دستگاه‌ها، یا تعداد کلیدها کم است و کاربر مجبور است برای تایپ یک حرف یک کلید را چند بار بزند و یا این‌که کلیدها آنقدر کوچک هستند که تایپ کردن با آنها سخت است. به همین علت است که در مدل‌های جدید این دستگاه‌ها، صفحه نمایش به تماس انگشت کاربر و یا قلم حساس است و می‌توان با قلم بر روی آن نوشت. در حال حاضر، تعداد زیادی از این دستگا‌ه‌ها، قابلیت تشخیص حروف یا کلمات دستنوشته انگلیسی را دارند. البته دقت تشخیص، در همه آنها یکسان نیست.

از چه زمانی موارد مشابه این نرم‌افزار در دنیا مورد استفاده قرار گرفته است؟

اولین سیستم‌ها، حروف چاپی را تشخیص می‌دادند. می‌توانم بگویم حتی قبل از این‌که کامپیوتر اختراع شود. اولین اختراع‌های ثبت‌شده در این زمینه مربوط به سال‌های 1929 و 1933 هستند. در آن سال‌ها از یک فناوری اپتومکانیکی برای تشخیص حروف استفاده می‌شد به این صورت که ماسک‌های مکانیکی مختلفی از مقابل تصویر حرف عبور می‌کردند  و نور از یک سو به آن تابانده می‌شد و از سوی دیگر توسط یک آشکارساز نوری دریافت می‌گردید. وقتی یک انطباق کامل صورت می‌گرفت، نور به آشکارساز می‌رسید و حرف ورودی بازشناسی می‌شد.
با اختراع کامپیوتر و عمدتاً از دهه 50 میلادی به بعد کارهای فراوانی انجام گرفته است. هم در زمینه تشخیص حروف چاپی و هم حروف دستنویس و هم کلمات چاپی و دستنویس. تحقیقات بر روی تشخیص دستنوشته‌ زبان‌های فارسی و عربی نیز بیش از 20 سال قدمت دارد اما باید در نظر داشته باشید که هیچ‌کدام از سیستم‌ها دقت صد درصد ندارند. بنابراین، این مسأله به هیچ‌وجه حل‌شده تلقی نمی‌شود و همواره می‌توان سرعت و دقت شناسایی را افزایش داد.

سیستم طراحی شده چطور کلمات فارسی را تشخیص می‌دهد؟

از آنجایی که این سیستم، قرار است به مرحله تجاری برسد، من در جواب دادن به این سوال، دارای محدودیت‌هایی هستم. اما می‌توانم بگویم در این سیستم نیز مانند تعدادی از سیستم‌های مشابه، از طریق مقایسه اجزاء کلمه با دستنوشته‌های دیگری که به داده‌های آموزشی موسوم است، یک کلمه تشخیص داده می‌شود. اهمیت فراوان دارد که داده‌های آموزشی از افراد مختلف با دستخط‌‌های متنوع، تهیه شده باشد.  هرچه این داده‌های آموزشی جامع‌تر باشد، شناسایی نیز دقیق‌تر خواهد بود. تعداد کلمات فارسی، خیلی زیاد است و مسلم است که نمی‌توانیم برای کلیه کلمات فارسی، داده آموزشی تهیه کنیم بنابراین، داده‌های آموزشی، بجای کلمات، حروف متصل و مجزا و علائم خواهند بود که هر کلمه ازترکیب و کنارهم قرار گرفتن آنها، حاصل می‌شود.

شیوه نوشتن بر روی پد برای این‌که نرم‌افزار بتواند تشخیص دهد،چگونه است؟

شرایط خاصی وجود ندارد، همانطور که شما با قلم بر روی کاغذ می‌نویسید. در واقع از مزایای این نرم‌افزار نیز همین است که شرایط محدود‌کننده‌ای در نحوه نگارش کلمات وجود ندارد.

همراه برخی نرم‌افزارها، دستورالعمل‌هایی داده می‌شود که اینطور بنویسید و آنطور ننویسید. اما در این نرم‌افزار سعی شده است که شرایط محدودکننده، وجود نداشته باشد.

نرم‌افزار طراحی شده قابلیت پیاده سازی روی چه سیستم‌هایی را دارد؟

هم روی کامپیوترهای خانگی و هم روی دستگاه‌های PDA و موبایل‌ها.

آیا این نرم‌افزار قابلیت سازگاری با گوشی‌های موجود در بازار را دارد؟

البته نه روی همه گوشی‌های موجود در بازار، اما روی تعدادی از آنها می‌تواند نصب شود. بستگی به حجم حافظه و سرعت پردازش گوشی دارد.

آیا پروژه شما صرفا در حد طرح مطرح شده است؟

در مراحل تحقیقاتی این پروژه، نتایج خوبی بدست آوردیم، به همین علت مصمم شدیم از طریق همکاری دانشگاه با یک شرکت تجاری، این پروژه را تجاری کنیم.

همانطور که می‌دانید موفقیت در یک کار تجاری، قواعد خاص خود را دارد و کار تجاری با کار تحقیقاتی در یک محیط آکادمیک متفاوت است.

پونه شیرازی

newsQrCode
ارسال نظرات در انتظار بررسی: ۰ انتشار یافته: ۰

نیازمندی ها