در تپش این هفته، ماجرای فریب و تعرض در پوشش عرفانهای دروغین و رمالی را بررسی کردیم
ترجمه بدون دخالت انسان
مترجم گوگل کار خود را سال 1380 و فقط با 9 زبان آغاز کرد. این مترجم مبتنی بر نرمافزاری بود که توسط شرکت آی.بی.ام طراحی شده بود و در آن واژگان متن مبدا استخراج و در قالب دستوری خاصی به زبان مقصد ترجمه میشد. اما از پاییز 1386 کارشناسان گوگل به این نتیجه رسیدند که بهتر است از رویکردی دیگر برای ترجمه استفاده کنند. آنها به این نتیجه رسیدند که رویکرد استخراج داده (یعنی جستجو در میان محتوای متنی موجود در اینترنت برای ترجمه) بهترین شیوه برای کار است. در واقع مترجم گوگل اصلا کاری به معنای کلمات ندارد. وقتی جملهای را به مترجم گوگل میدهیم، این نرم افزار با بهرهگیری از توان بالای محاسباتی خود، در میان میلیونها متن مختلف ترجمه شده خود جستجو کرده تا بتواند جملهای مشابه جمله ما را بیابد. مترجم گوگل از یک بانک داده بسیار گسترده که شامل میلیونها متن ترجمه شده به زبانهای مختلف است بهره میبرد. این اسناد شامل تمام اسناد رسمی منتشر شده اتحادیه اروپا از از بدو تاسیس تاکنون به زبانهای مختلف این اتحادیه است. تمام اسنادی که سازمان ملل متحد به شش زبان رسمی خود (انگلیسی، فرانسوی، اسپانیایی، روسی، عربی و چینی) منتشر کرده نیز در این بانک داده جای دارند. تعداد بسیار زیادی از متون مختلف از جمله کتابها، مقالات و گزارشهای دو زبانهای که توسط موسسات آموزشی و پژوهشی و نیز افراد علاقهمند در اختیار گوگل قرار گرفته است از دیگر منابع مورد اتکای گوگل برای ترجمه است. در واقع ترجمه ارائه شده گوگل حاصل کار هزاران مترجمی است که پیش از آن، متونی را برای مقاصدی خاص ترجمه کرده بودند. گوگل در میان فایلهای متنی جستجو میکند تا الگویی مشابه الگوی جمله وارد شده ما بیابد. از آنجا که ممکن است چند متن مشابه در میان این بانک داده پیدا شود، مترجم گوگل از روشهای آماری برای تعیین بهترین ترجمه ممکن استفاده میکند.
مترجم گوگل ابتدا زبانهای رایجتر و پرگویشتر (همچون انگلیسی، فرانسوی، اسپانیایی و آلمانی) را در فهرست زبانهای خود داشت. اما کمکم بر تعداد زبانها افزوده شد. به طوری که تا امروز 72 زبان در فهرست زبانهای قابل قبول مترجم گوگل قرار دارد.
در حال حاضر ترجمه انجام شده توسط مترجم گوگل میان زبانهای پرگویش (برای نمونه اسپانیایی به انگلیسی) از کیفیت قابل قبولی برخوردار است، زیرا انبوهی از متون ترجمه شده اسپانیایی به انگلیسی را در اختیار دارد. اما بیایید ترجمه بین دو زبان کمگویش (همچون ویتنامی به فارسی یا فارسی به اکراینی) را در نظر بگیرید. گوگل برای ترجمه از یک زبان به زبانی دیگر به متون دو زبانه خود مراجعه میکند تا جملاتی مشابه جمله وارد شده را بیابد. اما مگر چند سند متنی فارسی به ویتنامی در دنیا وجود دارد؟ یا چند رمان و داستان فارسی به ویتنامی ترجمه شده تا گوگل بخواهد از آن استفاده کند؟
زبانهای واسطه
گوگل برای حل مشکل ترجمه در زبانهایی که برای آنها اسناد دو زبانه کافی وجود ندارد، سراغ زبانهای واسطه (intermediary languages) میرود. از آنجا که زبان رسمی گوگل انگلیسی است و اینکه برای هر زبانی، متون دو زبانه که یک طرف آن انگلیسی باشد بیشتر از سایر متون دو زبانه یافت میشود، از انگلیسی به عنوان «زبان واسطه» استفاده میشود. وقتی متنی به زبان ویتنامی را به مترجم گوگل میدهیم و میخواهیم آن را به فارسی ترجمه کند، گوگل ابتدا در میان اسناد ویتنامی به انگلیسی خود جستجو کرده و متن را به انگلیسی ترجمه میکند. در مرحله بعد این جستجو در میان اسناد انگلیسی به فارسی صورت گرفته و متن به زبان درخواستی یعنی فارسی ترجمه میشود. شاید بیسر و ته بودن بسیاری از جملات ترجمه شده از یک زبان به فارسی به همین دلیل است. از آنجا که هر زبان از ظرافتهای خاصی برخوردار است، ترجمه یک متن به زبان واسطه و سپس ترجمه آن به زبان مقصد باعث کاهش شدید دقت مورد نیاز میشود.
به طور کلی چون تعداد اسناد متنی دوزبانه گوگل، از زبانهای پرگویش به فارسی و برعکس نیز محدود است، شاهد هستیم این ترجمهها دقت و کیفیت پایینی دارند.
شاید بتوان تنها راه برای افزایش این دقت را در گسترش بانک داده گوگل جست. به همین دلیل است که گوگل این امکان را به کاربران خود میدهد تا متونی که توسط مترجم انسانی ترجمه شده را بر روی سرور این شرکت آپلود کند تا سرویس مترجم گوگل بتواند از آن برای ترجمههای بعدی خود بهره ببرد.
آینده ترجمه ماشینی
زبان همواره یکی از پیچیدهترین پدیدههای بشری بوده است. یکی از ویژگیهای جالب زبان طبیعی انسان را باید در زنده بودن آن جست. زنده بودن یک زبان به این معناست که تحت تاثیر عوامل مختلف طی زمان به طور پیوسته دستخوش تغییراتی میگردد. تا همین چند دهه گذشته، بسیاری از دانشمندان بر این باور بودند که ترجمه ماشینی به هیچ وجه نمیتواند جایگزین ترجمه انسانی شود. اما تجربیات چند سال اخیر نشان میدهد با وجود فاصله کیفیت ترجمه ماشینی با ترجمه انسانی، کیفیت این نوع ترجمه بشدت افزایش یافته است. با اینکه هنوز تا نقطه ایدهآل در کیفیت ترجمه فاصله زیادی داریم، اما با روند فعلی پیشرفت ترجمه خودکار، شاید در آیندهای نه چندان دور شاهد جایگزینی آن به جای شکلهای سنتی ترجمه انسانی باشیم.
صالح سپهریفر
در تپش این هفته، ماجرای فریب و تعرض در پوشش عرفانهای دروغین و رمالی را بررسی کردیم
گزارش «جامجم» درباره دستاوردهای زبان فارسی در گفتوگو با برخی از چهرههای ادب معاصر
معاون وزیر بهداشت: