در تپش این هفته، ماجرای فریب و تعرض در پوشش عرفانهای دروغین و رمالی را بررسی کردیم
در زبان انسانها ممکن است گاهی کلمهای اشتباه گفته شود و یا فعلی بیان نشود. همچنین ممکن است جابجاییهایی در لغات به وجود آید، اما در همه این موارد ذهن انسان، ترکیب درست را به طور هوشمندانه درک کرده و نتیجهگیری صحیح را از آن خواهد داشت.
اما در زبان رایانه باید کلمات و عبارات به ترتیب مشخص و تعیین شده توسط آن زبان کنار هم چیده شوند تا توسط رایانه درک شوند و کوچکترین اشتباه و جابجایی در آنها غیرقابل چشمپوشی است و منجر به عدم درک مفهوم توسط رایانه خواهد شد. مگر اینکه طراح زبان یکسری انعطافپذیریهای بخصوص، تعیین شده و محدودی را برای آن زبان در نظر گرفته و در کامپایلر آن بگنجاند.
تحلیل معنایی
پیش از این در مورد دو فاز از تحلیل یک برنامه یعنی تحلیل لغوی و نحوی به تفصیل سخن گفتهایم. مرحله بعد از این دو مرحله در کامپایلرها تحلیل معنایی یا Semantic Analyze است. در این فاز برنامه مبدا برای یافتن خطاهای معنایی بررسی و اطلاعات مربوط به نوع دادهها، برای مرحله بعد یعنی مرحله تولید کد جمعآوری میشود.
برای درک بهتر انواع تحلیلها و خطاهای مربوط به هر کدام از این مراحل، برخی جملات فارسی را مثال میزنیم.
جمله «او سیب را خورده است» را در نظر بگیرید. در صورتی که این جمله به صورت «او صیب را خورده است» نوشته شود پیش از هر چیز تحلیلگر لغوی زبان فارسی پس از برخورد به کلمه «صیب» یک خطا اعلام میکند. زیرا چنین کلمهای در زبان فارسی وجود ندارد و باید به شکل «سیب» نوشته شود. حال فرض کنیم در یک جمله هیچگونه اشکال لغوی وجود نداشته باشد.
مثلا «او سیب را خوردهام» فاقد غلط املایی است. اما نحو زبان فاربسی به ما میگوید که برای فاعل «او» نباید از فعل «خوردهام» استفاده شود. بنابراین تحلیلگر نحوی زبان فارسی از این جمله ایراد خواهد گرفت و ما ناچاریم یا کلمه «او» را به «من» و یا فعل «خوردهام» را به «خورده است» تغییر دهیم تا این جمله از نظر نحوی درست باشد، اما حالتی را در نظر بگیرید که جمله به «او میز را خورده است» تغییر کند. این جمله از مراحل تحلیل لغوی و نحوی بدون اشکال خواهد گذشت. اما در مرحله تحلیل معنایی اشکالی به این جمله وارد است. زیرا میز خوردنی نیست.
در مباحث پیشرفته زبان محاوره مبحثی به نام اصطلاح وجود دارد که این مساله در زبانهای برنامهنویسی باب نشده است. به عنوان مثال فرض کنید به جای «او میز را خورده است» بگوییم «او کتاب را خورده است». در حالت معمول، تحلیلگر معنایی زبان فارسی باید این جمله را نیز اشتباه به شمار آورد. اما زمانی که بحث اصطلاح مطرح میشود، آنگاه این جمله صحیح خواهد بود و به معنای آن است که او به محتویات کتاب احاطه کامل دارد و یا جمله «او رایانه را خورده است» به این معنا خواهد بود که او به فنون رایانه کاملا مسلط است که البته کامپایلرها قادر به تشخیص اصطلاحات نیستند.
تشخیص نوع
تشخیص و بررسی نوع یکی از مهمترین مولفههای تحلیل معنایی است که در آن کامپایلر بررسی میکند که هر عملگر، عملوندهایی داشته باشد که از نظر مشخصات زبان مجاز هستند. مثلا بسیاری از زبانهای برنامهسازی به کامپایلری نیازمندند که هر زمان از یک عدد اعشاری به عنوان اندیس یک آرایه به کار برده شد، اعلام خطا کند یا در جای دیگر ممکن است برای اجرای اموری ناچار به تبدیل خودکار انواع به یکدیگر باشد. مثلا در زمان جمع یک عدد صحیح و یک عدد اعشاری نیاز است که عدد صحیح به اعشاری تبدیل شود و سپس با عدد دیگر جمع شود.
کد میانی بعد از تحلیل
بعد از این که سه مرحله تحلیل روی برنامه مبدا انجام شد در بعضی از کامپایلرها یک نمونه جدید از برنامه تحت عنوان کدمیانی تولید میشود که یک نمایش صریح از برنامه مبدا است. در واقع اگر یک ماشین فرضی در نظر بگیریم، این کد برنامهای به زبان آن ماشین خواهد بود.
از خصوصیات این نمایش میانی میتوان به دو مورد مهم اشاره کرد. یکی آنکه بسادگی قابل تولید بوده و دیگر آنکه میتواند براحتی به برنامه نهایی تبدیل شود. یک شکل از این کد میانی، شبیه زبان اسمبلی است و در آن به جای ثباتها، از مکانهای حافظه استفاده میشود. اما در حقیقت با زبان اسمبلی تفاوتهای بسیاری دارد. زیرا همانطور که میدانیم هر دستور زبان اسمبلی معادل یک دستور در زبان ماشین است و میتواند مستقیما به آن دستور تبدیل شود. در صورتی که ممکن است یک خط از کد میانی معادل چندین دستور از زبان ماشین باشد.
بهینهسازی
هنگامی که برنامهای به زبان سطح بالا مینویسیم ممکن است در تبدیل آن به کد میانی، به دستوراتی برسیم که در کنار یکدیگر به یک نتیجه واحد میرسند.
در کد میانی این دستورات میتوانند با یک یا چند دستور معادل همین کد، که از نظر تعداد دستورات و همچنین سرعت اجرا در پردازنده کمتر هستند جایگزین شوند. به این ترتیب میتوان مطمئن بود که برنامه نوشته شده توسط کاربر، با وجود اشکالات منطقی موجود و یا ضعف الگوریتم، با بیشترین سرعت ممکن در ماشین اجرا میشود.
مقدار بهینهسازی در کامپایلرهای مختلف با هم تفاوت دارد به کامپایلرهایی که بیشترین مقدار بهینهسازی را انجام میدهند کامپایلرهای بهینهساز گفته میشود.
در واقع بخش زیادی از زمان کامپایل برنامه در این بخش سپری میشود. البته بهینهسازهای سادهای نیز وجود دارند که بدون کاهش قابل توجه زمان کامپایل به بهینهسازی کد میانی پرداخته و بدین ترتیب سرعت اجرای برنامه مقصد را افزایش میدهند.
کد اسمبلی
در مرحله آخر کامپایل کد میانی بهینه شده به کدهای زبان اسمبلی تبدیل میشود. مهمترین کار در این مرحله تخصیص ثباتهای پردازنده به متغیرهاست. زیرا همان طور که گفتیم در کد میانی همه متغیرها به فضاهای حافظه اصلی نسبت داده میشوند و در تولید کد اسمبلی برای افزایش سرعت عمل باید حتیالامکان از ثباتهای پردازنده به جای خانههای حافظه استفاده کرد. پس از اینکه کد اسمبلی تولید شد، این کد در اختیار اسمبلر قرار داده میشود تا در نهایت برنامه اجرایی تولید شود.
جدول نشانهها
در ابتدای شروع عمل کامپایل و در مرحله تحلیل لغوی برنامه مبدا، جدولی به نام جدول نشانهها یا جدول نمادها (symbol tabie)تشکیل میشود که هر یک از شناسههای تشخیص داده شده در آن ثبت میشود.
این جدول اطلاعات بسیار دیگری را در مورد نشانهها از قبیل محل حافظه، نوع شناسه، محل ظاهر شدن آنها در متن برنامه و ... در بردارد و ممکن است در طول مراحل کامپایل بارها به آن مراجعه شده و از اطلاعات آن استفاده شود و یا ممکن است اطلاعات داخل آن توسط دیگر بخشها تکمیل شود. جدول نشانهها یا نمادها یکی از مهمترین بخشهای یک کامپایلر است که کل عمل کامپایل براساس آن انجام میشود و با استفاده از محتویات آن بخش عمده خطاها تشخیص داده میشود و به برنامهنویس اعلام میشود.
هر کدام از بخشهای کامپایلر به طور سلسله مراتبی با یکدیگر ارتباط داشته و نتایج کار خود را به بخش بعد تحویل میدهند. هیچیک از این بخشها به جز با بخش قبل و بعد از خود ارتباط نداشته و ورودی خروجیهای تحویل گرفته از مراحل مجاور برایشان قابل درک است بخشهایی که به طور مستقیم با تمام مراحل کامپایلر ارتباط مستقیم دارند یکی جدول نمادها و دیگری بخش تشخیص و رسیدگی به خطاهاست. در نهایت بعد از گذر از کل این مراحل، در صورت نبود هیچگونه خطایی، کد ماشین تولید و برنامه اجرایی نهایی حاصل خواهد شد و شما میتوانید حاصل کار خود را مشاهده کنید.
پارسا ستودهنیا
در تپش این هفته، ماجرای فریب و تعرض در پوشش عرفانهای دروغین و رمالی را بررسی کردیم
گزارش «جامجم» درباره دستاوردهای زبان فارسی در گفتوگو با برخی از چهرههای ادب معاصر
معاون وزیر بهداشت: