پوسته‌ای بومی بر هسته‌ای جهانی؟

پوسته‌ای بومی بر هسته‌ای جهانی؟

در ماه‌های اخیر، اکوسیستم فناوری ایران شاهد ظهور پدیده‌ای فراگیر بوده است: تولد قارچ‌گونه‌ چت‌بات‌ها و دستیارهای هوشمند که همگی با پسوند «ایرانی»، «بومی» یا «ملی» خود را به کاربران معرفی می‌کنند. از پلتفرم‌های مستقل گرفته تا ربات‌های تعبیه‌شده در اپلیکیشن‌های پیام‌رسان و وب‌سایت‌های خدماتی، به‌نظر می‌رسد انقلابی در هوش مصنوعی مولد در داخل کشور در حال وقوع است. این ابزارها با وعده درک عمیق زبان فارسی، آگاهی از فرهنگ بومی و ارائه‌ پاسخ‌های دقیق و مرتبط، به‌سرعت در حال جلب توجه کاربران و کسب‌وکارها هستند.
کد خبر: ۱۵۲۱۳۱۵
نویسنده امیرحسین حیدری - گروه کلیک
 
اما پشت این ویترین پر‌زرق‌و‌برق و شعارهای ملی، سؤالی کلیدی وبنیادین ذهن کارشناسان و کاربران کنجکاو را به‌خود مشغول کرده است: ماهیت واقعی این «هوش‌های مصنوعی ایرانی» چیست؟ آیا ما واقعا با مدل‌های زبانی بزرگی (LLM) روبه‌رو هستیم که ازصفر تا صد درداخل کشور طراحی، آموزش و توسعه یافته‌اند، یا با پدیده‌ای پیچیده‌تر مواجهیم؟ این گزارش، با نگاهی عمیق‌تر به زیرساخت فنی و مدل کسب‌وکار این چت‌بات‌ها، تلاش می‌کند تا پرده از این واقعیت بردارد. 
   
کالبدشکافی یک چت‌بات ایرانی
بررسی عملکرد بسیاری از این سرویس‌ها، الگوی مشخصی را آشکار می‌سازد. کاربر سؤالی به زبان فارسی می‌پرسد و در زمانی کوتاه، پاسخی روان، منسجم و اغلب بسیار باکیفیت دریافت می‌کند. این کیفیت پاسخ، که گاهی در پیچیدگی‌های زبانی و استنتاجی با بهترین مدل‌های جهانی برابری می‌کند، اولین سرنخ را به‌دست می‌دهد. یک آزمایش ساده می‌تواند بسیار روشنگر باشد. وقتی از تعداد قابل توجهی از این چت‌بات‌ها سؤالی هویتی مانند «چه‌کسی شما را توسعه داده است؟» پرسیده می‌شود، پاسخ‌ها اغلب یا مبهم هستند («من یک مدل زبانی بزرگ هستم...») یا به‌شکلی مستقیم به شرکت‌های سازنده مدل‌های اصلی مانند OpenAI یا Google اشاره می‌کنند. در موارد دیگر، پاسخی از پیش آماده‌شده و برنامه‌ریزی‌شده مبنی بر ایرانی‌بودن سرویس ارائه می‌شود اما با کمی سماجت و پرسیدن سؤالات فنی‌تر درباره معماری مدل، ناتوانی در ارائه‌ پاسخ دقیق، وابستگی آنها را برملا می‌کند.ساخت یک مدل زبانی بزرگ در مقیاس ChatGPT یا Gemini، یک پروژه‌ی عظیم و فوق‌‌العاده پرهزینه است. ما صحبت از نیاز به دیتاسنتری متشکل از صدها میلیارد کلمه، قدرت پردازشی هزاران واحد GPU پیشرفته برای ماه‌ها و سرمایه‌گذاری صدها میلیون دلاری می‌کنیم. زیرساخت‌ها و سرمایه‌ مورد نیاز برای چنین پروژه‌ای در حال حاضر در اختیار کمتر کشوری در جهان قرار دارد. بنابراین، این فرض که ده‌ها شرکت ایرانی به صورت مستقل موفق به ساخت چنین مدل‌هایی شده‌اند، از نظر فنی و اقتصادی واقع‌بینانه نیست. 
   
API: شاهراه اتصال به غول‌های جهانی
واقعیت این است که اکثریت قریب به اتفاق چت‌بات‌های فارسی‌زبانی که امروز با آنها کار می‌کنیم، در هسته‌ خود از مدل‌های زبانی بزرگ خارجی، عمدتا سری GPT شرکت OpenAI یا مدل‌های قدرتمند دیگری مانند Llama (متعلق به متا) و Gemini (متعلق به گوگل) استفاده می‌کنند. این شرکت‌ها، دسترسی به مدل‌های خود را از طریق یک رابط برنامه‌نویسی کاربردی (API) فراهم می‌کنند. به‌زبان ساده، شرکت‌های ایرانی به‌جای ساختن موتور یک خودروی فوق‌پیشرفته، یک شاسی و بدنه‌ زیبا و سفارشی‌سازی‌شده برای آن طراحی می‌کنند.آنها از طریقAPI، درخواست‌های کاربران فارسی‌زبان را به سرورهای OpenAI یا دیگر غول‌های فناوری ارسال کرده، پاسخ تولید شده توسط آن مدل‌ها را دریافت می‌کنند و پس از پردازش احتمالی، آن را در یک رابط کاربری بومی و به‌نام خود، برای کاربر نمایش می‌دهند. 
   
ارزش افزوده یا صرفا یک واسطه؟
اینجاست که بحث اصلی شکل می‌گیرد. آیا این شرکت‌ها صرفا واسطه‌هایی هستند که از محدودیت‌های موجود برای کسب سود بهره می‌برند یاارزش افزوده‌ واقعی ایجادمی‌کنند؟طرفداران رویکرددوم معتقدنداین سرویس‌هانقش مهمی در «دموکراتیزه‌کردن» دسترسی به هوش مصنوعی در ایران دارند. آنها با ارائه‌ رابط‌های کاربری ساده، پشتیبانی به زبان فارسی و یکپارچه‌سازی این فناوری با سایر پلتفرم‌های داخلی، استفاده از هوش مصنوعی را برای عموم مردم و صنایع ممکن کرده‌اند. 
علاوه براین، برخی از این شرکت‌ها فراترازیک«پوسته»ساده عمل‌می‌کنند.آنها با استفاده ازتکنیک‌هایی‌مانند«Fine-Tuning» (تنظیم دقیق)، مدل‌های اصلی را با استفاده از داده‌های حجیم فارسی(شامل متون ادبی، اخبار، مکالمات و...)مجددا آموزش می‌دهندتادرک مدل ازظرایف فرهنگی وزبان فارسی رابهبود بخشند.این فرآیند باعث می‌شود پاسخ‌ها طبیعی‌تر، مرتبط‌تر و کمتر «ترجمه‌شده» به‌نظر برسند. درواقع، آنها یک مدل جهانی رابرای عملکرد بهتر دریک زمینه‌ محلی،بهینه‌سازی می‌کنند. 
   
خطر وابستگی و چشم‌انداز آینده
با وجود تمام مزایا، این مدل کسب‌وکار خالی از ریسک نیست. وابستگی کامل به سرویس‌های خارجی، اکوسیستم هوش مصنوعی کشور را به‌شدت آسیب‌پذیر می‌کند. هرگونه تغییر در سیاست شرکت‌های ارائه‌دهنده‌ API، افزایش ناگهانی قیمت‌ها یا قطع دسترسی به دلیل تشدید تحریم، می‌تواند در یک شب، کل کسب‌وکار این شرکت‌های ایرانی را فلج کند. از سوی دیگر، این رویکرد می‌تواند ‌به نوعی رخوت در تحقیق و توسعه‌ واقعی منجر شود. وقتی می‌توان با هزینه‌ای به‌مراتب کمتر از هسته‌ آماده‌ خارجی استفاده کرد، انگیزه‌ها برای سرمایه‌گذاری‌های کلان و بلندمدت روی ساخت مدل‌های بومی واقعی کاهش می‌یابد.  البته این به‌معنای نادیده‌گرفتن تلاش‌های اصیل داخلی نیست. پروژه‌هایی مانند مدل زبانی «درنا» یا تلاش‌های پژوهشی در دانشگاه‌ها و مراکز دانش‌بنیان برای ساخت مدل‌های کوچک‌تر و تخصصی فارسی، نشان‌دهنده‌ وجود جریانی است که به‌دنبال استقلال فناورانه در این حوزه است. این تلاش‌ها گرچه کندتر و با چالش‌های بسیار بیشتری روبه‌رو هستند اما پایه‌های یک اکوسیستم پایدار و مستقل را بنا می‌نهند. 
   
آینده فناوری کشور
در نهایت، صحنه‌ چت‌بات‌های ایرانی یک طیف است،نه یک تصویر سیاه و سفید. دریک سوی این طیف، سرویس‌های ساده‌ای قرار دارند که صرفا یک پوسته روی APIهای خارجی هستند. درسوی دیگر، شرکت‌هایی که با تنظیم دقیق و بهینه‌سازی، ارزش افزوده‌ قابل توجهی ایجاد می‌کنند و در نقطه‌ای دورتر، تلاش‌های بنیادی برای ساخت مدل‌های واقعابومی درجریان است. 
برای کاربر نهایی، شاید تفاوت چندانی میان اینها احساس نشود‌؛ آنچه اهمیت دارد، دریافت یک پاسخ دقیق و کارآمد است اما برای آینده‌ فناوری کشور، تمایز میان این رویکردها حیاتی است. استفاده هوشمندانه از فناوری جهانی برای پر‌کردن شکاف‌های فعلی یک استراتژی معقول است اما این استراتژی تنها زمانی موفق خواهد بود که به‌عنوان یک «پل» برای رسیدن به توسعه‌ زیرساخت‌های بومی عمل کند، نه به‌عنوان مقصد نهایی. در غیر این صورت، «هوش مصنوعی ایرانی» برای همیشه در سایه سنگین همتایان جهانی خود باقی خواهد ماند‌؛ یک صدای آشنا با مغزی غریبه. 
newsQrCode
ارسال نظرات در انتظار بررسی: ۰ انتشار یافته: ۰