سرقت چهل‌وپنج گیگابایتی

افشای نزدیک به 45گیگابایت فایل کد منبع ــ که گفته می‌شود توسط یک کارمند سابق به سرقت رفته ــ زیربنای بسیاری از برنامه‌ها و خدمات غول فناوری روسی یاندکس را آشکار کرده است. همچنین فاکتورهای کلیدی رتبه‌بندی موتور جست‌وجوی یاندکس را فاش کرد که تقریبا هرگز در معرض دید عموم قرار نگرفته بود. منابع گیت یاندکس به‌عنوان یک فایل تورنت در 25ژانویه پست شد و فایل‌هایی را نشان می‌دهد که ظاهرا در ژوئیه ۲۰۲ گرفته شده‌اند و زمان اصلی آنها به فوریه ۲۰۲۲ برمی‌گردد.
کد خبر: ۱۳۹۶۹۰۳
نویسنده رضا حسین‌زاده - روزنامه‌نگار
مهندس نرم‌افزار آرسنلی ژستاکوف ادعا می‌کند کارمندان فعلی و سابق یاندکس تأیید کرده‌اند برخی از آرشیوها حتما حاوی کد منبع مدرن خدماتی این شرکت است. پیاندکس به وبلاگ امنیتی بلیپینگ کامپیوتر گفت یاندکس هک نشده است و این نشت از یک کارمند سابق بوده است. یاندکس اعلام کرد هیچ تهدیدی برای داده‌های کاربران یا عملکرد پلتفرم مشاهده نکرده است.
این پرونده‌ها به‌ویژه به فوریه ۲۰۲۲ مربوط می‌شوند، زمانی که روسیه تهاجم تمام عیار به اوکراین را آغاز کرد. یکی از مدیران سابق یاندکس به بلیپینگ کامپیوتر گفت: این افشاگری سیاسی است و خاطرنشان کرد کارمند سابق سعی نکرده کد را به رقبای یاندکس بفروشد و کد ضد هرزنامه نیز فاش نشده است.
گرچه مشخص نیست که پیامدهای امنیتی یا ساختاری افشای کد منبع یاندکس چه چیزهایی هستند، نشت 1922 فاکتور رتبه‌بندی در الگوریتم جست‌وجوی یاندکس مطمئنا موج بزرگی را درست می‌کند. مارتین مک دونالد، مشاور سئو در توییتر خود این هک را به عنوان احتمالا جالب‌ترین اتفاقی که در سال‌های اخیر در سئو رخ داده است، توصیف کرد. همان‌طور که توسط وبسایت مشهور سرچ انجین لند هم به این نکته اشاره شده است. محقق الکس بوراکس هم می‌گوید اطلاعات مفید زیادی برای سئو گوگل نیز وجود دارد. یاندکس، موتور جست‌وجوی رتبه چهارم از نظر حجم، ظاهرا چند کارمند سابق گوگل را استخدام کرده است. یاندکس بسیاری از فاکتورهای رتبه‌بندی گوگل را که در کد آن قابل شناسایی هستند، ردیابی  و به‌شدت با گوگل در این حوزه رقابت می‌کند. بخش روسیه گوگل به‌تازگی پس از انحلال حساب‌های بانکی و خدمات پرداخت خود، اعلام ورشکستگی کرده است. بوراکس خاطرنشان می‌کند اولین عامل در فهرست فاکتورهای رتبه‌بندی یاندکس، رتبه صفحه است که ظاهرا به الگوریتم اساسی ایجاد شده توسط بنیان‌گذاران گوگل گره خورده است.
همان‌طور که توسط بوراکس توضیح داده شده، موتور یاندکس صفحاتی را ترجیح می‌دهد که:
 خیلی قدیمی نیستند.
 ترافیک ارگانیک زیادی داشته باشند (بازدیدکنندگان منحصر به فرد) و ترافیک جست‌وجو محور کمتری داشته باشند.
 اعداد و اسلش‌های کمتری در URL خود داشته باشند.
 کد بهینه سازی شده داشته باشند.
 روی سرورهای قابل اعتماد میزبانی می‌شوند.
 صفحات ویکی‌پدیا هستند یا از ویکی‌پدیا پیوند دارند.
 از صفحات سطح بالاتر در یک دامنه میزبانی یا پیوند داده شده‌اند.
 کلمات کلیدی در URL خود داشته باشند.
اگر متخصص سئو هستید، می‌تواند همه عوامل را در ابزار جست‌وجوی کامپایل شده Rob Ousbey یافته و کلیک کنید. نزدیک به 1000 فاکتور رتبه‌بندی دارای برچسب TG_DEPRECATED هست و بیش از 200 مورد به‌عنوان TG_UNUSED فهرست شده‌اند.
از آنجا که کد مربوط به فوریه ۲۰۲۲ است و در جولای ۲۰۲۲ دریافت شده، جست‌وجوی یاندکس مطمئنا از آن زمان تغییر کرده است اما این نشت نگاهی نادر به نحوه جمع‌آوری رتبه‌بندی‌های جست‌وجو در سایتی دارد که به یکی از بزرگ‌ترین کشورهای جهان خدمات ارائه می‌دهد.  قبلا در سال ۲۰۱۵ یک کارمند سابق سعی کرد کد موتور جست‌وجوی را در بازار سیاه به قیمت ۲۸هزار دلار بفروشد. این رقم به‌طور شگفت‌آوری برای کد اصلی محصول اصلی یاندکس پایین بود. آن کارمند به دو سال حبس تعلیقی محکوم شد و این کد هرگز علنی نشد.

منبع: ضمیمه کلیک روزنامه جام‌جم
newsQrCode
ارسال نظرات در انتظار بررسی: ۰ انتشار یافته: ۰

نیازمندی ها