برتری معماری تراشه GF 100 در گرافیک فرمی انویدیا

اوج واقع گرایی

جدیدترین نسل واحدهای پردازنده گرافیکی (GPU) انویدیا، دارای معماری GF 100 و فناوری فرمی (Fermi)، در یکی از پرحاشیه‌ترین برهه‌های زمانی تاریخ این شرکت و از میان دوره‌ای همراه با حوادث و اتفاقات تلخ و شیرین از زمان اولین GPU قابل برنامه‌ریزی یعنی سری 5800، به ما رسیده‌اند. درست مانند کارت گرافیک سری GeForce 280 GTX که به‌تازگی از مقبولیتی بسیار در میان کاربران و بازی‌خورها برخوردار است. سری فعلی تراشه‌های GF 100 (که فعلا با این اسم رمز نامیده می‌شود اما این نام نهایی آن نیست)، معرف بیشتر گرافیک‌هایی است که در مورد معماری آنها از بیخ‌وبن تجدید نظر و بازنگری به‌عمل آمده است. همچنین آن ‌را می‌توان اولین نمونه پردازشگرهای گرافیکی معرف معماری فرمی دانست.
کد خبر: ۳۲۴۳۲۳

مقایسه سخت‌افزار کارت‌های گرافیکی

GTX 470/480 با رادئون HD 5870

فناوری سخت‌افزاری این کارت‌های گرافیکی با تعداد بیش از 3بیلیون ترانزیستور، از نوع 40نانومتری بوده درحالی‌که کارت‌های رادئون HD5870 AMD با 15/2بیلیون ترانزیستور دارای فناوری تولید 40نانومتری هستند. این فناوری روی بلوک سیلیکونی(دای) 334میلی‌متر مربعی قرار دارد در حالیکه دای تراشه GF 100 نزدیک به 500میلی‌متر مربع است که آن‌را در ردیف تراشه‌های بزرگ قرار می‌دهد.

به‌خاطر مسائل گرما و انرژی تنها 480هسته درGTX 480 فعال شده است که همه این هسته‌ها شامل هسته‌های کودا نیست و GTX 470 فقط 448هسته محاسباتی فعال دارد.

گذشته از تعداد ترانزیستور و هسته محاسباتی، حداکثر تعداد واحدهای بافت و موتورهای ROP سری جدید کارت‌های انویدیا، به‌مراتب بیشتر از رادئون HD 5870 ATI است. حداکثر طراحی حرارتی کارت‌های انویدیا 250وات است که 65وات فراتر از مقدار طراحی حرارتی رادئون HD 5870 است. پاور PSU پیشنهادی برای GTX 470، 550وات و برای GTX 480، 600وات است. در حال حاظر GTX 480 بهترین کارآیی را در میان کارت‌های گرافیکی تک GPU دارد.

ساختار فیزیکی معماری تراشه GF 100

تراشه فرمی انویدیا یکی از بزرگترین تراشه‌هایی است که تاکنون تولید شده و تمام قسمت‌ها و جوانب آن حکایت از آمادگی‌اش برای پشتیبانی از افزایش اسب بخاری با قدرت GPU و همزمان مقادیر بیشتری از حافظه نهان آنبورد را دارد. طراحیGF 100 بخش‌بندی شده و متشکل از رده‌هایی با مقیاس‌های گوناگون از لحاظ معماری است.

به‌طور مثال، در زمخت‌ترین رده از سطوح آن، خوشه‌های پردازش گرافیکی (GPC) دیده می‌شود. تراشه در بردارنده 4عدد از آنها است که هر یک، از مجموعه‌ای از اجزای مقیاس‌بندی شده دیگری ساخته شده است که به‌وسیله 6تنظیم‌کننده حافظه 64بیتی GDDR5 احاطه شده‌اند و محصول آنها یک رابط حافظه 384بیتی است. نمونه‌های نخستین این تراشه‌ها، 512واحد منطقی‌محاسباتی دارند که هسته‌های کودا (CUDA) نامیده می‌شوند. هسته‌های پردازشگر کودا (هسته‌های متحد سایه‌زنی)، 16واحد هندسی، 4واحد محل تصویر، 64واحد بافت و 48موتور ROP دارند که خاصیت پشتیبانی کامل از دایرکت‌ایکس11 را دارا بوده و متصل‌کننده همه جی‌پی‌سی‌ها یک حافظه نهان L2 مشترک 768کیلوبایتی است.

برخلاف حافظه نهان 256کیلوبایتی GTX 285 که برای ذخیره‌سازی سریع اطلاعات بافت کاربرد دارد، حافظه نهان L2 درGF 100 یک حافظه بازخوانی‌ـ‌بازنویسی کامل است که بازنویسی منسجم منطقی همه قالب‌های داده را برای حافظه نهان میسر می‌سازد.

یک الگوریتم (محاسبه عددی)، مدیریت می‌کند که داده برای چه مدت باید در L2 بماند. موتور گیگانخی (GigaThread) واکشی‌های داده از حافظه اصلی را مدیریت کرده و عمل تغذیه بافر قاب تصاویر را انجام می‌دهد. همچنین مسوول ایجاد و ارسال بلوک‌های حاوی وظایف مقرر اجرایی نخ‌های (هسته‌های) خود GPU است.

پردازنده‌های متعدد جاری‌ساز

شما می‌توانید GPC را یک نوع مینیGPU تودرتوی داخل خودش تصور کنید. هرGPC متشکل از یک مجموعه 4عددی از جاری‌ساز (SM) به‌اضافه یک موتور واحد محل تصویر بوده و به اجزای اس‌ام‌های پردازنده‌های متعدد تقسیم می‌شود، که در نهایت بلوک‌های بزرگ نخ را گرفته و آن‌ها را به گروه‌های 32نخی به‌نام Wrap و به واحدهای زیرین گوناگون اجرایی اختصاص می‌دهند. این 32‌هسته محاسباتی داخل هر SM نیز هسته‌های کودا نام دارند که به‌شکل نردبان‌های عددی هستند.

هر نخ عبارت است از یک عدد صحیح ALU با خط لوله‌ای درونی با ممیز شناور. هر SM 64کیلوبایت حافظه مشترک قابل پیکربندی چابک بی‌درنگ به‌عنوان 48کیلوبایت حافظه مشترک یا 16کیلوبایت حافظه نهان L1 یا 16کیلوبایت حافظه مشترک و 48کیلوبایت از هر یک از حافظه‌های نهان L1 دارد.

برای گرافیک پیکربندی، 16کیلوبایت حافظه نهان L1 کاربرد دارد. همچنین 4واحد قابلیت مخصوص SFU به‌صورت درون‌ساخت داخل SM با دستورالعمل‌های عجیب‌وغریب سر و کار دارند که به نخ‌های کودا وابسته نیستند و زمان‌بندی آن قادر است تا در حالت مشغول بودن یک SFU ویژه به واحدهای اجرایی دیگر اعزام کند.

*کارآیی معماری GF 100

کارآیی پایه معماری لایه‌های گرافیکی فرمی روی ستون‌های یک موتور قدرتمند محاسبات موازی استوار است. همچنان‌که محاسبات داده‌ای بر اساس GPU روزبه‌روز پراهمیت‌تر جلوه می‌کند، بنا نهادن یک معماری (که این خود نیز آن‌ها را هر چه بیشتر منطبق با مقاصد و مصارف عادی و عمومی می‌سازد ) در مورد هر دو بازی‌های رایانه‌ای و رده‌های مشخصی از برنامه‌های کاربردی واسط، دارای درجه بالایی از اهمیت است.

اگر چه موتور پردازشی محاسباتی GF 100 یک حافظه نهان کامل بازخوانی و بازنویسی داده L2 دارای برخی از قابلیت‌های پردازنده گونه را ارائه دهد، اما این به آن معنا نیست که فرمی سعی دارد تا دقیقا قابلیت‌ها و توانایی‌های یک پردازنده را کسب کند. چرا که در مورد آنها هیچ‌گونه زمینه‌سازی و تدارکی برای اجرای اموری مشابه تفکر و اندیشیدن وجود ندارد. زیرا شما در یک ماشین با خاصیت موازی، انجام امور متفکرانه را نمی‌خواهید. آنها در طراحی معماری GF 100 و تولید کارت‌های گرافیکی سری GTX 270/280 هدف‌های دیگری را دنبال می‌کنند.

مزایا و اهداف طراحی و معماری GF 100

1ـ واقع‌گرایی هندسی1

درحالی‌که دایرکت‌ایکس 8، 9 و 10 مراحل پیشرفت خود را طی می‌کردند، واحدهای پردازشگر گرافیکی، گام‌های بسیار عظیم و بلندی را در حد 150برابر اولین نسل GPU، با قابلیت برنامه‌نویسی در سایه‌زنی پیکسل‌ها2 و کارآیی‌های مربوط به خلق بافت و تاروپود برداشتند. در همین حال و در طی زمانی مشابه، رشد واقع‌گرایی هندسی گرافیکی آن‌ها نیز سه برابر شد.

2ـ کیفیت تصویر عالی و بی‌رقیب

GF 100 حرکت خوبی را در راستای تعدد نمونه‌برداری آنتی‌الایزینگ با کاربرد ترسیم خطوط و تجسم اشکال سه‌بعدی هندسی انجام داده که باعث بهبود و پیشرفت در ارائه پوشش نمونه آنتی‌الایزینگ3 شده است. این فناوری با اجازه دادن به 32واحد نمونه‌برداری CSAA، برای رسیدن به مراحل قابل ملاحظه‌ای از پیشرفت و آنتی‌الایزینگ در زمینه بهبود و شفافیت تصاویر، بسیار موفق بوده است.

غول‌آسا کردن محاسبات برای بازی‌های رایانه‌ای

افزون‌بر پیشرفت کارآیی، جلوه‌های ویژه پس‌پردازشی (جلوه‌هایی مانند موشن‌بلور، عمق و ژرفای میدان)، سرعت و شتاب فیزیکی نیرومندتری را ارائه می‌دهد. همچنین با وزین ساختن AI، پردازشگرهای گرافیکی امروزی، قابلیت‌هایی که در گذشته اختصاصا مربوط به پردازنده‌ها بودند و صرفا در اختیار و در حیطه عملکرد آنها قرار داشتند را به‌دست آورده‌اند.

جواد ودودزاده

منابع

http://www.nvidia.com

http://www.hotharware.com

http://www.dailytechnews.com

پی‌نوشت‌ها

1. Geometric Realism

2. Pixel Shader

3. Coverage Sample Anti-Aliasingmaximum: CSAA

newsQrCode
ارسال نظرات در انتظار بررسی: ۰ انتشار یافته: ۰

نیازمندی ها