ترجمه مقاله معماری مسیریابی با انرژی کارآمد برای شبکه های بیسیم درون تراشه
معماری مسیریابی با انرژی کارآمد برای شبکه های بیسیم درون تراشه
Power Efficient Router Architecture for Wireless Network-on-Chip
چکیده
شبکه های بیسیم درون تراشه ای (WNoCs) یکی از راه کارهای امیدبخش برای غلبه بر محدودیت های شبکه های درون تراشه ای مرسوم (NoCs) در ارتباطات دوربرد در پردازنده های چندهسته ای آینده است. جزییات به کارگیری NoC با واسط های بیسیم (WIs) موجب بیشتر شدن مزایای آنها می شود. اما در وضعیت عادی مصرف ایستای توان در مولفه های WI و مسیریاب ها ، خیلی زیاد است. می توان مصرف توان را با خاموش کردن مسیریاب های کم مصرف تر یا بی مصرف ، به صورت انتخابی، کاهش داد. بعلاوه در WNoC هایی که دارای آنتن هایی با توانایی بردکست، فقط یک ارتباط بیسیم فعال مجاز است و بسیاری از WI ها برای مدت زیادی بی استفاده می مانند و توان ایستایی را هدر می دهند. ما برای اجتناب از این مورد معماری مسیریاب هایی با انرژی کارآمد را به صورت دقیق (FGRA) برای به حداقل رساندن مصرف توان ارائه کرده ایم. همچنین تاخیر بیداری را با استفاده از روشی برای بیدار کردن گیرنده- فرستنده ای که دارای محدودیت توان است ، درهنگامی که سیگنالی در آنتن گیرنده تشخیص داده شود به حداقل رسانده ایم. همچنین یک کانال گذرگاه نامسدود (NBBC) را برای گذر دادن مسیریاب هایی با توان محدود و نیز به حداقل رساندن تاخیر مسیریابی و اختلافات پیشنهاد کرده ایم.
ما طرح مسیریابی پیشنهادی خود را در حضور الگوهای ترافیکی واقعی و ترکیبی ارزیابی کرده ایم. FGRA توان را تا حدود 88.76% (در هر مسیریابی اصلی) و 62.5% (در هر WI) توان ایستا را در مقایسه با معماری رایج با سربار منطقه ای 2.42% ذخیره می کند. بر مبنای مورد استفاده FGRA نیز مصرف کلی توان شبکه را به صورت متوسط به میزان 37.2% با کاهش کارآیی قابل اغماض، کاهش داده ایم. موارد مد نظر در طراحی برای تقویت NoCs های موجود با این مسیریاب ها که قدرت محدودی دارند و سربار آنها نیز ارائه شده است.
کلمات کلیدی
محدود کردن توان ، شبکه بیسیم درون تراشه ای، ارتباطات درون تراشه ای با انرژی کارآمد، طراحی کم توان
سفارش ترجمه تخصصی مهندسی کامپیوتر
- مقدمه
استفاده از زیرساخت های ارتباطی مبتنی بر شبکه های درون تراشه ای (NoC) موجب یکپارچگی زیادی در سیسم های چند هسته ای درون تراشه ای (SoCs) شده است. با این حال NoC ها مزایایی دارند ، محدودیت کارآیی NoC های قدیمی مربوط به اتصالات فلزی مسطح بود که در آن انتقال داده ها بین دو بلوک جداگانه موجب تاخیر و مصرف زیاد انرژی می شود.
روشهای جدیدی نظیر 3D NoC، Photonic NoC و اتصالات چندباندی برای حل این مشکل پیشنهاد شده اند. با این حال که این روشهای جدید NoC ها را از نظر توان و تاخیر، کارامد تر می کنند اما چالش هایی نیز دارند که مهم ترین آنها ناسازگاری با پردازنده های CMOS کنونی است. تحقیقات اخیر درمورد ویژگی های آنتنهای سیلیکونی یکپارچه درون تراشه ها در محدوده فرکانسی موج میلی متری ، نشان داده است که آنها تکنولوژی مناسب و کارآمدی برای ارتباط با مسافت های طولانی هستند. با توجه به مزایای طراحی گیرنده-فرستنده های موج میلی متری، معماری های NoC بیسیم زیادی با بهینه سازی های مختلف کارآیی و سربار، ارائه شدند که همه آنها از توپولوژی سیمی معمولی با واسط بیسیم (WI) کمک می گرفتند. WI ها در ابتدا برای ارتباطات دوربرد و برای کاهش ارتباطات چندگامی استفاده می شدند. معماری WNoC و مسیریاب مربوط به WI ها در شکل 1 نشان داده شده است. برخی از این مسیریاب های WNoC توسط WI ها ارتقا یافته اند تا توانایی ارتباط بیسیم درون تراشه ای (روتر ترکیبی (HR) در شکل) را داشته باشند. HR علاوه بر مولفه های مسیریاب سنتی (مسیریاب پایه (BR) در شکل) از بافرهای serializer/deserializer ، گیرنده یا فرستنده (امپلی فایر کم نویز (LNA) ، ایجاد کننده ماژول یا حذف کننده آن ، آمپلی فایر توان (PA)) ، آنتن گیرنده و فرستنده و غیره تشکیل شده است. مطالعات نشان می دهد که مصرف توان مسیریاب NoC حدود 40% کمتر از مسیریاب است. مصرف توان ایستا (SPC) در تخصیص دهنده کانال مجازی (VCA) ، رشته های افقی (Xbar) و کانال های مجازی (VC) نسبتا بالاست و 99.21% کل توان ایستای روتر را مصرف می کند. تحلیل WI با توجه به مولفه ها نشان می دهد که LNA و PA مصرف توان ایستای بالایی دارند. با افزایش سایز و تعداد WI ها، میزان اتلاف توان ایستا در روتر های بلا استفاده یا روترهایی که کاربرد کمی دارند نیز افزایش می یابد. این روترها در هیچ عملیات مفیدی شرکت ندارند. برای غلبه بر مشکل طراحی SoC هایی با انرژی کارآمد، نیاز به معرفی متدهای ذخیره توان در مسیریاب ها و مولفه های WI می باشد
ما به منظور بهبود کارآمدی انرژی ارتباطات درون تراشه ای و ذخیره توان ، مولفه های مسیریاب WNoC را همراه با توضیحات جزیی ارائه کرده ایم. یک کنترلر مدیریت توان توزیع شده برای کنترل وضعیت های ON/OFF پیشنهاد شده است. اکثر معماری های WNoC موجود از آنتن هایی استفاده می کنند که می توانند با استفاده از یک کانال فرکانسی با سایر آنتن های درون تراشه ای ارتباط برقرار کنند. این موجب محدودیت تعداد ارتباطات فعال در هر نمونه شده و سایر WI ها بیکار می مانند. با توجه به این، ذخیره انرژی در مولفه هایی که دارای محدودیت قدرت اند ، کافی است. بعلاوه در این گام ، داده های ارسال شده توسط همه WI ها دریافت شده و باید بررسی شود که این داده ها مربوط به کدام WI است. که این خود موجب مصرف زمان و توان می شود چرا که LAN وارد وضعیت فعال میشود تا سیگنال ورودی را پردازش کند. ما از یک مکانیزم کدگشایی برای کاهش زمان پردازش و کاهش مصرف انرژی استفاده می کنیم. برای کاهش توان ایستا در مولفه های BR، متدی Power Gating جزیی (PG) بر مبنای استفاده از مسیریاب ها در این مقاله پیشنهاد شده است. ما موارد استفاده جهانی و استفاده پویا در مسیریاب های محلی را برای به حداکثر رساندن ذخیره انرژی در نظ گرفته ایم. محدودیت توان مسیریاب ها به خاطر تاخیر در بیداری و وارد کردن مدار به حالت فعال، موجب تاثیرات بدی بر کارآیی می شود. مشابه این امکان 1) دوره های خواب کوتاه مدت در فاز کاربرد تجمعی 2) تاخیر در بیداری به دلیل انفجار ترافیک در کاربردهای ساده 3) بلوکه کردن مسیر و 4) ایزوله کردن مسیرها به خار کم بودن توان وجوددارد. برای غلبه بر این تاثیرات، از کانال های بیشتری به اسم کانال های گذرگاهی نامسدود (NBBC) استفاده می کنیم که به مسیریابی با توان محدود متصل شده و داده ها را به مسیریاب بعدی منتقل می کند.
شکل 1: یک معماری WNoC با مسیریاب پایه (BR) و مسیریاب ترکیبی (HR)
ادامه این مقاله به صورت زیر سازماندهی شده است. بخش 2 کارهای مرتبط را مختصرا توضیح می دهد. معماری پیشنهادی مسیریابی در بخش 3 بحث شده است. بخش 4 ارزیابی کارآیی و نتایج شبیه سازی و بخش 5 نتیجه گیری را ارائه می کند.
کارهای مرتبط
اخیرا گروه های تحقیقاتی مختلفی، روی معماری های NoC بیسیم را روی زیرساخت های ارتباطی درون تراشه ای با کارآیی بالا تحقیق می کنند. در (7) یک کانال اکسپرس مقیاس پذیر و بیسیم در درون مسیریاب در معماری NoC (iWISE) که مصرف انرژی را کاهش دهد وکارآیی را بهبود دهد پیشنهاد شده است. در (8) یک معماری سیمی/بیسیم ترکیبی دولایه ای برای متصل کردن صدها هزار هسته CMP با استفاده از لینک های بیسیم کمتراز تراهرتز پیشنهاد شده است. معماری آرایه پردارنده مبتنی بر شبکه با مش دو بعدی در (9) ارائه شده تا کارآیی NoC را بهبود دهد. در (10) یک معماری NoC سلسله مراتبی با آنتن زیگزاگ و گیرنده-فرستنده موج میلی متری برای طراحی NoC بیسیم موج میلی متری پیشنهاد شده است. بلوک گیرنده-فرستنده ، بخش یک پارچه ای از WI ها در WNoC هاست و نیاز به طراحی هایی با انرژی کارآمد داریم تا سیستمی با انرژی کارآمد بدست آوریم. محدود کردن توان، تکنیک موثری برای ذخیره توان ایستا است که در زیرساخت های NoC بررسی شده است. نویسندگان (14) یک کنترلر مدیریت متمرکز توان پیشنهاد کرده و یک گیرنده-فرستنده توان مبتنی بر ترانزیستور خواب برای لینک های بیسیم کم توان درون تراشه پیشنهاد کرده است. در (15) یک کنترلر متمرکز پیشنهاد شده از DVFS برای پردازش هسته ها و محدود کردن انرژی در مسیریاب های بیسیم ترکیبی استفاده می کند. کنترلر های متمرکز حوزه ها و سربار توان کمتری در مقایسه با کنترلرهای توزیع شده اضافه می کنند اما می توانند تاخیری طولانی و پیچیده برای ارسال سیگنال های کنترلی به هسته ها یا خوشه های مختلف سیستم ایجاد کند. پیاده سازی کنترلرهای توزیع شده مختلف برای محدود کردن توان در (16-23) توضیح داده شده است. طراحی کانالی با توان محدود که در (16) ارائه شده موجب کم شدن کمبود توان و تاخیر بیداری با استفاده از روش های فوری می شود. در (17) مسیریاب درون تراشه ای با محدودیت توان و زمان اجرای مناسبی برای کاهش کمبود توان و هزینه انرژی با استفاده از تکنیک های آینده نگرانه ارائه شده است. FlexiBuffer دارای محدودیت توان و جزیی در (18) برای کاهش کمبود توان در بافرها توضیح داده شده که می تواند با تغییرات حداقلی در کنترل جریان کار کند. NoRD (انفصال مسیریاب- گره) (19) روش خوبی برای انتقال توان محدود است که توانایی انتقال بسته در گره را با نظارت بر وضعیت مسیریاب مربوطه جدا می کند. مسیریابی آگاه از توان و پیکربندی توپولوژی با نام Panthre (20) برای ایجاد فواصل زمانی طولانی بین خواب های بی وقفه واحدهای انتخاب شده با به کارگیری محدودیت توان ارائه شده است. در اینجا از لینک بر مبنای محدودیت توان استفاده می شود و مسیر داده های مسیریاب ها از پایین به سمت بالاست. فعالسازی کانال مجازی با توجه به میزان ترافیک در برنامه های کاربردی کم توان در (21) بررسی شده است. پانچ توان ، یک تکنیک آگاه از توان و کارآیی است که برای محدود کردن توان مسیریاب های درون تراشه بدون ایجاد مسدودیت پیشنهاد شده است (22). سیگنال کنترلی قبل از بسته و برای پانچ کردن مسیریاب های مسدود در مسیر آتی بسته ها ارسال می شود. در (23) یک مکانیزم محدود کردن توان کانال مجازی با انرژی کارآمد برای شبکه های درون تراشه ای برای ذخیره مصرف توان ایستا ارائه شده است.
ما در این کار یک تکینک توزیع شده محدود کردن توان برای WI ها و مولفه های اصلی مسیریاب در معماری WNoC پیشنهاد شده است. FGRA امکان افزایش کارآمدی انرژی در زیرساخت های ارتباطی بیسیم درون تراشه را فراهم میکند. ما یک ارزیابی جزیی از معماری WNoC با مسیریاب های FGRA ارائه می کنیم. همچنین سربار کارآیی و مقایسه های مربوطه برای تحقق چارچوب پیشنهادی را بررسی می کنیم
معماری مسیریاب پیشنهادی
در این بخش طراحی معماری جزیی مسیریاب (FGRA) و عملیات کنترلی محدود کردن انرژی برای EI ها و مولفه های معمول مسیریابی را توضیح می دهیم.
کاربرد بر مبنای کنترل محدودیت توان
محدود کردن توان برای مولفه های معمولی مسیریاب در HR و BR در دو سطح و بر مبنای کاربرد مسیریاب، استفاده بر مبنای کاربرد آن در سطح کلی و استفاده از مسیریاب پویا در سطح محلی استفاده می شود.
شکل 2: استفاده از همه مسیریاب ها در کاربردهای واقعی برای یک سیستم 16 هسته ای
استفاده های مبتنی بر کاربرد از پیش محاسبه شده می باشد و ما از معیارهای استاندارد PARSEC و SPLASH-2 استفاده می کنیم. بر مبنای استفاده هایی که در شکل 2 نشان داده شده است مسیریاب ها را به سه دسته تقسیم می کنیم 1) منطقه استفاده بالا (HUZ) که همه مسیریاب ها کاملا استفاده می شوند 2) نواحی استفاده کم (LUZ) که مسیریاب ها غالبا به صورت مستمر استفاده می شوند و 3) نواحی استفاده کم (RUZ) که مسیریاب ها به ندرت استفاده می شوند. مقدار آستانه هر ناحیه بر مبنای کاربرد و نیازهای کاربر تنظیم می شود. مسیریاب های متعلق به RUZ دائما دارای محدودیت توان هستند داده های آنها به درستی و مجددا مسیریابی می شوند. سیگنال محدودیت توان مسیریاب های HUZ غیرفعال است و بنابراین تمام مدت فعال اند. اگر یک HR در دسته ناحیه RUZ بماند، از محدود کردن توان اجتناب می کنیم تا از خطای کارآیی در غیرفعال کردن WI جلوگیری کنیم. معماری پیشنهادی بر مبنای مورد کاربردی ، به منظور به حداکثر رساندن ذخیره انرژی پیکربندی شده است.
استفاده پویا بر مبنای عملیات محدود کردن انرژی با استفاده از محلی از مسیریاب ها در زمان اجرا برای دسترسی به مولفه ها کار می کند. ما میزان استفاده از مسیریاب های پایین دستی که یک گام فاصله دارند را در هر مسیریاب، با توجه به بسته های داده ورودی می سنجیم. برای محاسبه میزان استفاده 1) دیکدر سرآیند اول (HD) سرآیند بسته را در همه VC ها دیکد می کند 2) واحد محاسبات مسیریابی (RC) مسیر را بر مبنای خروجی HD مشخص می کند و 3) در نهایت واحد محاسبات کاربردی (UCU) میزان استفاده از مسیریابی های پایین دستی یک گامی را اندازه می گیرد. اگر RC تصمیم به مسیریابی برای استفاده از WI بگیرد، داور دسترسی بی سیمی به آن پورت ورودی می دهد و ما فرآیندی را که در آینده توضیح خواهیم داد برای WI ها دنبال خواهیم کرد. میزان آستانه (Dth) عملیات محدود کردن پویان توان ، بر مبنای مورد استفاده آنها برای هر مسیریاب تنظیم می شود. یک سیگنال سراسری کاربرد 1بیتی (UGS) هر مسیریاب، وضعیت مسیریاب های پایین دستی را که در جدول مسیریابی ذخیره شده است را مشخص میکند. UGS فعال بالا نشان میدهد که یک مسیریاب خاص دارای محدودیت توان است و به عکس. اگر یک مسیریاب پایین دستی دارای محدودیت انرژی باشد و میزان استفاده از آن بالای حد آستانه باشد ، مسیریاب های بالادستی یک سیگنال 1 بیتی Pilot_out را برای بیدار کردن مسیریاب ارسال می کند. در این مورد، میزان استفاده کمتر از Dth است یا اینکه مسیریاب به RUZ تعلق دارد، ما از NBBC برای ارسال داده استفاده می کنیم. اگر مسیریاب پایین دستی دارای محدودیت توان نباشد و میزان استفاده از آن کم باشد، سیگنال Pilot_out به مسیریابی با محدودیت توان ارسال می شود.
سفارش ترجمه تخصصی مهندسی کامپیوتر
سفارش ترجمه تخصصی مهندسی کامپیوتر
سفارش ترجمه تخصصی مهندسی کامپیوتر
مسیریاب پایین دستی این سیگنال را با عنوان سیگنال Pilot_in دریافت کرده و کنترلر مدیریت توان (PMC) عملیات خاموشی یا بیداری را بر این مبنا کنترل میکند. PMC در هنگام دریاف یک سیگنال فعال سطح پایین Pilot_in ، vc ها، xbar و تخصیص دهنده راه در وضعیت خواب قرار می دهد. زمانی که یک مسیریاب پایین دستی سیگنالهای متناقض Pilot_in دریافت می کند، سیگنال بیداری اولویت بیشتری دارد. اندازه گیری میزان استفاده و کنترل PG هر مسیریاب به شکل دوره ای در ابتدای هر دوره انجام می شود (یک دوره نشان دهنده شروع فاز مدت متغیر یا ثابت در کل دوره شبیه سازیست) و به شکل مجموعه ای برای کل دوره باقی می ماند. فواصل بین این دوره ها با توجه به نیازهای کاربردی تعیین شده و یک فاصله زمانی با سیکل های 1K ، خروجی یکپارچه ای از نظر انرژی گذاری هر شبیه سازی ما ارائه می کند. مسیریاب مقصد، مسیریاب های HUZ و RUZ از این عملیات پویای محدود کردن توان، محروم خواهد بود.
خطای کارآیی به خاطر تاخیر بیداری، تاثیر زیادی بر تکنیک محدود کردن توان دارد. معماری FGRA کاملا پایپلاین است و یک سرآیند، از چهار گام پایپلاین میگذرد ، مولفه های مسیریابی (RC)، کانال مجازی و تخصیص سوییچ (SA)، پیمایش سوییچ (ST) و پیمایش لینک (L). بعد از دریافت سیگنال از داور ، سه چرخه برای سرآیند رخ می دهد تا از ورودی به خروجی برسد. عملیات بیداری محدود کردن توان ، سه سیکل برای UCU طول می کشد تا مولفه های بیداری را غیر فعال کند و ارسال سیگنال را انجام دهد و میزان استفاده را محاسبه کند. در مورد WI، هنگامی که RC تصمیم بگیرد ، PMC سیگنال فعالسازی را ارسال کرده و PA وارد وضعیت فعال میشود چراکه بسته از سوییچ می گذرد. بسته ها به خاطر تکنیک پیشنهاد شده برای محدود کردن توان، تاخیرببیشتری ندارد.
شکل 3: الگوریتم کنترل محدودیت توان WI
3.2. کنترل محدودیت توان WI
برای اطمینان از اینکه سربار WI روی زیرساخت NoC به میزان کمینه است ، از طرح مدولاسیون کلیدگذاری غیرمنسجم خاموش-روشن (OOK) در طراحی پیشنهادی استفاده می شود. همانطور که در شکل 1 می بینید مولفه های اصلی فرستنده WI ، سریال کننده، ماژول بندی کنده و آمپلی فایر توان (PA) است. ابتدا اطلاعات انتقالات به جریان داده های سریالی تبدیل می شود. سپس این سیگنال، قبل از نگهداری آنتن ارسال کننده، ماژول بندی و تقویت می شود. گیرنده انتهای WI دارای یک آمپلی فایر نوز کم (LNA) است تا سیگنال دریافتی را تقویت کند که سپس ماژول بندی شده و با خارج کردن آن از وضعیت سریالی ، برای پردازش های آتی در HR، به داده موازی تبدیل می شود.
شکل 4: ساختار سطح بلوک داخلی FGRA
از یک نوسان ساز کنترل ولتاژ (VCO) برای تولید سیگنال حامل استفاده می شود. در میان همه مولفه های WI، PA و LNA توان زیادی مصرف کرده و توان را فقط برای این مولفه ها محدود می کند تا SPC را ذخیره کند. آنتن هایی که در این معماری در نظر گرفته شده اند توانایی بردکست دارند و هر دو WI می توانند با هم ارتباط برقرار کنند. الگوریتم محدود کردن توان WI در شکل 3 نشان داده شده است. در ابتدا، همه مولفه های LNA و PA در وضعیت خواب نگه داشته می شوند. زمانی که HR تصمیم به مسیریابی می گیرد.زمانی که یک تصمیم مسیریابی در HR برای استفاده از WI اتخاذ میشود کنترلر مدیریت توان (PMC) یک سیگنال فعالسازی برای بیدار کردن PA فرستنده-گیرنده می فرستد. در WI گیرندهف PMC سیگنال دریافتی را تشخیص داده و سیگنال بیداری را به LNA ارسال می کند. برای ایجاد افتراق بین نویز و سیگنال دریافتی واقعی، از یک مولفه مقایسه کننده با یک مجموعه آستانه به منظور آستانه گذاری نویز استفاده می شود. همه مولفه ها در هنگام ارسال داده فعالند. زمانی که دنباله در فرستنده و گیرنده خاتمه می یابد، PMC سیگنال فعالسازی پایین را برای آن مولفه ارسال می کند. از آنجایی که همه آنتن ها داده ها را از آنتن فرستنده دریافت می کنند، PMC مولفه های گیرنده را حتی زمانی که داده ای برای HR تشخیص داده نشده درحالت بیدار نگه می دارد. زمانی که قسمتی از سرآیند دریافت شود، PMC بررسی می کند که آیا این داده ها مربوط به HR است یا خیر، در غیر این صورت فورا سیگنال فعالسازی پاین را برای بازگرداندن LNA به حالت خواب ارسال می کند.
3.3. طراحی مسیریابی ترکیبی با توان محدود
همانطور که در شکل 1 می بینید،معماری WNoCاز مسیریابهای پایه (BR) و مسیریاب های ترکیبی (HR) تشکیل شده که مجهز به WI هستند تا ارتباطات درون تراشه ای کارآمدی داشته باشند. معماری FGRA در شکل 4 نشان داده شده است. کنترلر مدیریت توان (PMC) عملیات محدود کردن توان را کنترل کرده و سیگنال های کنترلی لازم PGS_WI را برای WI (LNA و PA) و PGS_BR را برای مولفه های مسیریاب پایه تولید می کند. در PA، عملیات بیداری به وسیله خروجی RC و داور کنترل می شود. هنگامی که همه پیام ها ارسال شدند PA به صورت اتوماتیک به وضعیت خواب می رود. در سمت گیرنده، مقایسه کننده بررسی میکند که ایا توان سیگنال آنتن دریافت کننده زیر آستانه نویز است و ورودی PMC را بر مبنای آن تولید می کند که در صورت نیاز LNA را بیدار خواهد کردر. زمانی که HD تصمیمات خود را بگیرد و مسیریاب ، مدنظر گیرنده نباشد، یک ورودی کنترل الزامی را به PMC می فرستد.
شکل 5: مسیریابی نامسدود با استفاده از NBBC
UCU برای استفاده مبتنی بر کنترل، میزان استفاده از روترهای پایین دستی را اندازه می گیرد تا برای مولفه های مسیریابی محدود کننده توان تصمیم گیری کند. PMC مسیریاب بالادستی برای تولید سیگنالهای Pilot_out برای مولفه های مسیریاب های پایین دستی، بر مبنای خروجی UCU و اسفاده از سیگنال سراسری (UGS) مسیریاب های پایین دستی تصمیم گیری می کند. در مسیریاب پایین دستی، PMC اولویت هر سیگنال Pilot_in دریافتی را تعیین کرده و سیگننال خواب/بیداری و PGS_BR را تولید کرده و UGS بر مبنای آن تنظیم می شود.
3.4. پیاده سازی NBBC
از دیگر تاثیرات محدودیت توان و مسیریاب های RUZ مسدود کردن مسیرهای ارسال و ایزوله کردن مسیرها در معماری است. ما برای کاهش این تاثیرات از NBBC های مربوط به (24) استفاده می کنیم که مسیری به مسیرییاب های دارای محدودیت توان دارد و داده ها را به مسیریاب بعدی می فرستد. NBBC ها نیز میتوانند برای کاهش فازهای بیداری کوتاه مدت و تضادهای مسیریاب ها استفاده شود. استفاده از NBBC برای غلبه بر مسدودیت مسیر ارسال و مسئله ایزولاسیون را می توان با استفاده از سناریویی که در شکل 5 نشان داده شده است توضیح داد. در اینجا مسیریاب های 4، 5، 6، 10، 11 و 14 دارای محدودیت انرژی یا مسیریاب های RUZ است. زمانی که بسته داده های باید از مسیریاب 0 به 9 ارسال شود ، همه ارسال های بین این دو مسیریاب به خاطر محدودیت انرژی مسدود می شود. هنگامی که میزان استفاده کم است، به جای بیدار کردن مسیریاب برای یک مدت کوتاه، می توانیم از NBBC برای ارسال داده و ذخیره انرژی بدون ایجاد مشکلات کارآیی استفاده کنیم. در این مورد، داده ها را می توان از مسیریاب 1 به 8 یا از یک به 9 انتقال داد تا ارسال داده کامل شود. مسیریاب 15 جد از سایر مسیریاب هاست. در این سناریو نیز می توان از NBBC برای ارسال موثر داده به مسیریاب 15 NoC استفاده کرد تا همانطور که انتظار می رود استفاده کند. مسئله دیگر در هنگامی که بیش از یک کانال ورودی نیاز به دسترسی به کانالهای خروجی مشابهی دارد، در هر مسیریاب NoC تضادهاست. در مورد این تضادها، داور می تواند براساس اولویتها، درمورد دسترسی NBBC به کانال ورودی تصمیم بگیرد. این موجب کاهش تاخیر به خاطر مسائل تضاد می شود و به این ترتیب کارآیی بهبود می یابد.
طراحی داور، به منظور یکپارچگی NBBC در شکل 6 نشان داده شده است که موجب انعطاف پذیری در کاربرد NBBC و اجتناب از کاهش کارآیی به خاطر محدود شدن توان می شود. از Grant_1 تا Grant_n (در این مورد n=5) برای اعطای دسترس یکانال خروجی به هر کانال ورودی ، بر مبنای تصمیمات مسیریابی استفاده می شود. داور، میزان دسترسی را بر اساس اولویت ورودی ها می دهد. اگر مسیریاب پایین دستی دارای محدودیت توان باشد و میزان استفاده از آنها کم باشد ، از Grant_NBBC برای اعطای دسترسی NBBC برای ورودی های مورد نیاز استفاده شده است واز مسیریاب هایی که محدودیت توان دارند می گذرد تا از طریق مسیری که افت کارآیی ندارد، به مسیریاب بعدی برسد. سناریوهای مثال در شکل 5 نشان داده شده است.
شکل 7: مصرف توان در وضعیت های عملیاتی مختلف WI
4. ارزیابی کارآیی
ما در این سناریو ، جزییات پیاده سازی ، مزایای کارآیی و سربار FGRA را بحث کرده و آن را با معماری های جدید NoC دارای محدودیت توان ، مقایسه می کنیم. ما FGRA را روی شبیه ساز چرخه دقیق Noxim شبیه سازی کرده ایم. ترافیک سطح کاربرد با استفاده از معیارهای SPLASH-2 و PARSEC از شبیه ساز سیستم کامل GEM5 جمع آوری شد است. مقادیر آستانه مسیریاب های RUZ و LUZ به ترتیب روی 5% و 25% تنظیم شده اند. در همه ارزیابی ها از یک سیستم 16 هسته ای استفاده می شود و مشخصات سیستم در جدول 1 نشان داده شده است. پهنای همه لینک های سیمی مشابه سایز گذرگاه است. ما از مسیریابی کرمچاله استفاده کرده ایم. سوییچ های شبکه و PMC از ترکیب طراحی سطح RTL با کامپایلر طراحی Synopsys با استفاده از تکنولوژی 28nm ایجاد شده اند. برای بدست آوردن ناحیه، توان و تاخیر ترانزیستور خواب، از ابزارهای Cadence استفاده می کنیم. ما از تکنیک بهینه سازی مبتنی بر SA برای تعیین سطح WI برای گرفتن مزایای حداکثری استفاده می کنیم و هر لینک بیسیمی می تواند نرخ داده 16 Gbps را حفظ کند.
4.1. پیاده سازی مسیریاب دارای محدودیت توان
طراحی FGRA از PMOS بعنوان سوییچ محدود کردن توان، برای حفظ جریان نشتی در حداقل مقدار ممکن، استفاده می کند. ترانزیستور خواب ، از 8.89Nw توان ایستا و حوزه 0.0325μm2 مصرف می کند. واحدهای UCU و PMC ، مساحت 66.87μm2 را اشغال می کند. کل منطقه مورد نیاز مسیریاب FGRA (شامل ترانزیستور خواب، واحدهای کنترل، بافرها، خط عرضی، داور، RC و VC ها) حدود 4.45×10-3mm2 است. بنابراین ، سربار کل ناحیه مسیریابی با محدودیت توان، که دارای واحد کنترل است (شامل یک ترانزیستور خواب) میزان 0.165mm2 است.
میزان SPC مولفه های مسیریابی بدون WI در طی وضعیت خواب و فعالیت ، به ترتیب 7.35μW و 65.42μW است. تکنیک پیشنهادی می تواند تا حدود 88.76% انرژی را ذخیره کند،LNA و PA حدود 20mW توان ایستا با توان کلی گیرنده 32mW مصرف می کند.
جدول 1: تنظیم شبیه سازی در FGRA
جدول 2: تاثیر محدود کردن توان
FGRA می تواند تا حدود 62.5% توان ایستای WI را ذخیره کند. مصرف توان در فازهای مختلف عملیات HR در شکل 7 نشان داده شده است. بعلاوه NBBC ها ، تاخیر تضادها را تا 28% کاهش می دهد. این کاهش تاخیر تضادها موجب بهبود توان عملیاتی می شود. استفاده از NBBC نیز ، انرژی بافر را به میزان 29% کاهش داده و انرژی خط عرضی به میزان 32% کم می شود.
4.2. ذخیره انرژی با ترافیک واقعی و ترکیبی
ذخیره انرژی ایجاد شده در FGRA ،با اجرای معیارهای PARSEC و SPLASH-2 روی سیستم 16 هسته ای ارزیابی شده و نتایج در جدول 8 آمده است. میزان ذخیره انرژی در حالتی که محدودیت توان وجود ندارد ، بیشتر از معماری WNoC است. به صورت متوسط ، FGRA در مقایسه با WNoC معمولی به ذخیره 37.2 درصدی ذخیره انرژی در همه معیارها می رسد. ذخیره انرژی با استفاده از FGRA برای کاربردهای داده های فشرده مانند کانال و LU به بیش از 40% می رسد. به سادگی میتوان FGRA را برای ذخیره توان/ انرژی تهاجمی تنظیم کرد. از نظر ذخره انرِژی، با افزایش تعداد WIها، انرژی ذخیره شده نیز افزایش می یابد زیرا فرصت های بیشتری برای محدود کردن انرژی WI وجود دارد.
4.3. تاثیر محدود کردن انرژی
تاثیر اصلی طرح محدود کردن انرژی شامل کم شدن ولتاژ، تاخیر بیداری و مصرف انرژی گذراست. مقادیر مربوط به ترانزیستور خواب به کار رفته در جدول 2 نشان داده شده است. زمانی که مداری، وضعیت ها را بین خواب و بیداری تغییر می دهد ، انرژی انتقال کمی مصرف می شود. اگر مدار، وضعیت خواب و بیداری را مکررا تغییر دهد، انرژی گذار مصرف شده زیاد است و ذخیره انرژی در شبکه کاهش می یابد.
4.4. مقیاس پذیری و سربارها
طراحی FGRA دو مولفه PMC و UCU را برای کنترل عملیات PG و کاهش SPC در NoC یکپارچه می کند. پیاده سازی واحد PMC ، به سایز سیستم وابسته نیست. واحد UCU فقط سیگنالهای سراسری مسیریاب های پایین دستی را پردازش می کند و به این ترتیب سایز آن با تغییر سایز سیستم تغییر نمی کند. حتی هنگامی که تعداد مسیریاب ها زیاد است نیز طراحی PMC و UCU بی تغییر می ماند و بنابراین روش پیشنهادی را می توان روی هر تعداد هسته گسترش داد. سربار کلی منطقه در معماری FGRA، 2.42 درصد کل حوزه مسیریاب است. متد پیشنهادی با سربار منطقه کمتری به ذخیره بالای توان رسیده و نیز مقیاس پذیر است.
شکل 8: ذخیره انرژی WNoC با FGRA روی WNoC معمول برای یک سیستم 16 هسته ای
سربار مسیریاب ها، در مقایسه با سیم های اصلی، به خاطر NBBC ها خیلی کمتر است.
4.5. ارزیابی کارآیی با ترافیک واقعی و ترکیبی
در این بخش FGRA را با سایر طرح های محدودیت توان مقایسه کرده و کارآیی FGRA را تحت شرایط مختلف ترافیک با معماری منظم ارزیابی می کنیم.
4.5.1. مقایسه با سایر متد های محدود کردن توان
ما برای ارزیاب طرح های مختلف محدود کردن توان، FGRA خودمان را با طراحی های پیشنهادی محدودیت انرژی، از نظر ذخیره انرژی ایستا، سربار منطقه، بلوک بندی و تاخیر بیداری مقایسه می کنیم.
مقایسه ذخیره انرژی و مشکلات مربوطه در طرح های مختلف در جدول 3 نشان داده شده است. برای مواجهه با تاخیر بیداری، طرح های اخیر مسیریابی، سیگنال بیداری را به مسیریابی که حداکثر در دوگامی قرار دارد می فرستد.
شکل 9: پهنای باند WNoC با و بدون FGRA با ترافیک واقعی و ترکیبی در سیستم 16 هسته ای
پانچ توان ، همه سیگنال های کنترلی را به همراه بسته ها می فرستد تا از هر مسیریاب بلوکه شده ای در مسیرحداقلی با خطای زمان اجرای کمتر از 0.4% اجتناب کند. در مقایسه با آن UCU و عملیات بیداری FGRA پایپلاین می شوند و بسته ها هیچ تاخیر بیشتری در BR و فرستده-گیرنده انتهای WI ندارد. در گیرنده WI ها، بسته ها تاخیر بیداری خیلی کم و حدود 0.14ns دارد. با استفاده از NBBC از بلوکه بندی و ایزوله کردن مسیریاب ها اجتناب می شود.
4.5.2. تحلیل پهنای باند
برای ارزیابی کارآیی بارکاری سنگین ارتباطی و محاسباتی ، از معیارهای SPLASH-2 و PARSEC استفاده می کنیم. شکل 9 پهنای باند پیک (پهنای باند پیک ، حداکثر نرخ داده های قابل دسترس برای WNoC است) را در وضعیت اشباع شبکه در معماری WNoC با FGRA و مسیریاب های معمول نشان می دهد.
جدول 3: مقایسه معماری های NoC با انرژی کارآمد
FGRA در بیش از نیمی از معیارهای تست شده و الگوهای ترافیک آنها بهبود ایجاد می کند یا اینکه عملکرد مشابهی دارد. پهنای باند پیک، موجب بهبود حفره های سیاه، LU و ترافیک در جریان می شود درحالیکه مشابه ترافیک bitreversal، transpose و radix است. با این حال شاهد کاهش جزیی کارآیی در ترافیک Canneal، Swaptions و FFT هستیم و در مقایسه با معماری های مرسوم به بیش از 3% نمی رسد. از آنجایی که NBBC تاخیر تضاد را کاهش می دهد، کاهش تاخیر تضاد موجب بهبود پهنای باند می شود. با توجه به نتایج، مشهود است که معماری پیشنهادی هیچ کاهش کارآیی ندارد درحالیکه به ذخیره انرژی/توان چشم گیری در مسیریاب و سطح شبکه می رسد.
سفارش ترجمه تخصصی مهندسی کامپیوتر
سفارش ترجمه تخصصی مهندسی کامپیوتر
سفارش ترجمه تخصصی مهندسی کامپیوتر
5. نتیجه گیری
ما در این کار کارآیی مسیریابی که محدودیت توان دارد را برای معماری WNoC را بررسی می کنیم. با به کارگیری تکنیک محدود کردن توان در مسیریاب، مصرف توان ایستا کم می شود. این روش می تواند مصرف توان ایستا را تا 88.76% در مسیریاب پایه و 62.5% در مسیریاب ترکیبی ذخیره کند. ما از NBBC ها برای گذر از مسیریاب های دارای محدودیت توان و کاهش افت کارآیی استفاده می کنیم. FGRA همچنین مصرف انرژی شبکه ایستا را به صورت متوسط به میزان 37.2% کاهش می دهد و نیز کاهش کارآیی آن نیز کم است.