ترجمه مقاله حذف نویزِ زوم به کمک روش تفریق طیفی چندبانده
حذف نویزِ زوم به کمک روش تفریق طیفی چندبانده برای دوربینهای دیجیتال
Multi-Band Spectral Subtraction Based Zoom-Noise Suppression for Digital Cameras
چکیده- این مقاله روش حذف نویز جدیدی برای کاهش نویز زوم تولید شده حین ضبط سیگنالهای صوتی توسط یک دوربین دیجیتال ارائه میدهد. روش پیشنهادی مبتنی بر تفریق طیفی چندبانده است که قادر است در حوزه تبدیل کسینوسی گسسته اصلاح شده، بر مولفههای طیفی نویز مربوط به نویزِ زومِ مرجع غلبه کند. به خصوص، در روش ارائه شده، هر فریم به صورت یک فریم نویز و یا یک فریم غیرنویز دستهبندی میشود، و بسته به این طبقهبندی، نویز زوم مرجع آپدیت شده و میزان غلبه بر آن کنترل میشود. از ارزیابی عملکرد مشخص شده است که نویز ناشی از عمل زومکردن دوربین دیجیتال بهطور موفقیتآمیزی کاهش یافته و در عین حال کیفیت صوتی حفظ میشود.
سفارش ترجمه تخصصی مهندسی کامپیوتر
- مقدمه
دوربینهای دیجیتالِ امروزی به طور گسترده به منظور ضبط ویدئو و صوت به کار میروند و در نتیجه استفاده از هندیکمها به شدت رو به زوال است. یکی از معایب صوت ضبط شده توسط دوربینهای دیجیتال این است که حین عملیات زوم دوربین، میزان قابلتوجهی نویز مکانیکی ایجاد میشود. یک راهکار واضح این است که سرعت موتور زوم محدود شود [1]. با این حال، چنین روشی باعث کاهش سرعت زوم دوربینهای دیجیتال شده و ضبط اشیای متحرک سریع دشوار خواهد شد. بنابراین، برای غلبه بر مصالحه بین سرعت زوم و میزان نویز باید تلاش بیشتری صورت گیرد.
به عنوان راهکاری جهت کاهش میزان نویز زوم بدون کاهش سرعت زوم، یک روش غلبه بر نویز مکانیکی با اتخاذ نویز مرجع برای دوربینهای دیجیتال ارائه شد [1]. کاهش نویز زوم در این روش با این فرض انجام گرفت که در رابطه با وقفههای عمل موتور زومکننده اطلاعات پیشین کاملا معلوم بوده و این که در طی آن وقفهها برای آپدیت نویز مرجع، تنها نویز زوم موجود باشد. با این حال، به علت تاخیر زمانی ناخواسته و/یا اختلاف زمانی بین حرکت موتور زومکننده و زمان عملکرد آن، اندازهگیری زمان دقیق عمل زوم دشوار است. همچنین، در طی فواصل زمانی نویز زوم، سیگنالهای صوتی و نویز زوم معمولا با هم ترکیب میشوند. این عوامل باعث تنزل و تخریب عمل کاهش نویز زوم میشود.
به منظور در نظر گرفتن مسائل فوق، ما با ترکیب یک الگوریتم تشخیص نویز زوم، روشی را برای حذف نویز زوم ارائه میکنیم. با این کار، اطلاعات مربوط به عملکرد نویز زوم ضرورتی ندارد. روش ارائه شده مبتنی بر روش تفریق طیفی چندبانده (MBSS) است، که مولفههای طیفی نویز مربوط به نویز زوم مرجع را در حوزه تبدیل کسینوسی گسسته اصلاحشده (MDCT) حذف میکند [2]. علاوه بر این، برای یک فریم صوتی داده شده، الگوریتم تشخیص نویز زوم ابتدا نسبت سیگنال به نویز(SNR) زیرباند را تخمین میزند. سپس، میزان حذف در روش MBSS را کنترل کرده و با توجه به توزیع SNR های زیرباند در طی فرکانس، تعیین میکند که آیا فریم صوتی یک فریم نویز زوم است یا نه. به عبارت دیگر، نویز زوم مرجع تنها زمانی آپدیت میشود که این فریم صوتی به عنوان یک فریم نویز زوم اعلام شده باشد.
- روش حذف نویز زوم ارائه شده
شکل1 فلوچارت روش حذف نویز زوم ارائه شده را نشان میدهد که در حوزه MDCT عمل میکند چون نسبت به حوزه تبدیل فرکانس دارای عملکرد بالاتر تراکم انرژی و رزولوشن طیفی است [3]. ابتدا، روش ارائه شده سیگنالهای صوتی را به یک فریمی حاوی 1024 نمونه تقسیمبندی میکند، که این تعداد متناسب است با 32 میلیثانیه در یک نرخ نمونهبرداری 32 کیلوهرتز. سپس، MDTC را به سیگنالهای صوتی تخریبشده با نویز زوم اعمال کرده و ضرایب MDCT را به 49 زیرباند تقسیم میکند که پهنایباند آنها مشابه پهنایباندهای کدینگ پیشرفته صوتی MPEG (AAC) است[4]. پس از آن، برای فریم داده شده l – اُم، روش ارائه شده با مقایسه توان زیرباند سیگنال صوتی و نویز زوم مرجع، SNR زیرباندها را تخمین میزند، یعنی SNR(l,k)، k = 0, …,48. در اینجا توجه شود که نویز زوم مرجع سیگنال نویز زون ضبط شده با دوربین دیجیتال در یک محیط ساکت است. سپس SNR تخمینی برای هر زیرباند جهت تشخیص نویز زوم به کار میرود. با توجه به نتیجه تشخیص نویز زوم، نویز زوم مرجع آپدیت شده و میزان حذف نویز برای حذف نویز مبتنی بر MBSS کنترل میشود. در نهایت، یک MDTC معکوس (IMDCT) اعمال میشود تا نسخه حذفشده نویز زوم از سیگنال صوتی ضبط شده بدست آید.
شکل1. فلوچارت روش ارائه شده برای حذف نویز زوم
همانطور که در بالا بیان شد، عملکرد روش ارائه شده به شدت بستگی به الگورتیم تشخیص نویز زوم دارد. این الگوریتم تشخیص ابتدا تعداد زیرباندهایی را میشمارد که SNR آنها از یک آستانه از پیش تعیینشدهای کمتر باشند، SNRthres. یعنی،
که در این رابطه اگر x ≤ y آنگاه I(x,y) = 1، در غیر اینصورت I(x,y) = 0. اگر N(l) ≥ Nthres باشد، فریم l-ام به عنوان یک فریم نویز زوم شناخته میشود. در این مقاله، به کمک آزمایشهای خستهکننده انجام شده پارامترها به این صورت تنظیم میشوند: SNRthres = 0 و Nthres = 0.7.
اگر فریم فعلی یک فریم نویز زوم باشد، سیگنال صوتی ضبط شده با نویز زوم مرجع متوسطگیری میشود. در نتیجه، این نویز زوم مرجع متوسطگیری شده برای کاهش نویز مبتنی بر MBSS به کار میرود. میزان حذف نویز در MBSS بسته به اینکه فریم فعلی یک فریم نویز زوم باشد یا خیر، کنترل میشود. به عبارت دیگر، ضریب حذف (غلبه) برای یک فریم نویز زوم افزایش و در غیر این صورت کاهش کاهش داده میشود.
در نهایت، حذف نویز مبتنی بر MBSS به کمک SNR های زیرباند، یک ضریب حذف و نویز زوم مرجع آپدیتشده، اجرا میشود. مطابق شکل1، با اعمال IMDCT ما یک نسخۀ بدون نویز زوم از سیگنال صوتی ضبط شده خواهیم داشت.
- ارزیابی عملکرد
به منظور ارزیابی عملکرد روش ارائه شده، این روش به کمک یک دوربین دیجیتال کمپاکت تجاری موجود با عملکرد زومکنندگی پیادهسازی شد. این دوربین به منظور ضبط صدا به دو میکروفن الکترت کندنسر[1] تجهیز شد. نویز زوم مرجع اولیه با متوسطگیری از نویز زوم ضبط شده توسط پنج دوربین مختلف با مدل یکسان بدست آمد. سیگنالهای صوتی تست در یک محیط اداری و با انجام عملیات زوم ضبط شدند. با اینکه این روش به سیگنالهای صوتی اعمال شد، روش پیشنهادی به اندازه کافی تاخیر داشت که موجب سنکرون (همزمان) شدن ویدئو و صوت نشود. به عبارت دیگر، میزان تاخیر در کل برابر 94/36 میلیثانیه بود، که با تاخیر 32 میلیثانیهای الگوریتم توسط عملکرد MDCT/IMDCT و تاخیر پردازش 94/4 میلیثانیه اندازهگیری شده در دوربین دیجیتال جمع شد.
مقایسه طیفنماهای نویز زوم ضبط شده در یک محیط آرام، سیگنالهای صوتی ضبط شده بدون زومکردن، سیگنالهای صوتی ضبط شده در طی عمل زومکردن و سیگنالهای صوتی با حذف نویز زوم توسط به ترتیب روش مرسوم [1] و روش ارائه شده، در شکل2 نمایش داده شده است در مقایسه با مولفههای طیفی نشان داده شده در شکل2 (c)، مولفههای طیفی نویز زون نشان داده شده در شکل2 (e) به خوبی حذف شدند در حالی که دیگر مولفههای طیفی حفظ شدند. علاوه بر این، عملکرد روش ارائه شده از منظر شباهت طیفی با سیگنال صوتی بدون نویز زوم، مطابق شکل2 (b) نسبت به روش مرسوم برتری دارد.
شکل2. مقایسه طیفنما: (a) نویز زوم، (b) سیگنال صوتی بدون نویز زوم، (c) سیگنال صوتی ضبط شده طی عمل زومکردن، (d) سیگنال صوتی با حذف نویز توسط روش مرسوم، و (e) سیگنال صوتی با حذف نویز توسط روش ارائه شده.
- نتیجهگیری
در این مقاله، برای کاهش نویز مکانیکی ایجاد شده توسط عمل زوم دوربینهای دیجیتال، یک روش حذف نویز زوم ارائه شد. روش ارائه شده با تشخیص فریمهای نویز زوم به کمک SNRهای زیرباند، و سپس آپدیتکردن نویز زوم مرجع و کنترل میزان حذف، انجام گرفت. پس از اعمال روش ارائه شده به سیگنالهای صوتی ضبط شده بر روی دوربین دیجیتال تجاری موجود، نشان داده شد که روش پیشنهادی قادر است به طور موفقیتآمیزی نویز زوم را کاهش داده و منجر به کیفیت بهتر صدا شود.
[1] Electrets condenser