ترجمه تخصصی مقالات انگلیسی

ترجمه تخصصی مقالات رشته های فنی مهندسی، علوم انسانی، علوم پایه، پزشکی، حقوق

ترجمه تخصصی مقالات انگلیسی

ترجمه تخصصی مقالات رشته های فنی مهندسی، علوم انسانی، علوم پایه، پزشکی، حقوق

در این وبلاگ، مطالب و مقالات علمی برای رشته های مختلف دانشگاهی، منتشر خواهد شد

حذف نویزِ زوم به کمک روش تفریق طیفی چندبانده برای دوربین‌های دیجیتال

Multi-Band Spectral Subtraction Based Zoom-Noise Suppression for Digital Cameras

 

چکیده- این مقاله روش حذف نویز جدیدی برای کاهش نویز زوم تولید شده حین ضبط سیگنال‌های صوتی توسط یک دوربین دیجیتال ارائه می‌دهد. روش پیشنهادی مبتنی بر تفریق طیفی چندبانده است که قادر است در حوزه تبدیل کسینوسی گسسته اصلاح شده، بر مولفه‌های طیفی نویز مربوط به نویزِ زومِ مرجع غلبه کند. به خصوص، در روش ارائه شده، هر فریم به صورت یک فریم نویز و یا یک فریم غیرنویز دسته‌بندی می‌شود، و بسته به این طبقه‌بندی، نویز زوم مرجع آپدیت شده و میزان غلبه بر آن کنترل می‌شود. از ارزیابی عملکرد مشخص شده است که نویز ناشی از عمل زوم‌کردن دوربین دیجیتال به‌طور موفقیت‌آمیزی کاهش یافته و در عین حال کیفیت صوتی حفظ می‌شود.

 

سفارش ترجمه تخصصی مهندسی کامپیوتر

  1. مقدمه

دوربین‌های دیجیتالِ امروزی به طور گسترده به منظور ضبط ویدئو و صوت به کار می‌روند و در نتیجه استفاده از هندی‌کم‌ها به شدت رو به زوال است. یکی از معایب صوت ضبط شده توسط دوربین‌های دیجیتال این است که حین عملیات زوم دوربین، میزان قابل‌توجهی نویز مکانیکی ایجاد می‌شود. یک راهکار واضح این است که سرعت موتور زوم محدود شود [1]. با این حال، چنین روشی باعث کاهش سرعت زوم دوربین‌های دیجیتال شده و ضبط اشیای متحرک سریع دشوار خواهد شد. بنابراین، برای غلبه بر مصالحه بین سرعت زوم و میزان نویز باید تلاش بیشتری صورت گیرد.

به عنوان راهکاری جهت کاهش میزان نویز زوم بدون کاهش سرعت زوم، یک روش غلبه بر نویز مکانیکی با اتخاذ نویز مرجع برای دوربین‌های دیجیتال ارائه شد [1]. کاهش نویز زوم در این روش با این فرض انجام گرفت که در رابطه با وقفه‌های عمل موتور زوم‌کننده اطلاعات پیشین کاملا معلوم بوده و این که در طی آن وقفه‌ها برای آپدیت نویز مرجع، تنها نویز زوم موجود باشد. با این حال، به علت تاخیر زمانی ناخواسته و/یا اختلاف زمانی بین حرکت موتور زوم‌کننده و زمان عملکرد آن، اندازه‌گیری زمان دقیق عمل زوم دشوار است. همچنین، در طی فواصل زمانی نویز زوم، سیگنال‌های صوتی و نویز زوم معمولا با هم ترکیب می‌شوند. این عوامل باعث تنزل و تخریب عمل کاهش نویز زوم می‌شود.

به منظور در نظر گرفتن مسائل فوق، ما با ترکیب یک الگوریتم تشخیص نویز زوم، روشی را برای حذف نویز زوم ارائه می‌کنیم. با این کار، اطلاعات مربوط به عملکرد نویز زوم ضرورتی ندارد. روش ارائه شده مبتنی بر روش تفریق طیفی چندبانده (MBSS) است، که مولفه‌های طیفی نویز مربوط به نویز زوم مرجع را در حوزه تبدیل کسینوسی گسسته اصلاح‌شده (MDCT) حذف می‌کند [2]. علاوه بر این، برای یک فریم صوتی داده شده، الگوریتم تشخیص نویز زوم ابتدا نسبت سیگنال به نویز(SNR) زیرباند را تخمین می‌زند. سپس، میزان حذف در روش MBSS را کنترل کرده و با توجه به توزیع SNR های زیرباند در طی فرکانس‌، تعیین می‌کند که آیا فریم صوتی یک فریم نویز زوم است یا نه. به عبارت دیگر، نویز زوم مرجع تنها زمانی آپدیت می‌شود که این فریم صوتی به عنوان یک فریم نویز زوم اعلام شده باشد.

 

  1. روش حذف نویز زوم ارائه شده

شکل1 فلوچارت روش حذف نویز زوم ارائه شده را نشان می‌دهد که در حوزه MDCT عمل می‌کند چون نسبت به حوزه تبدیل فرکانس دارای عملکرد بالاتر تراکم انرژی و رزولوشن طیفی است [3]. ابتدا، روش ارائه شده سیگنال‌های صوتی را به یک فریمی حاوی 1024 نمونه تقسیم‌بندی می‌کند، که این تعداد متناسب است با 32 میلی‌ثانیه در یک نرخ نمونه‌برداری 32 کیلوهرتز. سپس، MDTC را به سیگنال‌های صوتی تخریب‌شده با نویز زوم اعمال کرده و ضرایب MDCT را به 49 زیرباند تقسیم می‌کند که پهنای‌باند آنها مشابه پهنای‌باندهای کدینگ پیشرفته صوتی MPEG (AAC) است[4]. پس از آن، برای فریم داده شده l اُم، روش ارائه شده با مقایسه توان زیرباند سیگنال صوتی و نویز زوم مرجع، SNR زیرباندها را تخمین می‌زند، یعنی SNR(l,k)، k = 0, …,48. در اینجا توجه شود که نویز زوم مرجع سیگنال نویز زون ضبط شده با دوربین دیجیتال در یک محیط ساکت است. سپس SNR تخمینی برای هر زیرباند جهت تشخیص نویز زوم به کار می‌رود. با توجه به نتیجه تشخیص نویز زوم، نویز زوم مرجع آپدیت شده و میزان حذف نویز برای حذف نویز مبتنی بر MBSS کنترل می‌شود. در نهایت، یک MDTC معکوس (IMDCT) اعمال می‌شود تا نسخه حذف‌شده نویز زوم از سیگنال صوتی ضبط شده بدست آید.

 

شکل1. فلوچارت روش ارائه شده برای حذف نویز زوم

 

همانطور که در بالا بیان شد، عملکرد روش ارائه شده به شدت بستگی به الگورتیم تشخیص نویز زوم دارد. این الگوریتم تشخیص ابتدا تعداد زیرباندهایی را می‌شمارد که SNR آنها از یک آستانه از پیش تعیین‌شده‌ای کمتر باشند، SNR­thres. یعنی،

که در این رابطه اگر x ≤ y آنگاه I(x,y) = 1، در غیر اینصورت I(x,y) = 0. اگر N(l) ≥ Nthres باشد،  فریم l-ام به عنوان یک فریم نویز زوم شناخته می‌شود. در این مقاله، به کمک آزمایش‌های خسته‌کننده انجام شده پارامترها به این صورت تنظیم می‌شوند: SNRthres = 0 و Nthres = 0.7.

اگر فریم فعلی یک فریم نویز زوم باشد، سیگنال صوتی ضبط شده با نویز زوم مرجع متوسط‌گیری می‌شود. در نتیجه، این نویز زوم مرجع متوسط‌گیری شده برای کاهش نویز مبتنی بر MBSS به کار می‌رود. میزان حذف نویز در MBSS بسته به اینکه فریم فعلی یک فریم نویز زوم باشد یا خیر، کنترل می‌شود. به عبارت دیگر، ضریب حذف (غلبه) برای یک فریم نویز زوم افزایش و در غیر این صورت کاهش کاهش داده می‌شود.

در نهایت، حذف نویز مبتنی بر MBSS به کمک SNR های زیرباند، یک ضریب حذف و نویز زوم مرجع آپدیت‌شده، اجرا می‌شود. مطابق شکل1، با اعمال IMDCT ما یک نسخۀ بدون نویز زوم از سیگنال صوتی ضبط شده خواهیم داشت.

  1. ارزیابی عملکرد

به منظور ارزیابی عملکرد روش ارائه شده، این روش به کمک یک دوربین دیجیتال کمپاکت تجاری موجود با عملکرد زوم‌کنندگی پیاده‌سازی شد. این دوربین به منظور ضبط صدا به دو میکروفن الکترت کندنسر[1] تجهیز شد. نویز زوم مرجع اولیه با متوسط‌گیری از نویز زوم ضبط شده توسط پنج دوربین مختلف با مدل یکسان بدست آمد. سیگنال‌های صوتی تست در یک محیط اداری و با انجام عملیات زوم ضبط شدند. با اینکه این روش به سیگنال‌های صوتی اعمال شد، روش پیشنهادی به اندازه کافی تاخیر داشت که موجب سنکرون (همزمان) شدن ویدئو و صوت نشود. به عبارت دیگر، میزان تاخیر در کل برابر 94/36 میلی‌ثانیه بود، که با تاخیر 32 میلی‌ثانیه‌ای الگوریتم توسط عملکرد MDCT/IMDCT و تاخیر پردازش 94/4 میلی‌ثانیه اندازه‌گیری شده در دوربین دیجیتال جمع شد.

مقایسه طیف‌نماهای نویز زوم ضبط شده در یک محیط آرام، سیگنال‌های صوتی ضبط شده بدون زوم‌کردن، سیگنال‌های صوتی ضبط شده در طی عمل زوم‌کردن و سیگنال‌های صوتی با حذف نویز زوم توسط به ترتیب روش مرسوم [1] و روش ارائه شده، در شکل2 نمایش داده شده است در مقایسه با مولفه‌های طیفی نشان داده شده در شکل2 (c)، مولفه‌های طیفی نویز زون نشان داده شده در شکل2 (e) به خوبی حذف شدند در حالی که دیگر مولفه‌های طیفی حفظ شدند. علاوه بر این، عملکرد روش ارائه شده از منظر شباهت طیفی با سیگنال صوتی بدون نویز زوم، مطابق شکل2 (b) نسبت به روش مرسوم برتری دارد.

 

شکل2. مقایسه طیف‌نما: (a) نویز زوم، (b) سیگنال صوتی بدون نویز زوم، (c) سیگنال صوتی ضبط شده طی عمل زوم‌کردن، (d) سیگنال صوتی با حذف نویز توسط روش مرسوم، و (e) سیگنال صوتی با حذف نویز توسط روش ارائه شده.

 

  1. نتیجه‌گیری

در این مقاله، برای کاهش نویز مکانیکی ایجاد شده توسط عمل زوم‌ دوربین‌های دیجیتال، یک روش حذف نویز زوم ارائه شد. روش ارائه شده با تشخیص فریم‌های نویز زوم به کمک SNRهای زیرباند، و سپس آپدیت‌کردن نویز زوم مرجع و کنترل میزان حذف، انجام گرفت. پس از اعمال روش ارائه شده به سیگنال‌های صوتی ضبط شده بر روی دوربین دیجیتال تجاری موجود، نشان داده شد که روش پیشنهادی قادر است به طور موفقیت‌آمیزی نویز زوم را کاهش داده و منجر به کیفیت بهتر صدا شود.

 

[1] Electrets condenser

نظرات  (۰)

هیچ نظری هنوز ثبت نشده است

ارسال نظر

ارسال نظر آزاد است، اما اگر قبلا در بیان ثبت نام کرده اید می توانید ابتدا وارد شوید.
شما میتوانید از این تگهای html استفاده کنید:
<b> یا <strong>، <em> یا <i>، <u>، <strike> یا <s>، <sup>، <sub>، <blockquote>، <code>، <pre>، <hr>، <br>، <p>، <a href="" title="">، <span style="">، <div align="">
تجدید کد امنیتی