ترجمه مقاله استتار جنبشی در یک وضعیت تصادفی
استتار جنبشی در یک وضعیت تصادفی
Motion camouflage in a stochastic setting
چکیده- این کار مدلهای دو و سه بُعدی و قوانین کنترل هدایتی برای استتار جنبشی، که یک استراتژی تعقیب مخفیانه در طبیعت است، را به زبان ریاضی بیان میکند. در اینجا ما مدل را توسعه میدهیم تا دربرگیرنده استفاده از یک قانون تعقیب با بهره بالا در حضور نویز حسگر و نیز در مواقعی باشد که هدایت evader (گریزنده) توسط یک فرایند تصادفی فرمان داده میشود، تا نشان داده شود که (در تنظیمات مسطح) استتار جنبشی هنوز در زمان محدود قابل دسترسی است. همچنین ما خانوادهای از کنترلهای تصادفی مُجاز گریزنده را بحث کرده و بدین ترتیب برای مطالعه آتی نظریه بازیهای مربوط به استراتژیهای بهینه گریز طرحی را بیان میکنیم.
- مقدمه
استتار جنبشی یک استراتژی تعقیب مخفیانه است که مبتنی است بر کمینه کردن حرکت نسبی درکشده از یک تعقیبکننده که توسط طعمه (شکار) آن مشاهده می شود. پدیده استتار جنبشی از لحاظ زیست شناسی برای حشرات در [16] پروندهسازی شده و در[11] (بر اساس [2])، بصورت ریاضی بیان شده (مثل [4]) و اخیرا نیز به عنوان سیستم فیدبک قطعی تحلیل شده است[9] , [13]. علاوه بر این، نشان داده شده است که یک استراتژی غیرقابل تشخیص از لحاظ هندسی، توسط برخی خفاشها برای تعقیب حشرات طعمه به کار گرفته میشود [3]. تحلیل یک قانون فیدبک برای استتار جنبشی، به کمک منحنیها و چارچوبهای حرکتی در وضعیت مسطح ([9]) و سه بُعدی ([13]) اجرا شده است. نشان داده شده است که بین استتار جنبشی (که ریشه در زیستشناسی دارد)، و قانون [1]PPNG برای هدایت موشک، تطابقات نزدیکی موجود است [12]، [15] . تعقیب استتار جنبشی در متون متنوعی بیان و باعث مطالعه عمیق روی جوانبی مثل تاخیر سیستم فیدبک حسگری [14]، و فرمولهسازی تصادفی بیان شده در این کار شده است.
کار قبلی در [9] و [13] برای توصیف مسیر حرکتهای ذره و توسعه مدلهایی برای فعل و انفعالات بین تعقیبکننده- گریزنده در یک وضعیت تصادفی، از چارچوبهای طبیعی Frenet [1] استفاده کردند. در این مقاله برای بررسی تاثیرات تصادفات مثل تاثیر نویز حسگر و کنترلهای گریزندۀ فرمان داده شده با فرایندهای تصادفی، ما از مدل مسطح استفاده میکنیم. در وضعیت زیستشناختی، ما ارتباطات ممکن با ارگانیسمهایی را در نظر میگیریم که به نظر میآید از فرایندهای کنترل تصادفی استفاده میکنند، مثل حرکت "جست و خیز" در [2]chemotaxis باکتریایی (مرجع [17] را ببینید). گونههای زیادی از باکتریها از این نوع کنترل هدایتی تصادفی بهره میبرند، که ما آن را بصورت یک فرایند زمان پیوسته حالت محدود (CTFS) که توسط شمارندههای Poisson درایو میشوند، مدل میکنیم (بخش V را ببینید). انواع دیگر مانورهای گریز نامنظم به کار رفته توسط انواع حشرات، پرندهها و ماهیها در [5] بحث شده اند. در چیدمان (وضعیت) مربوط به وسائط نقلیه، ما به برخی کاربردهای ممکن در زمینههایی چون برهمکنشهای هواپیما- موشک اشاره کرده و این احتمال را در نظر میگیریم که برخی انواع مانورها و حرکات گریز تصادفی ممکن است در حقیقت در برابر سلاحهای محدود کارایی بسیار قابل توجهی داشته باشند. (ما چنین مسائلی را در این مقاله مدنظر قرار نمیدهیم اما به مساله نظریه بازیها در کار آینده اشاره خواهیم کرد.)
ما کار را این گونه ادامه میدهیم که مدل تعقیب- گریز مسطح و نیز برخی اصول اساسی استتار جنبشی را تشریح کرده و سپس اشارهای خواهیم داشت به قانون بازگشتی دستورالعمل متناسب با استتار جنبشی (MCPG) که در [9] بدست آمده است. در بخش III تاثیر نویز حسگر را در نظر میگیریم، و در بخش IV اشارهای خواهیم داشت به استتار جنبشی با یک یک گریزنده هدایتی تصادفی، با بیان و اثبات این که قانون MCPG هنوز دستیابی به استتار جنبشی در زمان محدود را میسر میسازد.
پس از ارائه شکلهای خاصی از کنترل تصادفی مجاز در بخش Vو بیان نتایج شبیهسازی در بخش VI، نتیجهگیری کرده و روند کار آینده را مشخص خواهیم کرد.
- مدل استتار جنبشی
نقطه شروع ما مدل استتار جنبشی مسطح قطعی توصیف شده در [9] است. تعمیمی از این مدل را میتوان در [13] یافت، و تحلیل بیان شده در اینجا را میتوان به کمک همان تکنیک به ابعاد سه بعدی تعمیم داد. چون اینجا ما قصد داریم روی عناصر تصادفی نوین معرفی شده در مدل استتار جنبشی تمرکز کنیم، بحث را به وضعیت مسطح محدود میکنیم. همچنین، برای تسهیل بحث فرض میکنیم که حرکت سرعت ثابتی داشته و هیچ تاخیر حسی- حرکتی فیدبکی نداشته باشد.
- خط سیر و تکامل تدریجی چارچوب
برای تکمیل هرچه بیشتر بحث، ما فرمولاسیون استتار جنبشی بیان شده در [9] را تصریح میکنیم. ذرات حرکتی با سرعت ثابت نسبت به کنترلهای هدایتی (قطعی) پیوسته مسیر حرکتهایی را تعقیب میکنند که برابر C2 باشند. بدون از دست دادن کلیت، فرض میکنیم که ذرات تعقیب کننده با سرعت واحد حرکت میکنند، و ذره گریزنده با سرعت v > 0 حرکت میکند (یعنی v متناظر است با نسبت سرعت تعقیب کننده به گریزنده). حرکت تعقیب کننده بصورت زیر توصیف میشود
و حرکت گریزنده نیز بصورت
جائی که کنترل هدایتی گریزنده، ue، تعیین شده و کنترل هدایتی تعقیبکننده، up، از قانون فیدبک بدست میآید. چارچوب متعامد بهنجار {xp, yp}، که چارچوب Frenet طبیعی مسطح برای ذره تعقیبکننده است، وقتی که ذرات تقیبکننده در خط سیر آن (rp) حرکت میکنند با زمان درگیر میشود. بطور مشابه، {xe, ye} چارچوب Frenet طبیعی مسطح متناظر با ذره گریزنده است. (در وضعیت مسطح، چارچوب Frenet طبیعی و چارچوب Frenet-Serret برهم منطبقند؛ با این حال در ابعاد بالاتر باید حتما تفاوت قائل شد [1]، [8]. )
در اینجا ما فرض میکنیم که v < 1 باشد، لذا تعقیبکننده سریعتر از گریزنده حرکت میکند. شکل 1 بیانگر روابط (1) و (2) است. (همانطور که در [9] بیان شده است، کنترلهای ue وup در واقع ورودیهای افزایش سرعت هستند چون مستقیما سرعت زاویهای ذرات را فرمان میدهند. با این وجود، سرعت هر ذره ثابت باقی میماند چون ورودیهای افزایش سرعت تنها میتوانند بصورت عمودی به مسیر لحظهای حرکت ذره اعمال شوند.)
- تعریف استتار جنبشی
در این مقاله ما روی "استتار مخفی نسبت به بیکران" متمرکز میشویم، استراتژیای که در آن مانورهای تعقیبکننده بگونهای است که از نقطه نظر گریزنده، تعقیبکننده همواره در یک وضعیت مشخصی قرار دارد. این موضوع بدین ترتیب در [9] بیان شده است
که r∞ یک بردار واحد ثابت بوده و λ یک اسکالر وابسته به زمان است. ما "بردار خط مرجع[3]" را به عنوان برداری از گریزنده تا تعقیب کننده تعریف میکنیم
و |r| طول خط مرجع است. با محدود کردن خودمان به مورد بدون تصادم (یعنی |r| ≠ 0)، ما w را به عنوان مولفه برداری تعریف میکنیم که transverse r است، یعنی
در [9] اثبات شده است که سیستم تعقیب- گریز (1)، (2) در یک وضعیت استتار جنبشی است بدون تصادم در فاصله زمانی داده شده اگر که در آن فاصله زمانی w = 0 باشد.
- فاصله از استتار جنبشی
تابع
نشان دهنده میزان دوری سیستم تعقیب- گریز از وضعیت سیستم استتار جنبشی است [9]، [13]. وقتی آنگاه سیستم در یک وضعیت استتار جنبشی است، که متناظر است با کوتاه کردن بردار خط مرجع. (برعکس،
متناظر است با چرخش خالص بردار خط مرجع، و
متناظر است با افزایش طول خالص بردار خط مرجع). اختلاف
معیاری است از فاصله سیستم تعقیب- گریز از استتار جنبشی.
برای اینکه رابطه (6) به خوبی تعریف شود، باید داشته باشیم و نیز
. شرط اول با این فرض ارضا می شود که در ابتدا
، و سپس تحلیل درگیری (برای زمان محدود) تنها تا زمانی که |r| به مقدار r0 > 0 برسد [9]، [13]. شرط دوم با یان فرض برآورده می شود که 0 < v < 1، از آنجا که
.
- قانون فیدبک برای استتار جنبشی
ما نماد را برای بردار q ای که در صفحه با اندازه π/2 در خلاف جهت عقربههای سرعت گردش کرده است به کار میبریم [9] ، [13]> وقتی اطلاعات حسگری هیچ تاخیری نداشته باشند، قانون فیدبک را چنین تعریف میکنیم:
که μ > 0 پارامتر بهره (گین) است [9]، [13]. در حالی که، اگر اطلاعات حسگری دارای تاخیری به اندازه τ باشد، آنگاه در معاده (1) عبارت up(t-τ) را جایگزین میکنیم. ملاحظه کنید که معادله (7) به خوبی تعریف شده است و با توجه به بحث مربوط به زیربخشهای قبلی، در طی تحلیل برقرار است.
- تحلیل قطعی
نتایج مهم برای سیستم فیدبک استتار جنبشی قطعی در [9]، [13] بیان شده است. این نتایج، بخصوص نتیجه مسطح در [9]، الهامی هستند برای محاسبات بخش IV .
- نویز حسگر
یکی از روشهای معرفی ویژگی تصادفیبودن به سیستم استتار جنبشی از طریق نویز حسگری است [9]. شکل 2، که از [9] بدست آمده است، نحوه مشارکت نویز حسگر را تشریح میکند.
در شکل 2(a)، خط تیره نقطهچین مسیر حرکت گریزنده و خط تیره توپر مسیر حرکت تعقیبکننده متناظر با او را تحت قانون کنترلی (7) نشان میدهد، اما به اندازهگیریهایی که نویز هم در آن وجود داشته باشد. یک فرایند نویز گاوسی گسسته در زمان مستقل با توزیع یکتا (iid) با مقدار R2 و با میانیگن صفر و قطر ماتریس کواریانس (σ2,σ2)، σ = .15|r| ، به موقیعت نسبی واقعی r در هر لحظه اندازهگیری اضافه میشود. بطور مشابه، یک فرایند نویز گاوسی زمان- گسسته iid با مقدار R2 با میانگین صفر و قطر اصلی ماتریس کواریانس،
، به سرعت نسبی واقعی
در هر لحظه اندازهگیری افزوده میشود. این دو فرایند اندازهگیری سپس توسط تعقیبکننده جهت محاسبه (7) به کار میروند. اندازهگیریهای موقعیتی روی مسیر حرکت واقعی گریزنده اضافه میشوند و میتوان دید که خطای خالص اندازهگیری با کوچکتر شدن فاصله نسبی |r| کاهش مییابد. در این شبیه سازی، بهره μ = 1 ، فاصله اندازهگیری تقریبا برابر .5 واحد زمانی است (که در طی آن یک کنترل هدایتی ثابت up اعمال میشود)، تعقیبکننده در سرعت واحد حرکت میکند و کل زمان شبیه سازی قریبا برابر 1500 واحد زمانی است.
شکل 2(b) نشان دهنده تابع هزینه متناظر Г(t) داده شده با (6) است که به عنوان تابعی از زمان رسم شده است. اختلاف بین Г(t) و -1 بیانگر نحوه انحراف سیستم از وضعیت استتار جنبشی است. بخشی از این انحراف به علت اندازهگیریهای نویزی است و بخشی نیز به علت مانورهای گریزنده است (چون بهره μ محدود است).
- گریزنده با هدایت تصادفی
- SDE برای Г
فرض کنید ue تابع قطعی از زمان نباشد، اما در مقابل توسط یک فرایند تصادفی داده شده باشد (بگونهای که بعدا آن را دقیقتر خواهیم کرد). آنگاه r و نیز فرایندهای تصادفی هستند، و Г توسط رابطه (6) بیان میشود. مشابه محاسبه
بیان شده در [9]، ما میتوانیم برای Г SDE، ذیل را استخراج کنیم (Remark 5 را ببینید):
که باید با نسخههای (1) و (2) SDE تکمیل شود، همه اینها را باید به عنوان معادلات دیفرانسیلی تصادفی از نوع Itˆo تعبیر کرد. در اینجا، همانند [9]، معادله نمایانگر چرخش π/2 درجه بردار q و بصورت پادساعتگرد در صفحه مسطح است. با جایگذاری (7) در (8) خواهیم داشت:
با توجه به اینکه
و اینکه 1-Г2 ≥ 0 ، نتیجه میگیریم
علاوه بر این، همانند تحلیل قطعی بیان شده در [9]، نامعادلات زیر را خواهیم داشت:
لذا
برای μ > 0، میتوانیم ثابتهای r0 > 0 و c0 > 0 را بگونهای تعریف کنیم که
ولذا
در نتیجه داریم
برای همه |r| ≥ r0 .
- کرانهای E[Г]
گام بعدی این است که مقادیر امدی هر دو سمت معادله (16) را بدست بیاوریم، که منجر میشود به
به شرط آنکه |r| ≥ r0. با کمک نامعادله Cauchy-Schwartz،
که از آن بدست میآید
به شرط |r| > r0. ما فرض کردهایم که ue دارای ممان دوم کراندار باشد (یعنی برای برخی ثابت umax > 0، ( و تعریف کردهایم
اکنون میتوانیم نشان دهیم که، با داشتن ، میتواینم c0 را (و در نتیجه μ را) به اندازه کافی بزرگ انتخاب کنیم تا مطمئن شویم که ( به شرط |r| > r0 ). بخصوص، انتخاب کنیم . آنگاه رابطه (19) تبدیل میشود به
جائی که ، و به شرط |r| > r0 . اکنون، رابطه (21) را میتوان به زمان ربط داد، بصورت ذیل
تا وقتی که ، جائی که و به شرط |r| > r0 .
چون فرض شده است موقعیتهای اولیه |rp(0)| و |re(0)| قطعی باشند (حتی وقتی ue تصادفی باشد)، بدست می آید که |r(0)| قطعی است. برای r0 < |r(0)| و استفاده از
میتوانیم نتیجه بگیریم که فاصله زمانی [0,T) که
زمانی است که در طی آن تضمین میکنیم |r| > r0 باشد (بدون توجه به مسیر نمونه ue ).
از شکل رابطه (22) واضح است که با انتخاب به اندازه کافی بزرگ c2، E[Г] را میتوان در زمان T به مقدار دلخواه منفی بدست آورد، اما برای این حقیت که (22) تنها برای معتبر است. همچنین، برای هر η > 0 و
با یک استدلال برعکس، برای باید رابطه برقرار باشد.
- بیان نتایج
مشابه [9] ما شناسه (زمان- محدود) "قابلیت دستیابی" وضعیت استتار جنبشی را برای وضیت تصادفی تعریف میکنیم:
تعریف 1: با داشتن سیستم (1)-(2)، با تعبیر اینکه SDE ها توسط فرایندهای تصادفی up و ue استخراج شده باشند و دارای مسیرهای نمونه پیوسته باشند، میتوانیم بگوییم که "استتار جنبشی در زمان محدود قابل دستیابی است" اگر برای هر ، زمان t1 ای موجود باشد که
.
گزاره 1: سیستم (1)-(2) را در نظر بگیرید، با قانون کنترلی (7)، و Г تعریف شده با (6)، و با فرضهای زیر:
(A1) 0 < v < 1 (و v ثابت باشد)
(A2) ue یک فرایند تصادفی با مسیرهای نمونه پیوسته تکهای و ممانهای ثانویه باشد (یعنی برای هر ثابت بگونهای که باشد، و ).
(A3) ue به شکلی است که ماتریس X = [xe ye] منجر میشود به SO (2)،
(A4) جائی که Г0 = Г(0)، و
(A5) |r(0)| > 0 .
استتار جنبشی به کمک فیدبک به بهره بالا (یعنی با انتخاب به اندازه کافی بزرگ μ > 0) قابل دستیابی در زمان محدود است.
اثبات: اثبات این موضوع در راستای گزاره 3.3 [9] برای سیستم قطعی است.
بدون از دست دادن کلیات مساله، ممکن است فرض کنیم که E[1=Г02] > e.
r0 > 0 را به گونهای انتخاب کنید که r0 < |r(0)| باشد. c2 > 0 را نیز به اندازه کافی بزرگ انتخاب کنید تا رابطه زیر را ارضا کند
که > 0 η ، و c0 را بگونهای انتخاب کنید که
سپس تعریف μ با توجه به (14) تضمین میکند که برای رابطه E[1-Г2(t1)] ≤ e برقرار شود، که T از معادله (24) بدست میآید.
نکته 1: تعریف 1 در بالا بین استتار جنبشی با فاصله خط مرجع کاهشی (یعنی Г = -1) و استتار جنبشی با فاصله خطمرجع افزایشی (یعنی Г = +1 ) تفاوتی قائل نمیشود. از طرفی، تعریف قابلیت دستیابی زمان- محدود استتار جنبشی بیان شده در [9] تنها با فاصله خط مرجع کاهشی سروکار دارد.
نکته 2: فرض (A3) معادل است با این فرض که معادله برداری مربوطه روی یک مسیر دایرهای گردش میکند. این موضوع در بخش زیر بحث میشود.
- کنترلهای تصادفی مجاز
موقع درنظرگرفتن خانوادههای ممکن فرایندهای تصادفی که بتوانند برای گریزنده به عنوان عوامل کنترلی به کار روند، ما تنها میتوانیم کنترلهایی را انتخاب کنیم که باعث شوند ماتریس چرخش X = [xe ye] روی SO (2) گردش کند، گروه قائم خاص در دو بعد. برای ue تصادفی، رابطه (2) معادله دیفرانسیلی تصادفی را فراهم میکند
فرض کنید و xt را بصورت تعریف کنید. آنگاه خواهیم داشت
میتوان نشان داد (مثلا [10] را ببینید)، که Xt روی SO(2) چرخش میکند اگر و تنها اگر (30) روی یک دایره چرخش کند.
گزاره 2: فرض کنید کنترل تصادفی گریزنده ue بصورت زیر تعریف شود:
که z یک فرایند تصادفی اسکالر ، W(.) حرکت استاندارد Brownian، و
(و فرضهای فنی مناسبی برآورده شده باشند). آنگه (28) روی SO(2) گردش خواهد کرد.
اثبات: با در نظر گرفتن (30) و (31) و اینکه برای سادگی از زمان چشمپوشی شود، داریم
فرض کنید
آنگاه (32) تبدیل میشود به
با قراردادن و استفاده از قانون It^o برای مشتقگیری، خواهیم داشت
طوری که گام آخر از تقارن- اریب[4] پیروی میکند. معادله (35) بیان میکند که برای همه زمانهای t ≥ 0 رابطه برقرار است (یعنی (30) روی یک دایره چرخش میکند)، و لذا (28) روی SO(2) گردش خواهد کرد.
نکته 3: برای کنترلهای تصادفی counter-driven به شکل زیر، نتایج مشابهی را میتوان بدست آورد
طوری که Ni، i = 1,2,..,m شمارندههای Poisson با نرخ λi هستند. (برای فرایندهای پرشی اثبات قبل را دنبال کرده و از قانون It^o استفاده کنید.
برای کنترلهای تصادفی احتمالات خاص ذیل را در نظر میگیریم:
- حرکت Brownian. با قراردادن (z,t) = 0α و β(z,t) = 1 در رابطه (31) خواهیم داشت
یعنی، ue(.) = W(.) . در این مورد، کنترل هدایتی توسط مسیرهای نمونه یک فرایند حرکت Brownian هدایت و کنترل خواهد شد. با این حال، این کنترل فرض (A2) گزاره 1 را ارضا نمیکند و لذا مجاز نیست.
- حرکت Brownian با میرایی چسبناک. فرض کنید (z,t) = -δzα و β(z,t) = σ باشد برای ثابتهای δ > 0 و
. آنگاه رابطه (31) تبدیل میشود به
که موسوم است به معادله Langevin. این نوع کنترل هر دو (A2) و (A3) را ارضا کرده و لذا مجاز است.
- "جست و خیز" (chemotaxis باکتریایی). در (36) فرض کنید (z,t) = 0α باشد و نرخها و ضرایب شمارنده Poisson را بصورت زیر در نظر بگیرید:
آنگاه (36) تبدیل میشود به
و ue یک فرایند زمان پیوسته، وضعیت محدود (CTFS) باشد که مقادیر خود را از مجموعه {-1, 0, 1} انتخاب میکند. لذا ue (A2) و (A3) را ارضا کرده و به عنوان یک کنترل تصادفی برای گریزنده مجاز است. می توانیم با انتخاب λH >> λL، chemotaxis باکتریایی را تقریب بزنیم؛ chemotaxis باکتریایی در واقع کنترل جست و خیز به کار رفته توسط برخی انواع باکتریها برای حرکت به سمت منابع غذایی می باشد. با این کنترل حلقه باز، گریزنده در مسیرهای مستقیم حرکت خواهد کرد (ue = 0)، و هرگاه شماره Poisson N3 یا N4 آتش شوند، دورهای با مدت زمان کوتاه تصادفی را انجام خواهد داد. با تغذیه اطلاعات حالت (مثل محدوده تعقیبکننده) به نرخهای شمارنده λH و λL ، این کار را میتوان بصورت کنترل حلقه بسته نیز انجام داد.
نکته 4: توجه شود که uedt = dw (یعنی ue ≈ white noise ) کنترل مناسب و مجاز برای گریزنده نیست، چون محاسبه مشابه با (35) منجر میشود به
که لزوما برابر صفر نیست، و لذا X = [xe ye] روی SO(2) گردش نخواهد کرد.
نکته 5: با فرضهای (2) و (3) مربوط به بالا (ما مشخصا علاقمند به فرایندهای ue ای مثل (38) و (40) هستیم)، برای هر مسیر ue، معادلات دیفرانسیلی تصادفی (1) و (2) با کنترل (7) به خوبی راه کارهای مناسب وضعیتهای rp = re را تعریف کردهاند. با اعمال قانون It^o به فرایندهای دسته جمعی (1)،(2)، (7) به ما معادله (8) را بدست میدهد.
- نتایج شبیهسازی
نتایح شبیهسازی بدست آمده اثبات کننده کارایی قانون تعقیب (7) نسبت به کنترل هدایتی "جست و خیز" هستند که در بخش قبلی توصیف شد، و نتایج تحلیلی ارائه شده در بخش IV را تاکید میکنند. هر شبیهسازی مبتنی است بر پارامترهای یکسان و ماشبه اما نرخ شمارندههای Poisson λH و λL برای هر شبیهسازی متفاوت است. (همچنین توجه شود که هر شبیه سازی برای تقریبا 250 واحد زمانی در گامهای .1 واحد زمانی اجرا شدند و نرخ سرعت گریزنده به سرعت تعقیبکننده ثابت و برابر v = .9 بود). شکل 3(a) مسیرهای حرکت گریزنده و تعقیبکننده را برای شبیه سازیای نشان میدهد که در آن نسبت بین نرخهای شمارنده بسیار بزرگ است (λH = 40λL) و لذا گریزنده مانورهای کمتری را انجام میدهد. (خطوط نازکتر که گریزنده و تعقیبکننده را در فواصل زمانی منظمی به هم متصل میکنند نشاندهنده تکامل بردار خط مرجع r هستند. اگر سیستم (1)، (2) در وضعیت استتار جنبشی باشد، این خطوط بصورت موازی خواهند بود.) شکلهای 3(b) و 3(c) به ترتیب رفتارهای کامل و گذرای تابع هزینه Г(t) بیان شده در (6) را نشان میدهند. (هر گراف نتایج یک بهره فیدبک تعقیبکننده کوچک μ و نیز نتایج برای یک بهره سه برابر بزرگتر را نشان میدهد.) توجه شود که تابع هزینه در مقدار مطلوب -1 تنظیم شده است (نشاندهنده بهرهگیری از استتار جنبشی) با فوران[5]های متناوب متناظر با انحرافات لحظهای نسبت به وضعیت استتار جنبشی. این فورانها متناظر هستند با زمانهایی که گریزنده چرخشهای ناگهانی میکند.
شکلهای 4 و 5 نشاندهنده نتایج برای مقادیر بزرگتر در حال افزایش λL با λH ثابت هستند (یعنی احتمال بیشتری از مانوردادن گریزنده). همانطور که در شکل 5(a) نشان داده شده است، مانوردهی افزایشی گریزنده موجب می شود تا تعقیبکننده نیازمندیهای هدایتی متناوبی را بطلبد، در عین حال که چنین کنترل گریزی ممکن است مانع دستگیری طعمه نشده و هزینه هدایتی/دستیابی تعقیبکننده را افزایش دهد. از شکل 5(b) توجه شود که کنترل هدایتی تعقیبکننده بسیار نامنظم ایجاد شده در نتیجه مقادیر بزرگ λL (یعنی نرخهای کوچکتری از λH به λL) منجر به انحرافات مکرر از استتار جنبشی میشود. شکل 5(c) رفتار گذرای اولیه Г(t) را نمایش میدهد. در صورتی که مقدار μ بزرگ باشد، رفتار اولیه Г(t) مشابه شکل 3(c) خواهد بود چون تعقیبکننده قادر است تا قبل از تغییر موضع گریزنده به وضعیت استتار جنبشی مانور دهد. برای مقادیر کوچکتر μ ، اولین مانور گریزنده اتفاق میافتد در حالی که Г(t) همچنان بسیار بزرگتر از -1 است، در نتیجه همگرایی به وضعیت استتار جنبشی به تعویق میافتد.
- پیشنهاداتی برای کار بعدی
در هر دو تحلیل قطعی استتار جنبشی در [9]، [13] و در تحلیل تصادفی بیان شده در اینجا، سرعت تعقیبکننده و گریزنده قطعی و مشخص هستند (با اینکه شاید در [13] متغیر باشد)، همچنین محدود هستند تا اطمینان حاصل شود که سرعت گریزنده به سختی کمتر از سرعت تعقیبکننده باشد. تحقیقی که ما روی اثرات رفتار تصادفی گریزنده انجام دادهایم را شاید بتوان توسعه و تعمیم داد تا بتواند تغییر تصادفی سرعت را به همراه داشته باشد. با اینکه این کار انجام شده نشان داد که یک تعقیبکننده میتواند همواره یک وضعیت استتار جنبشی را حفظ کند، اگر سرعت گریزنده قطعی و کمتر از تعقیبکننده باشد، باز سوال این خواهد بود که آیا اگر که سرعت گریزنده فقط بصورت میانگین کمتر باشد همان نتیجه برقرار است یا اگر سرتع گریزنده توسط یک فرایند تصادفی با تابع میانگین مشخص هدایت شده باشد. به علاوه، در بحث ما در رابطه با استتار جنبشی در هر دو وضعیت تصادفی یا قطعی، ما تنها به گریزنده این اجازه را دادهایم تا از استراتژی حلقه باز به جای استراتژی فیدبک استفاده کند (در حالی که تعقیبکننده از استراتژی فیدبک بهره میبرد). به زبان زیستشناختی، چنین درگیریهایی را میتوان به جای تعقیبکننده- گریزنده، درگیریهای "تعقیبکننده- مورد تعقیب قرار گرفته[6] " نامید. این مساله را میتوان مجدد در زمینه بازی دیفرانسیلی فرمولهنویسی کرد (همانطور که در [6]، [7] توصیف شده است) که در آن تعقیبکننده برای مواجه شدن با گریزنده از یک استراتژی استفاده میکند ( بیشترین نهانکاری)، و گریزنده نیز از استراتژیای بهره میبرد تا تعقیبکننده را فریب دهد (یا بیشینه کردن "قابلیت رویت" تعقیبکننده). این نوع استراتژیهای فیدبک را میتوان با استفاده از فیدبک به پارامترهای تنظیم فرایند تصادفی، در وضعیت تصادفی پیادهسازی کرد (مثلا با تغییر نرههای شمارندههای Poisson گریزنده به عنوان تابعی از محدوده تعقیبکننده). در زمینه این نوع بازی دیفرانسیلی، میتوان از خانوادهای از توابع متغییر pay-off و محدودیتهای کنترلی استفاده کرد تا به ارتباطات ممکن این نوع رفتارهای زیستشناختی پی برد. حرکت جست و خیز باکتریایی و حرکت سریع ماهی ممکن است با این نوع فرمولبندی سازگار باشند.
ترجمه شکلها:
شکل 1. تشریح مسیرهای حرکت و چارچوبهای طبیعی Fernet برای درگیری مسطح تعقیبکننده-گریزنده (شکل از مرجع [9] انتخاب شده است)
شکل 2. تعقیب با در نظر گرفتن اندازهگیریهای حسگر نویزی موجود برای تعقیبکننده: (a) مسیرهای حرکت تعقیبکننده و گریزنده، (b) تابع فاصله متناظر Г به عنوان تابعی از زمان (شکل از مرجع [9] انتخاب شده است)
شکل 3. (a) مسیر حرکت تعقیبکننده با کنترل هدایتی "جست و خیز" درایو شده با شمارنده (خط مشکی نقطهچین)، و مسیر حرکت گریزنده متناظر (خط مشکی توپر) که با توجه به رابطه (1) با کنترل داده شده از رابطه (7) گردش میکند. در این مورد، λH = 40λL. (b) تابع هزینه متناظر Г(t) داده شده با (6)، به عنوان تابعی از زمان رسم شده است. خطوط نقطهچین کم رنگ نیز متناظر هستند با مقار کوچکی از μ در جالی که خطوط توپر تیره متناظر هستند با مقداری از μ که سه برابر بزرگتر است. (c) رفتار گذرای Г(t) با یک فاصله زمانی اولیه برابر با 1/25 ام مدت مشابه نمایش داده شده در (b). خط تیرهتر متناظر است با مقدار بزرگتری از μ.
شکل 4 (a) مسرهای حرکت تعقیبکننده و گریزنده برای یک سیستم کنترل هدایتی گریزنده "جست و خیز" با λH = 20λL . (b) تابع هزینه متناظر با Г(t) داده شده با (6) که به عنوان تابعی از زمان رسم شده است. (توجه شود که رفتار گذرای Г(t) در این شبیهسازی مشابه شکل 3 بوده و لذا حذف شده است.)
شکل 5. (a) مسیرهای حرکت تعقیبکننده و گریزنده برای یک سیستم کنترل هدایتی گریزنده "جست و خیز" با λH = 6.67λL . (b) تابع هزینه متناظر با Г(t) داده شده با (6). (c) رفتار اولیه Г(t) روی 1/25 ام زمان شبیهسازی.