ترکیبی از هوش خارجی با هوش داخلی
استفاده از هوش خارجی در هوش داخلی یا ترکیبی از گروه های فوق، به این معنی است که بخش های خاصی از قابلیت های ممکن در خارج انجام شود و فقط قطعات خاصی در داخل قرار می گیرند. در این نوع ردیابی ممکن است توسط یک دوربین خارجی انجام شود و سیستم ناوبری در داخل، یا بالعکس. به عنوان مثال سیستمی به منظور تست الگوریتم برای هلیکوپتر چهار روتور بدون سرنشین ساخته شده است. در این سیستم، دو دوربین به منظور برآورد موقعیت کنترل از راه دور هلیکوپتر چهار روتور مورد استفاده قرار می گیرد. یکی از دوربین ها روی زمین و دیگری در هلیکوپتر قرار گرفته است. هر یک از این دوربین ها به کامپیوتر های مختلفی که توسط یک شبکه به هم متصلند، کنترل می گردند. دوربین اطلاعات را به کامیپوترهای خارجی از طریق شبکه ارسال کرده و دوربین های خارجی اطلاعات را به هلیکوپتر با بهره گرفتن از دستگاه کنترل از راه دور و یک پورت سریال ارسال می کند. عیب این کار اضافه شدن وزن به هلیکوپتر و مقدار تجهیزات گران قیمت است [۲].
پردازش تصویر
پردازش تصویر روشی برای تبدیل یک تصویر به صورت دیجیتال و انجام برخی از عملیات بر روی آن، به منظور دریافت یک تصویر بهبود یافته و یا برای استخراج برخی از اطلاعات مفید از آن است. در اوایل دهه ۶۰ سفینه فضایی رنجر ۷ متعلق به ناسا شروع به ارسال تصاویر تلویزیونی مبهمی از سطح ماه به زمین کرد. استخراج جزئیات تصویر برای یافتن محلی برای فرود سفینه آپولو نیازمند اعمال تصمیماتی روی تصاویر بود[۱۸]. این کار مهم به عهده لابراتوار قرار داده شد. بدین ترتیب زمینه تخصصی پردازش تصاویر رقمی آغاز گردید و مثل تمام تکنولوژی های دیگر سریعاً استفاده های متعدد پیدا کرد. از سال ۱۹۶۴ تاکنون، موضوع پردازش تصویر، رشد فراوانی کرده است. علاوه بر برنامه تحقیقات فضایی، اکنون از فنون پردازش تصویر، در موارد متعددی استفاده می شود. برای نمونه در پزشکی شیوه های رایانه ای Contrast تصویر را ارتقا می دهند یا این که برای تعبیر آسانتر تصاویر اشعه ایکس یا سایر تصاویر پزشکی، سطوح شدت روشنایی را با رنگ، نشانه گذاری می کنند[۱۸]. متخصصان جغرافیایی نیز از این روش ها یا روش های مشابه برای مطالعه الگوهای آلودگی هوا که با تصویر برداری هوایی و ماهواره ای بدست آمده است، استفاده می کنند. در باستان شناسی برای تصویربرداری سه بعدی از اجسام و فسیل ها مورد استفاده قرار می گیرد[۱۸]. در موزه های نیز روش های پردازش تصویر برای بازیابی عکس های مات شده ای که تنها باقی مانده آثار هنری نادر هستند، مورد استفاده قرار می گیرد[۱۸]. کاربردهای موفق دیگری از پردازش تصویر را نیز می توان در نجوم، زیست شناسی، پزشکی هسته ای، صنعت بیان کرد. پردازش تصویر در صنایع مختلف از جمله صنایع هوافضا،صنایع بستهبندی و چاپ، صنایع خودرو، داروسازی و پزشکی، صنایع الکترونیک، صنایع غذایی، صنایع فولاد، آلومینیوم، مس و …،صنایع سلولوزی(کاغذ، مقوا، کارتن)، صنایع لوله، پروفیل فلزی، لوله پلیمری و کابل، صنایع منسوجات (پارچه، موکت، فرش و بافتههای صنعتی)، صنایع کاشی، سرامیک کاربردهای فراوانی دارد [۸].
ردیابی شی
امروزه ردیابی اجسام کاربردهای بسیاری در زندگی بشر دارد. از کاربردهای نظامی گرفته تا کاربردهای نظارتی، رباتیک، بینایی ماشین، کنترل ترافیک، اتوماسیون و غیره [۲۳]. هر سیستم بینایی که مرتبط با دنبال کردن، تفسیر و تشخیص اشیای متحرک در تصویر است، نیازمند به آشکارسازی مطمئن و بخش بندی نواحی متناظر شی متحرک می باشد. آشکارسازی لکه های متحرک، حجم اطلاعات مورد پردازش در مراحل بعدی مانند دنبال کردن و تشخیص را کاهش می دهد. چون در این مراحل فقط پیکسل های تغییر کرده باید مورد آزمایش قرار گیرند. معمولترین روش برای آشکارسازی حرکت در یک دنباله از تصاویر، تفاضل پس زمینه است که به وسیله محاسبه تفاضل قدر مطلق بین فریم ورودی و یک مدل پس زمینه فیلم ویدئویی، به دست می آید. در این پایان نامه الگوریتمی جدید برای ردیابی هدف به کمک مدل کردن پس زمینه ارائه گردیده است. برای مدل کردن پس زمینه از دو مدل مختلف استفاده شده است. در مدل پیشنهادی اول از تبدیل موجک برای مدل کردن پس زمینه بهره برده و از مزایای تبدیل موجک یعنی فیلترینگ و کاهش نرخ داده بهره گرفته است. در ادامه مدل پس زمینه کدبوک (codebook) مورد مطالعه قرار گرفته و پیشنهاداتی به منظور بهینه کردن آن ارائه شده است. در پایان روشی جدید برای ردیابی هدف بر اساس مدل های پیشنهادی و تکنیک تجزیه مقادیر یگانه، پیاده سازی گردیده است.
چالش های در ردیابی شی
برخی از چالش های اصلی که ممکن است مسیر دارای یک شی با آن مواجه شود عبارتند از:
تغییرات روشنایی - که نور و یا طول نور در دنباله تصویر را تغییر می دهد. تغییر در روشنایی یک مشکل در ردیابی شی به عنوان رنگ پس زمینه و اشیاء و ردیابی شدن ایجاد می کند. این کار اغلب در محیط های بیرون از منزل رخ می دهد، اما می تواند در محیط داخل ساختمان با نورپردازی ثابت کنترل شود.
انسداد - یک شیء به خودی خود، شی دیگری یا پس زمینه را از نظر پنهان کند [۲۳].
پس زمینه متحرک - ما که در تصویر در حال دنبال کردن جسم های متحرک در صحنه می باشیم. اشیاء خاصی نیز ممکن است در پس زمینه در حرکت باشند. در محیط بیرون از منزل، این می تواند شامل جریان آب، افراد یا ماشین های در حال حرکت باشند.
انتخاب ویژگی
ویژگی های خاص باید از یک شی به منظور متمایز کردن آن از بقیه صحنه استخراج شود. این ویژگی باید با توجه به نوع و ظاهر شی انتخاب شوند. جهت انتخاب ویژگی های مختلف شی در تصویر، تغییرات بزرگ به عنوان مثال نور و نویز می تواند تاثیر منفی در تشخیص داشته باشد.
رنگ
رنگ از محبوب ترین ویژگی های بصری است که می تواند در پردازش تصویر مورد استفاده قرار گیرد. این ویژگی برای اشیاء، که از یکنواخت بودن آن ها جلوگیری می کند. بهبود یک روش ردیابی که تنها از اطلاعات رنگ در یک تصویر استفاده می کند، نشان داده شده است [۷]. روش ردیابی رنگ بکار رفته، شناسایی مناطق رنگی در هر فریم تصویر است. رنگ نیز به عنوان یکی از ویژگی های پیگیری روشن اشیاء رنگی مورد استفاده قرار می گیرد[۲۲]. از آنجا که رنگ قرمز، سبز و آبی (RGB) به تغییرات نور بسیار حساس است[۲۲]، روش تبدیل رنگ RGB به فضای رنگ YUV تبدیل و استفاده می شود. YUV رنگ مفید است زیرا جزء شدت، از جزء رنگ جداست که به آن معنی می توان به طور جداگانه پرداخته شده است. این تبدیل در توالی تصویر که در آن رنگ جسم کاملا مجزا از پس زمینه بود قابل مشاهده است. رنگ جسم در حال ردیابی بسیار شبیه به اشیاء دیگر در پس زمینه است. رنگ ها همچنین نباید در صحنه از تغییرات نور شدید برخوردار گردند، که این عمل به عنوان یک رنگ با شدت نور بیش از حد و متفاوت خواهد بود. با این حال، راه های غلبه بر آن وجود دارد. روش ردیابی شیء ترکیبی از توزیع رنگ با فیلتر ذره پیشنهاد شده است. ذرات فیلتر برای تخمین حالت پویا، که بدان معنی توزیع رنگ به روز شده برای تغییر در نور اجازه می دهد، مشاهده می شود[۱۴]. نتایج مطالعه را می توان در شکل ۱٫۲، که در آن از روش ردیابی شیء بر روی یک خودرو مورد آزمایش قرار گرفته دیده می شود[۱۴].
لبه
اطلاعات لبه یکی دیگر از ویژگی های محبوب در ردیابی اشیا است که می تواند مورد استفاده قرار گیرد، این روش حساسیت کمتری نسبت به تغییرات نور از رنگ دارد. لبه نیز دارای نویز بسیار قوی می باشد[۱۹].
شکل ۱،۲: توزیع رنگ و فیلتر کردن ذرات برای پیگیری یک وسیله نقلیه مورد استفاده قرار گرفت[۱۴].
یافت لبه هایی که در آن تغییرات شدت بزرگ در تصویر وجود دارد درون دایره مشاهده می شود. بسیاری از الگوریتم های تشخیص لبه وجود دارند و این به طور کلی با الگوریتم ردیابی که مرز اشیاء مشخص می شود، ردیابی می گردد. در [۹] چهار الگوریتم تشخیص لبه مشترک مقایسه شده از جمله تشخیص لبه Canny ، تشخیص لبه Sobel و تشخیص لبه Sarkar-Boyer و تشخیص لبه Nalwa-Binford. که نتایج مقایسه نشان داد که تشخیص لبه به زمینه وابسته است و هر الگوریتم نتایج بهتری از دیگر الگوریتم ها برای یک تصاویر خاص نمایش می دهد[۹]. آشکارساز Canny، به طور کلی به عنوان بهترین روش همه جانبه برای تشخیص لبه شناخته شده است [۱۹]. تشخیص لبه Canny ایجاد شده در سال ۱۹۸۶ در مقاله ای تحت عنوان “یک روش محاسباتی برای تشخیص لبه” ارائه شده است. سه معیارهای اصلی آن عبارتند از:
نرخ خطای کم، از دست ندادن لبه های مهم.
یافت نقاط لبه، فاصله بین آنها.
حداقل پاسخ، به معنی شناسایی فقط لبه یک جسم
در [۲۲] از فیلتر Canny به عنوان بخشی از الگوریتم ردیابی شی مبتنی بر رنگ thresholding استفاده شده است. که یک تابع در کتابخانه منبع باز OpenCV جهت نمایش لبه های شیء وجود دارد [۲۲]. شکل ۲،۲ تصویری را نشان می دهد که در آن یک بخش به رنگ زرد انتخاب شده و برای پیدا کردن لبه در آن از فیلتر canny کمک گرفته شده است.
شکل ۲،۲: لبه در یک تصویر با بهره گرفتن از ماسک فیلتر Canny [22].
بافت
بافت یکی دیگر از ویژگی هایی است که اقدامات خواصی مانند صافی و نظم یک شی را نمایش می دهد. این ویژگی، مانند لبه، بسیار حساس به تغییرات نور است. اگر بافت هدف، بسیار متمایز از پس زمینه باشد بافت یک انتخاب خوب برای استخراج ویژگی است. برنامه ممکن است در یک تصویر به انجام استخراج بافت های مختلف انحراف یا واریانس، آنتروپی و محدوده های محلی بپردازد[۱۹]. اطلاعات بافت در اغلب موارد همراه با اطلاعات رنگ یک شئ جهت انجام ردیابی شئ همراه است. در [۱۳] یک مدل دیگر الگوریتم ردیابی شئ می باشد که در آن از هیستوگرام رنگ و بافت مشترک استفاده می شود. این هیستوگرام برای ردیابی اشیاء مختلف، از جمله مردم، ماشین و چهره از الگوریتم تغییر میانگین استفاده کرده است.
تشخیص شی
تشخیص شی یا می تواند بر داده های زمانی یا داده های فضایی استوار باشد [۱۲]. زمانی که داده ها متکی بر پس زمینه ایستا و شی در حال جنبش هست بنابراین با تفاوت بین دو فریم قبلی شی قابل مشاهده می باشند. تفریق پس زمینه در تشخیص شی بسیار مطلوب است. داده های زمانی، فرض می کند که تنها یک شی متحرک در صحنه وجود دارد. این به این معنی است که هر تفاوت بین عکس به دلیل حرکت شی می باشد. Thresholding از اطلاعات مکانی یا روش های آماری استفاده می کند [۱۲].
تفریق پس زمینه
تفریق پس زمینه، یک راه تشخیص اشیاء در حال حرکت با پیدا کردن تفاوت بین تصویر فعلی و زمینه است. تفریق پس زمینه متکی به یک دوربین ثابت می باشد و دوربین مورد استفاده در پردازش تصویر، جهت تفریق پس زمینه نمی تواند متحرک باشد[۵]. تفریق پس زمینه با بهره گرفتن از تنها دو عکس انجام می شود، در [۱۲] یک روش بهبود یافته معرفی شده که استفاده از تصاویر متعدد آن راقوی تر می سازد. روش رایج تفریق زمینه مورد بررسی قرار گرفت. نتایج هر یک از این روش در زیر دیده می شود. در شکل ۳٫۲ Basic، اشاره به تمکین فریم دارد. G -1، اشاره به گاوسی دارد. GMM، اشاره مدل مخلوط گاوسی دارد. KDE، اشاره به برآورد چگالی و MinMax اشاره به حداقل و حداکثر تفاوت بین فریم اشاره دارد.
شکل ۳،۲: نمایش نتایج: انجام چند الگوریتم تفریق زمینه های مختلف در یک فریم از یک ویدئو [۵].
ساده ترین شکل تفریق پس زمینه تفاوت فریم subtracts کنونی فریم تصویر از فریم تصویر های قبلی است. این روش تنها روش خوب تشخیص شی ای که دائما در حال حرکت است می باشد و شی از پس زمینه کاملا متمایز است[۱].
قطعه بندی تصاویر
قطعه بندی تصویر، جهت تقسیم نمودن قطعات یا مناطق مشابه استفاده می شود. در بینایی کامپیوتر ، تقسیم بندی تصویر، فرایند پارتیشن بندی یک عکس دیجیتال را به بخش های متعدد (مجموعه ای از پیکسل ها ، به عنوان superpixels شناخته می شود) می باشد. هدف از قطعه بندی تصویر این است که یک تصویر را به چیزی که تجزیه و تحلیل آن معنی دار تر و آسان تر می باشد تقسیم نمائیم [۱]. قطعه بندی تصویر به طور معمول برای قرار دادن اشیاء و مرز (خطوط، منحنی ها، و غیره) در تصاویر استفاده می شود . در حقیقت، تقسیم بندی تصویر فرایند تخصیص دادن یک برچسب به هر پیکسل در یک تصویر است به طوری که پیکسل با همان برچسب ویژگی های بصری خاص به نمایش در می آید. در نتیجه تقسیم بندی تصویر مجموعه ای از بخش هایی است که در مجموع، کل تصویر یا مجموعه ای از خطوط استخراج شده از تصویر پوشش داده شده را نمایش می دهد. هر یک از پیکسل ها در منطقه ای مشابه با توجه به برخی از ویژگی ها و محاسبات، مانند رنگ، شدت، و یا بافت را دارا می باشند. مناطق مجاور با توجه به همان ویژگی ها به طور قابل توجهی متفاوت هستند[۱].
آخرین نظرات