مجله ماشین بینایی و پردازش تصویر

مجله ماشین بینایی و پردازش تصویر

تفریق پس‌زمینه با استفاده از شبکه‌های عصبی حافظه کوتاه-مدت بلند عمیق و سازوکار توجه

نوع مقاله : مقاله پژوهشی

نویسندگان
1 کارشناس ارشد از دانشکده مهندسی برق و کامپیوتر، دانشگاه تحصیلات تکمیلی صنعتی و فناوری پیشرفته، کرمان، ایران
2 دانشکده مهندسی برق و کامپیوتر، دانشگاه تحصیلات تکمیلی صنعتی و فناوری پیشرفته، کرمان، ایران
3 گروه کامپیوتر و فناوری اطلاعات، پژوهشگاه علوم و تکنولوژی پیشرفته و علوم محیطی، دانشگاه تحصیلات تکمیلی صنعتی و فناوری پیشرفته، کرمان، ایران
چکیده
جداسازی اشیاء متحرک از پس‌زمینه یکی از مسایل مهم و کاربردی در حوزه بینایی ماشین است. در این زمینه راهکارهای بسیار زیادی ارائه شده است. دسته‌ای از این راهکارها مبتنی بر یادگیری عمیق و شبکه‌های عصبی عمیق هستند که عمدتا به صورت نظارت شده و برون خط هستند. در این مقاله یک روش برخط و بدون نظارت مبتنی برای جداسازی پس‌زمینه از پیش‌زمینه در داده‌های ویدیویی ارائه شده است که در آن پس‌زمینه به صورت یک ماتریس کم رتبهL توسط یک شبکه عصبی عمیق استخراج می‌شود و پیش‌زمینه به صورت یک ماتریس تنک با تفریق L از تصویر اصلی به دست می‌آید. در طراحی شبکه عصبی فوق، از یک شبکه حافظه کوتاه-مدت بلند (LSTM) مبتنی بر سازوکار توجه استفاده شده است. یادگیری این روش به صورت بدون نظارت انجام می‌شود و می‌تواند آموزش ببیند به قسمت‌هایی از داده‌ها و تصویر که پیش‌زمینه در آن وجود دارد، وزن بیشتری اختصاص داده و توجه و تمرکز بیشتری داشته باشد. جهت ارزیابی مدل پیشنهادی، پایگاه داده LASIEST که تعداد زیادی از چالش‌های حوزه تفریق پس‌زمینه را پوشش می‌دهد، انتخاب شده است. کارایی راهکار پیشنهادی به طور کمی با استفاده از معیارهای استاندارد یادآوری، دقت و اندازه‌ی F-measuresارزیابی و با تعدادی از روش‌های معتبر و مطرح مقایسه شده که به ترتیب به میزان 8%، 10%، و 5% بهبود داشته است. علاوه بر این از نظر کیفی و شهودی نیز با راهکارهای موجود مورد مقایسه قرار گرفته که موفق به اخذ نتایج مطلوب‌تر شده است.
کلیدواژه‌ها