مجله ماشین بینایی و پردازش تصویر

مجله ماشین بینایی و پردازش تصویر

داده افزایی با استفاده از شبکه‌های مولد تخاصمی جهت بهبود باز تشخیص افراد

نوع مقاله : مقاله پژوهشی

نویسندگان
1 دانشجوی دکترای رشته برق - مخابرات، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران
2 عضو هیات علمی پژوهشگاه ارتباطات و فناوری اطلاعات
3 دانشکده مهندسی برق و کامپیوتر، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران
چکیده
در سال‌های اخیر، پژوهش‌ها در زمینه بازتشخیص افراد به‌طور پیوسته پیشرفت کرده‌اند. در این راستا، شبکه‌های عصبی متخاصم به موفقیت چشمگیری دست یافته‌اند و به عنوان یک رویکرد برجسته در این حوزه شناخته می‌شوند. در این مقاله، با بررسی کاربرد انواع شبکه‌های متخاصم در بازتشخیص افراد، از ترکیب شبکه ATNet و مدل Pix2Pix برای داده‌افزایی استفاده شده است. مدل Pix2Pix که در تبدیل تصویر به تصویر در زمینه‌های مختلف موفقیت‌آمیز بوده، از الگوریتم PatchGAN به عنوان متمایزکننده و U-Net به عنوان تولیدکننده بهره می‌گیرد. روش پیشنهادی برای داده‌افزایی مبتنی بر وجود تصاویر فرد مورد نظر از چهار جهت (روبه‌رو، پشت، سمت چپ و راست) است. پس از دسته‌بندی تصاویر در مجموعه‌داده‌های Market-1501 و CUHK03، تصاویر نماهای ناموجود با استفاده از شبکه ATNet تولید شده‌اند. مقایسه های انجام‌شده نشان‌دهنده بهبود عملکرد روش‌های پیشرو در بازتشخیص افراد با داده افزایی پیشنهادی در این مقاله است.
کلیدواژه‌ها