مجله ماشین بینایی و پردازش تصویر

مجله ماشین بینایی و پردازش تصویر

ارائه روشی نوین برای توصیف ناحیه مورد علاقه در استاندارد کدگذاری ویدئو برای ماشین‌ها

نوع مقاله : مقاله پژوهشی

نویسندگان
1 گروه اینترنت اشیا، دانشکده مهندسی کامپیوتر، دانشگاه صنعتی خواجه نصیرالدین طوسی تهران، ایران
2 گروه اینترنت اشیا، دانشکده مهندسی کامپیوتر، دانشگاه صنعتی خواجه نصیرالدین طوسی
چکیده
با گسترش کاربردهای تحلیل ویدئو در کاربردهایی مانند نظارت ویدئویی و خودروهای خودران، نیاز به روش‌های کارآمد برای کاهش پیچیدگی پردازش و فشرده‌سازی داده بیش از پیش اهمیت یافته است. در کدگذاری ویدئویی برای ماشین‌ها برخلاف استانداردهای سنتی، تمرکز بر انتقال کارآمد اطلاعات معنادار برای تحلیل ماشینی است. چالش اصلی در این حوزه، پیچیدگی بالای شبکه‌های تشخیص اشیاء و هزینه‌ سنگین پردازش آن‌ها در دستگاه‌های بلادرنگ است. در این پژوهش، یک نسخه ساده‌سازی‌شده از YOLOv8 ارائه می‌شود که با بهره‌گیری از چنددقتی‌سازی محاسبات، هرس وزنی و تقطیر دانش، پیچیدگی مدل را بدون افت محسوس عملکرد کاهش می‌دهد. همچنین یک ساختار کدگذار/کدگشا مبتنی بر تولید سه جریان ایجاد شده است تا نرخ بیت ورودی در مرحله کدگذاری کاهش یابد. نتایج تجربی نشان می‌دهد که روش پیشنهادی زمان تاخیر در تشخیص اشیاء را تا 50 درصد کاهش می‌دهد درحالی که، دقت را تنها ۰٫۰۵درصد تحت‌تأثیر قرار می‌دهد و امکان پردازش بلادرنگ ویدئو را فراهم می‌سازد. افزون بر این، تقسیم‌بندی جریان ورودی سبب کاهش نرخ بیت بدون افت محسوس در دقت تشخیص می‌شود.نوآوری اصلی این کار، ترکیب ساده‌سازی ساختاری شبکه با معماری جدید کدگذاری سه‌جریانی است که به‌طور هم‌زمان موجب کاهش پیچیدگی محاسباتی و بهبود فشرده‌سازی در سناریوهای بلادرنگ می‌شود.
کلیدواژه‌ها


مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از 24 خرداد 1405

فایل‌های تکمیلی/اضافی