تشخیص اشیا در سیستم‌های نظارت تصویری(با چشم‌انداز فناوری‌های سال 2025) قسمت اول

0

تشخیص اشیا در سیستم‌های نظارت تصویری

(با چشم‌انداز فناوری‌های سال 2025)

قسمت اول

       این مقاله مقدمه‌ای بر تشخیص اشیا و مروری بر پیشرفته‌ترین الگوریتم‌های تشخیص اشیا توسط بینایی کامپیوتری(computer vision) را ارائه می‌دهد. تشخیص اشیا یک زمینه کلیدی در هوش مصنوعی است که به سیستم‌های کامپیوتری اجازه می‌دهد تا با تشخیص اشیا در تصاویر یا ویدئوهای بصری، محیط خود را ببینند.

در ادامه، درخصوص موارد زیر صحبت خواهیم کرد:

  • تشخیص اشیا چیست و چگونه طی 20 سال گذشته تکامل یافته است؛
  • انواع روش‌های تشخیص اشیا توسط بینایی کامپیوتری؛
  • مثال‌ها، موارد استفاده و کاربردهای تشخیص اشیا؛
  • محبوب‌ترین الگوریتم‌های امروزی در تشخیص اشیا؛
  • الگوریتم‎‌های جدید تشخیص اشیا با یادگیری عمیق.

تشخیص اشیا در سیستم‌های نظارت تصویری

Deep Learning Object Detection چیست؟

تشخیص اشیا یک کار بینایی کامپیوتری مهم است که برای شناسایی نمونه‌هایی از اشیای بصری کلاس‌های خاص (مثلاً انسان‌ها، حیوانات، اتومبیل‌ها یا ساختمان‌ها) در تصاویر دیجیتالی مانند عکس‌ها یا فریم‌های ویدئو استفاده می‌شود. هدف از تشخیص اشیا، توسعه مدل‌های محاسباتی است که بنیادی‌ترین اطلاعات مورد نیاز برنامه‌های بینایی کامپیوتری را ارائه می‌دهد: یعنی «اشیا کجا هستند؟»

تشخیص اشیا یک کار اساسی در بینایی کامپیوتری برای شناسایی و بومی‌سازی اشیا در تصاویر و ویدئو است
تشخیص اشیا یک کار اساسی در بینایی کامپیوتری برای شناسایی و بومی‌سازی اشیا در تصاویر و ویدئو است

تشخیص شخص

تشخیص شخص، گونه‌ای از تشخیص شیء است که برای تشخیص یک کلاس اولیه «شخص» در تصاویر یا فریم‌های ویدئویی استفاده می‌شود. شناسایی افراد در ویدئوها یک کار مهم در سیستم‌های نظارت تصویری مدرن است. الگوریتم‌های یادگیری عمیق امروزی، نتایج قوی تشخیص فرد را ارائه می‌دهند. بیشتر تکنیک‌های آشکارساز شخص مدرن بر روی نماهای جلویی و نامتقارن آموزش داده می‌شوند.

همچنین مدل‌های یادگیری عمیق مانند YOLO که برای تشخیص فرد در مجموعه داده‌های نمای جلویی آموزش داده شده‌اند، می‌توانند برای شمارش افراد نمای بالای سر نیز نتایج خوبی را ارائه نمایند
(TPR از 95% FPR بیش از 0.2%). این موارد برای ساخت راه‌حل شمارش افراد سفارشی با یادگیری عمیق برای تجزیه و تحلیل ویدئو استفاده می‌شود.

 

تشخیص لحظه‌ای شخص در خطوط تولید
تشخیص لحظه‌ای شخص در خطوط تولید

چرا یادگیری عمیق تشخیص شیء مهم است؟

تشخیص اشیا یکی از مشکلات اساسی بینایی کامپیوتر است؛ چرا که اساس بسیاری از وظایف بینایی کامپیوتری پایین‌دست را تشکیل می‌دهد؛ به‌عنوان مثال، نمونه و قطعه‌بندی تصویر، شرح تصویر، ردیابی اشیا و موارد دیگر. ازجمله کاربردهای تشخیص اشیا می‌توان به تشخیص عابر پیاده، تشخیص حیوانات، تشخیص وسیله نقلیه، شمارش افراد، تشخیص چهره، تشخیص متن، تخمین وضعیت یا تشخیص پلاک اشاره نمود.

براساس بینایی کامپیوتر، «Slope of Enlightenment/شیب روشنگری» به «toward the/فلات بهره‌وری» در چرخه هایپ گارتنر تغییر کرده است. با پیشرفت فناوری، افزایش پذیرش و کاربردهای عملی در صنایع، بینایی کامپیوتر، از جمله تشخیص اشیا، در حال ورود به مرحله ثبات و یکپارچگی گسترده است. اکنون تمرکز از مراحل آزمایشی به پالایش و بهینه‌سازی برنامه‌های کاربردی تغییر کرده است که گامی مهم به سوی تحقق کامل هدف و اثرگذاری آن بر شرکت‌ها در بخش‌های مختلف است.

با استنتاج ML برای تشخیص اشیای جفت‌شده

تشخیص اشیا در سیستم‌های نظارت تصویری

تشخیص اشیا و یادگیری عمیق

در چند سال اخیر، پیشرفت سریع در تکنیک‌های یادگیری عمیق، شتاب فناوری تشخیص اشیا را بسیار تسریع کرده است. با شبکه‌های تشخیص اشیای یادگیری عمیق و قدرت محاسباتی پردازنده‌های گرافیکی، عملکرد آشکارسازها و ردیاب‌های شی بسیار بهبود یافته و به پیشرفت‌های قابل توجهی در تشخیص اشیا دست یافته است.

سیستم هوش مصنوعی کاربردی براساس الگوریتم YOLOv7 آموزش‌دیده برای تشخیص هواپیما
سیستم هوش مصنوعی کاربردی براساس الگوریتم YOLOv7 آموزش‌دیده برای تشخیص هواپیما

سیستم هوش مصنوعی کاربردی براساس الگوریتم YOLOv7 آموزش‌دیده برای تشخیص هواپیما

 

یادگیری ماشینی (ML) شاخه‌ای از هوش مصنوعی (AI) است و شامل یادگیری الگوهایی از نمونه‌ها یا داده‌های نمونه می‌شود، زیرا ماشین به داده‌ها دسترسی پیدا می‌کند و می‌تواند از آن یاد بگیرد (یادگیری نظارت‌شده بر روی تصاویر حاشیه‌نویسی).

یادگیری عمیق یک شکل تخصصی از یادگیری ماشینی است که شامل یادگیری در مراحل مختلف می‌شود.

 

پیشرفت نرم‌افزار Computer Vision Deep Learning  باعث تشخیص و ردیابی اشیای اصلی در طیف وسیعی از برنامه‌های بینایی کامپیوتری مدرن است. به‌عنوان مثال، تشخیص اشیای نظارت هوشمند مراقبت‌های بهداشتی، رانندگی خودکار، نظارت تصویری هوشمند، تشخیص ناهنجاری، دید ربات و بسیاری از موارد دیگر را امکان‌پذیر می‌کند. هر برنامه بینایی AI معمولاً به ترکیبی از الگوریتم‌های مختلف نیاز دارد که یک جریان (خط لوله) از مراحل پردازش چندگانه را تشکیل می‌دهد.

فناوری تصویربرداری هوش مصنوعی_1
فناوری تصویربرداری هوش مصنوعی_1

 

فناوری تصویربرداری هوش مصنوعی در سال‌های اخیر پیشرفت زیادی کرده است. طیف گسترده‌ای از دوربین‌ها از جمله دوربین‌های امنیتی، تجاری و دوربین‌های مدار بسته را می‌توان استفاده کرد. با استفاده از یک پلتفرم نرم‌افزاری هوش مصنوعی مانند Viso Suite، نیازی به خرید دوربین‌های هوش مصنوعی با قابلیت شناسایی تصویر داخلی نیست، زیرا با ویدئوی دیجیتال می‌توان هر دوربین فیلمبرداری را با استفاده از مدل‌های تشخیص اشیا آنالیز نمود.

در نتیجه، برنامه‌ها انعطاف‌پذیرتر می‌شوند؛ زیرا دیگر به حسگرهای سفارشی، نصب گران‌قیمت و سیستم‌های سخت‌افزاری تعبیه‌شده (که باید هر 3 تا 5 سال یک‌بار تعویض شوند) وابسته نیستند.

تشخیص اشیا در سیستم‌های نظارت تصویری

پیشرفت‌های سخت‌افزار Computer Vision

در همین حال، قدرت محاسباتی به‌طور چشمگیری افزایش یافته و بسیار کارآمدتر می‌شود. در سال‌های گذشته، پلتفرم‌های محاسباتی از طریق پردازش چند هسته‌ای، واحدهای پردازش گرافیکی (GPU) و شتاب‌دهنده‌های هوش مصنوعی مانند واحدهای پردازش تانسور (TPU) به سمت موازی‌سازی حرکت کردند. از این رو، توسعه سریع در شبکه‌های عصبی کانولوشنال عمیق (CNN) و قدرت محاسباتی پیشرفته GPU، محرک‌های اصلی پیشرفت بزرگ تشخیص اشیا مبتنی بر بینایی کامپیوتری هستند. این پیشرفت‌ها یک مفهوم کلیدی معماری به نام Edge AI را فعال کرده‌اند که به آن‌ها لبه هوشمند یا لبه توزیع‌شده نیز می‌گویند و بارهای سنگین هوش مصنوعی را از Cloud به منبع داده نزدیک‌تر می‌کنند. این موضوع منجر به سیستم‌های توزیع‌شده، مقیاس‌پذیر و بسیار کارآمدتر می‌شود که امکان استفاده از بینایی رایانه را در سیستم‌های تجاری و حیاتی می‌دهد.

هوش مصنوعی Edge شامل IoT یا AIoT، یادگیری ماشین روی دستگاه با دستگاه‌های Edge است و به زیرساخت‌های پیچیده نیاز دارد. سازمان‌ها می‌توانند با استفاده از این پلتفرم‌ها، برنامه‌های تشخیص اشیای خود را ساخته، مستقر کرده و مقیاس‌بندی نمایند و در عین حال از تمام آن فناوری‌های پیشرفته بهره ببرند.

پلتفرم برنامه کاربردی بینایی کامپیوتری انتها به انتها_1
پلتفرم برنامه کاربردی بینایی کامپیوتری انتها به انتها_1

 معایب و مزایای تشخیص اشیا

آشکارسازهای شیء فوق‌العاده انعطاف‌پذیر هستند و می‌توانند برای طیف وسیعی از وظایف و کاربردهای سفارشی و با هدف خاص آموزش ببینند. شناسایی خودکار اشیا، افراد و صحنه‌ها می‌تواند اطلاعات مفیدی را برای خودکارسازی وظایف (آماری، بازرسی، تأیید و غیره) در زنجیره‌های ارزش کسب‌وکار فراهم نماید.

با این حال، نقطه ضعف اصلی آشکارسازهای شیء این است که از نظر محاسباتی بسیار گران هستند و به قدرت پردازش قابل توجهی نیاز دارند. به‌خصوص، زمانی که مدل‌های تشخیص شیء در مقیاس به کار گرفته می‌شوند، هزینه‌های عملیاتی می‌تواند به سرعت افزایش یابد و امتیاز اقتصادی موارد استفاده‌شده را به چالش بکشد.

 

ادامه مطلب…

 

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.