تشخیص اشیا در سیستمهای نظارت تصویری(با چشمانداز فناوریهای سال 2025) قسمت اول
تشخیص اشیا در سیستمهای نظارت تصویری
(با چشمانداز فناوریهای سال 2025)
قسمت اول
این مقاله مقدمهای بر تشخیص اشیا و مروری بر پیشرفتهترین الگوریتمهای تشخیص اشیا توسط بینایی کامپیوتری(computer vision) را ارائه میدهد. تشخیص اشیا یک زمینه کلیدی در هوش مصنوعی است که به سیستمهای کامپیوتری اجازه میدهد تا با تشخیص اشیا در تصاویر یا ویدئوهای بصری، محیط خود را ببینند.
در ادامه، درخصوص موارد زیر صحبت خواهیم کرد:
- تشخیص اشیا چیست و چگونه طی 20 سال گذشته تکامل یافته است؛
- انواع روشهای تشخیص اشیا توسط بینایی کامپیوتری؛
- مثالها، موارد استفاده و کاربردهای تشخیص اشیا؛
- محبوبترین الگوریتمهای امروزی در تشخیص اشیا؛
- الگوریتمهای جدید تشخیص اشیا با یادگیری عمیق.
تشخیص اشیا در سیستمهای نظارت تصویری
Deep Learning Object Detection چیست؟
تشخیص اشیا یک کار بینایی کامپیوتری مهم است که برای شناسایی نمونههایی از اشیای بصری کلاسهای خاص (مثلاً انسانها، حیوانات، اتومبیلها یا ساختمانها) در تصاویر دیجیتالی مانند عکسها یا فریمهای ویدئو استفاده میشود. هدف از تشخیص اشیا، توسعه مدلهای محاسباتی است که بنیادیترین اطلاعات مورد نیاز برنامههای بینایی کامپیوتری را ارائه میدهد: یعنی «اشیا کجا هستند؟»
تشخیص شخص
تشخیص شخص، گونهای از تشخیص شیء است که برای تشخیص یک کلاس اولیه «شخص» در تصاویر یا فریمهای ویدئویی استفاده میشود. شناسایی افراد در ویدئوها یک کار مهم در سیستمهای نظارت تصویری مدرن است. الگوریتمهای یادگیری عمیق امروزی، نتایج قوی تشخیص فرد را ارائه میدهند. بیشتر تکنیکهای آشکارساز شخص مدرن بر روی نماهای جلویی و نامتقارن آموزش داده میشوند.
همچنین مدلهای یادگیری عمیق مانند YOLO که برای تشخیص فرد در مجموعه دادههای نمای جلویی آموزش داده شدهاند، میتوانند برای شمارش افراد نمای بالای سر نیز نتایج خوبی را ارائه نمایند
(TPR از 95% FPR بیش از 0.2%). این موارد برای ساخت راهحل شمارش افراد سفارشی با یادگیری عمیق برای تجزیه و تحلیل ویدئو استفاده میشود.
چرا یادگیری عمیق تشخیص شیء مهم است؟
تشخیص اشیا یکی از مشکلات اساسی بینایی کامپیوتر است؛ چرا که اساس بسیاری از وظایف بینایی کامپیوتری پاییندست را تشکیل میدهد؛ بهعنوان مثال، نمونه و قطعهبندی تصویر، شرح تصویر، ردیابی اشیا و موارد دیگر. ازجمله کاربردهای تشخیص اشیا میتوان به تشخیص عابر پیاده، تشخیص حیوانات، تشخیص وسیله نقلیه، شمارش افراد، تشخیص چهره، تشخیص متن، تخمین وضعیت یا تشخیص پلاک اشاره نمود.
براساس بینایی کامپیوتر، «Slope of Enlightenment/شیب روشنگری» به «toward the/فلات بهرهوری» در چرخه هایپ گارتنر تغییر کرده است. با پیشرفت فناوری، افزایش پذیرش و کاربردهای عملی در صنایع، بینایی کامپیوتر، از جمله تشخیص اشیا، در حال ورود به مرحله ثبات و یکپارچگی گسترده است. اکنون تمرکز از مراحل آزمایشی به پالایش و بهینهسازی برنامههای کاربردی تغییر کرده است که گامی مهم به سوی تحقق کامل هدف و اثرگذاری آن بر شرکتها در بخشهای مختلف است.
با استنتاج ML برای تشخیص اشیای جفتشده
تشخیص اشیا در سیستمهای نظارت تصویری
تشخیص اشیا و یادگیری عمیق
در چند سال اخیر، پیشرفت سریع در تکنیکهای یادگیری عمیق، شتاب فناوری تشخیص اشیا را بسیار تسریع کرده است. با شبکههای تشخیص اشیای یادگیری عمیق و قدرت محاسباتی پردازندههای گرافیکی، عملکرد آشکارسازها و ردیابهای شی بسیار بهبود یافته و به پیشرفتهای قابل توجهی در تشخیص اشیا دست یافته است.
سیستم هوش مصنوعی کاربردی براساس الگوریتم YOLOv7 آموزشدیده برای تشخیص هواپیما
یادگیری ماشینی (ML) شاخهای از هوش مصنوعی (AI) است و شامل یادگیری الگوهایی از نمونهها یا دادههای نمونه میشود، زیرا ماشین به دادهها دسترسی پیدا میکند و میتواند از آن یاد بگیرد (یادگیری نظارتشده بر روی تصاویر حاشیهنویسی).
یادگیری عمیق یک شکل تخصصی از یادگیری ماشینی است که شامل یادگیری در مراحل مختلف میشود.
پیشرفت نرمافزار Computer Vision Deep Learning باعث تشخیص و ردیابی اشیای اصلی در طیف وسیعی از برنامههای بینایی کامپیوتری مدرن است. بهعنوان مثال، تشخیص اشیای نظارت هوشمند مراقبتهای بهداشتی، رانندگی خودکار، نظارت تصویری هوشمند، تشخیص ناهنجاری، دید ربات و بسیاری از موارد دیگر را امکانپذیر میکند. هر برنامه بینایی AI معمولاً به ترکیبی از الگوریتمهای مختلف نیاز دارد که یک جریان (خط لوله) از مراحل پردازش چندگانه را تشکیل میدهد.
فناوری تصویربرداری هوش مصنوعی در سالهای اخیر پیشرفت زیادی کرده است. طیف گستردهای از دوربینها از جمله دوربینهای امنیتی، تجاری و دوربینهای مدار بسته را میتوان استفاده کرد. با استفاده از یک پلتفرم نرمافزاری هوش مصنوعی مانند Viso Suite، نیازی به خرید دوربینهای هوش مصنوعی با قابلیت شناسایی تصویر داخلی نیست، زیرا با ویدئوی دیجیتال میتوان هر دوربین فیلمبرداری را با استفاده از مدلهای تشخیص اشیا آنالیز نمود.
در نتیجه، برنامهها انعطافپذیرتر میشوند؛ زیرا دیگر به حسگرهای سفارشی، نصب گرانقیمت و سیستمهای سختافزاری تعبیهشده (که باید هر 3 تا 5 سال یکبار تعویض شوند) وابسته نیستند.
تشخیص اشیا در سیستمهای نظارت تصویری
پیشرفتهای سختافزار Computer Vision
در همین حال، قدرت محاسباتی بهطور چشمگیری افزایش یافته و بسیار کارآمدتر میشود. در سالهای گذشته، پلتفرمهای محاسباتی از طریق پردازش چند هستهای، واحدهای پردازش گرافیکی (GPU) و شتابدهندههای هوش مصنوعی مانند واحدهای پردازش تانسور (TPU) به سمت موازیسازی حرکت کردند. از این رو، توسعه سریع در شبکههای عصبی کانولوشنال عمیق (CNN) و قدرت محاسباتی پیشرفته GPU، محرکهای اصلی پیشرفت بزرگ تشخیص اشیا مبتنی بر بینایی کامپیوتری هستند. این پیشرفتها یک مفهوم کلیدی معماری به نام Edge AI را فعال کردهاند که به آنها لبه هوشمند یا لبه توزیعشده نیز میگویند و بارهای سنگین هوش مصنوعی را از Cloud به منبع داده نزدیکتر میکنند. این موضوع منجر به سیستمهای توزیعشده، مقیاسپذیر و بسیار کارآمدتر میشود که امکان استفاده از بینایی رایانه را در سیستمهای تجاری و حیاتی میدهد.
هوش مصنوعی Edge شامل IoT یا AIoT، یادگیری ماشین روی دستگاه با دستگاههای Edge است و به زیرساختهای پیچیده نیاز دارد. سازمانها میتوانند با استفاده از این پلتفرمها، برنامههای تشخیص اشیای خود را ساخته، مستقر کرده و مقیاسبندی نمایند و در عین حال از تمام آن فناوریهای پیشرفته بهره ببرند.
معایب و مزایای تشخیص اشیا
آشکارسازهای شیء فوقالعاده انعطافپذیر هستند و میتوانند برای طیف وسیعی از وظایف و کاربردهای سفارشی و با هدف خاص آموزش ببینند. شناسایی خودکار اشیا، افراد و صحنهها میتواند اطلاعات مفیدی را برای خودکارسازی وظایف (آماری، بازرسی، تأیید و غیره) در زنجیرههای ارزش کسبوکار فراهم نماید.
با این حال، نقطه ضعف اصلی آشکارسازهای شیء این است که از نظر محاسباتی بسیار گران هستند و به قدرت پردازش قابل توجهی نیاز دارند. بهخصوص، زمانی که مدلهای تشخیص شیء در مقیاس به کار گرفته میشوند، هزینههای عملیاتی میتواند به سرعت افزایش یابد و امتیاز اقتصادی موارد استفادهشده را به چالش بکشد.