تصویرحفاظت فیزیکیطراحی سیستم هاکنترل دسترسی تردد

فناوری‌های شناسایی زیست‌سنجی: تشخیص صوت

نویسنده: کاربر 1 آخرین بروزرسانی 30 اردیبهشت 1404

مقدمه:
با گسترش نیاز به امنیت و مدیریت دسترسی در محیط‌ های فیزیکی و دیجیتال، فناوری ‌های شناسایی زیست ‌سنجی به یکی از مهم‌ ترین ابزارهای کنونی تبدیل شده‌ اند. در میان این فناوری‌ ها، تشخیص صدا به دلیل ویژگی‌ های منحصربه‌ فرد خود، جایگاه ویژه ‌ای یافته ‌اند. تشخیص صدا، با استفاده از ویژگی‌ های صوتی فرد، امکان واپایش دسترسی بدون تماس و با حداقل مداخله انسانی را فراهم می‌ آورند. این فناوری در صنایع مختلف از جمله بانکداری، بهداشت، گمرک، انبارداری و مراکز تماس کاربرد دارند و به ‌طور پیوسته در حال پیشرفت برای افزایش دقت، سرعت و امنیت هستند. این یادداشت به بررسی اصول عملکرد، کاربردها، ارزیابی عملکرد و آسیب‌ پذیری ‌های فناوری تشخیص صوت می‌پردازد.

شناسایی با صوت

فناوری تشخیص صدا برای تأیید هویت افراد از جنبه ‌های یکتای الگوهای صوتی انسان استفاده می‌کند. تئوری اساسی برای تشخیص صدا این است که هر صدا برای شناسایی گوینده به ‌اندازه کافی متمایز و یکتا باشد. شکل صحبت صوتی همان‌طور که یک شخص صحبت می‌کند تغییر می‌کند. اشکال مختلفی که دستگاه صوتی فرض می‌کند و رفتارهای گفتاری فرد به یکتا بودن اثر صدا کمک می‌کند.

در حال حاضر، تشخیص صدا در تعدادی از بخش‌های بازار از جمله انبارداری و توزیع، تجارت الکترونیکی، خدمات مالی، دولت، مراقبت‌های بهداشتی و ارتباط از راه دور استفاده می‌شود. اگرچه برای راه‌حل ‌های با امنیت بالا به‌ عنوان یک روش واحد واپایش دسترسی مناسب نیست، اما فناوری تشخیص صدا در امنیت پایین‌ تر و در کاربردهای چند مودی همراه با دیگر زیست‌سنجی ‌ها و فناوری ‌های واپایش دسترسی الکترونیکی مفید است.

برخی سامانه‌ ها ریتم، لحن و تون صدا را که فرد برای تکرار یک یا چند عبارت عبور استفاده می‌کند را اندازه‌گیری می‌کنند. سامانه ‌های جدیدتر از الگوریتم‌ های اختصاصی برای تجزیه‌ و تحلیل دستگاه صوتی استفاده می‌کنند تا صدایی مطمئن ایجاد کنند. یکی دیگر از ویژگی ‌های افزایش امنیت صوتی، استفاده از عبارات تصادفی است. یک انسان می‌تواند عباراتی را گوش کند و تکرار کند که ضبط ‌ها نمی‌توانند آن را تکرار کنند. فن ‌آوری تشخیص صدا همچنان در حال پیشرفت است و سامانه‌ها پیشرفته ‌تر می ‌شوند تا عبارات شامل هر کلماتی باشد که فرد بخواهد از هر زبانی استفاده کند. این عبارات تا زمانی که با آنچه بانک اطلاعاتی ثبت کرده باشد مطابق باشند اهمیتی ندارد. این ویژگی ‌های یکتای خود صدا است که یک الگو می ‌شود.

تشخیص صدا تنها اخیراً به‌عنوان ابزاری برای واپایش دسترسی فیزیکی ظاهرشده است. تشخیص صدا تقریباً 30 سال به شکل دیگر مورد استفاده قرارگرفته است، اما تنها در چند سال گذشته پیشرفت ‌هایی در قدرت پردازش رایانه و توسعه نرم‌افزارها باعث شده است تا این صنعت از نظر تجاری سودمند باشد. استفاده‌ های قبلی بیشتر برای اهداف تشخیص گفتار (به‌ عنوان ‌مثال، ترجمه کلمات گفتاری به متن) یا برای دسترسی منطقی به سامانه‌ های رایانه ‌ای بود.

فناوری‌های شناسایی زیست‌سنجی: تشخیص صوت

عملکرد

تشخیص صدا می ‌تواند از هر وسیله ضبط صدا استفاده کند. بیشتر نرم ‌افزارها حاوی صافی‌‌ های گسترده ‌ای برای تمایز بین نویز پس ‌زمینه و عبارات گفتاری کاربر هستند. در محیط‌های پر سر و صدا، سامانه باید از میکروفونی صافی‌ کننده صوت و فاصله از نزدیک استفاده کند که صدای کاربر را تنها قرار داده و اکثر سر و صدای عجیب اطراف را از بین ببرد. سطح نویز محیط در نقاط دستیابی و ثبت ‌نام باید بر انتخاب دستگاه ورودی تأثیر بگذارد.

شکل 1 عملکرد یک سامانه تشخیص صدا را نشان می‌ دهد. در حین ثبت‌ نام، کاربر یک عبارت یا دنباله اعداد را تکرار می‌کند. عبارات عبور باید به طول تقریبی 1 تا 1.5 ثانیه باشد. عبارات بسیار کوتاه فاقد داده ‌های شناسایی کافی هستند و عبارات عبور طولانی داده‌ های بیش ‌از حد دارند. هر دو مورد منجر به کاهش دقت می‌ شوند. فرد عبارت معینی را بارها و بارها تکرار می‌کند و ثبت ‌نام معمولاً در حدود 30 ثانیه انجام می‌ شود که کمی طولانی ‌تر از سایر سامانه ‌های واپایش دسترسی زیست ‌سنجی است.

شکل 1: تشخیص با صوت

کاربرد

کاربردهای این فناوری شامل واپایش و حمل ‌و نقل موجودی انبار، بانکی، ادارات اصلاح‌ کننده، واپایش دسترسی عمومی، واپایش دسترسی به اطلاعات محرمانه، مراکز تماس و دسترسی به پرتال‌های صوتی است.

ارزیابی عملکرد

عملکرد سامانه ‌های تشخیص صدا می‌تواند با کیفیت پیام صوتی و تفاوت بین دستگاه‌ های ثبت‌نام / تشخیص و محیط ‌های مختلف متفاوت باشد. برای ثبت‌نام و شناسایی باید از همان نوع دستگاه‌ها نیز استفاده شود.

خطای اعطای مجوز ورود اشتباه به فرد غیرمجاز یا عدم اعطای مجوز ورود به فرد مجاز در مقایسه با چندین فناوری زیست‌سنجی دیگر می ‌توانند در این نوع سامانه بالاتر باشند. اگرچه این نرخ‌ها بسته به کاربرد سامانه مقیاس‌پذیر است، اما واحدها ممکن است سازگاری بالایی داشته باشند (امنیت کم) یا امنیت بالایی داشته باشند با سازگاری کم.

بسته به سامانه، روند تأیید در تشخیص صدا می‌تواند از 2 ثانیه تا 10 ثانیه نیاز داشته باشد. این نرخ بر کارایی تأثیر می‌گذارد.

اندازه الگوهای تشخیص صدا می ‌تواند یک مشکل ذخیره‌ سازی برای جمعیت ‌های بزرگ کاربر ایجاد کند.

فناوری‌های شناسایی زیست‌سنجی: تشخیص صوت

آسیب ‌پذیری ‌ها

نگرانی در مورد کاربر مبتلا به بیماری که بر کیفیت پاسخ‌ های گفتاری تأثیر می‌ گذارد از طریق توسعه نرم ‌افزار به حداقل رسیده است. اثرهای صوتی بر اساس دستگاه صوتی و عادت ‌های گفتاری آموخته‌ شده تولید می‌شود. سرما خوردگی در این صفات تأثیر نمی‌گذارد؛ اما اگر کاربر با بیماری التهاب حنجره داشته باشد دقت اندازه‌گیری کاهش می‌یابد.

هیچ‌کس نمی ‌تواند الگوهای صوتی منحصربه ‌فرد شخص دیگر را تقلید کند. تقلیدها به شیوه گرایی، ریتم و تقارن برای جعل هویت فرد بستگی دارند، اما فناوری تشخیص صدا بر ویژگی ‌های مختلفی متمرکز است که متفاوت از گوش انسان عمل می‌کند. هرگونه تلاش برای نقض سامانه تشخیص صدا با استفاده از جعل هویت کاربر ثبت ‌نام ‌شده معتبر، ناکام می ‌ماند زیرا این سامانه به‌جای روش ‌ها و ریتم گفتار، به تون‌ های یکتای تولید شده توسط تارهای صوتی متکی است.

حملات توسط نوار ضبط‌ شده به سامانه واپایش دسترسی نیز به‌راحتی دفع می‌شود. هیچ وسیله ضبط نمی ‌تواند ویژگی ‌های یک ثبت صوتی را به‌ طور کامل بازتولید کند، بنابراین صداهای ضبط ‌شده معمولاً مطابق با الگو کار نمی‌ کنند. همچنین اکثر دستگاه ‌های جدید از زمان واقعی برای استفاده از عبارات استفاده می‌کنند و پاسخ‌ ها را نمی ‌توان از پیش ثبت کرد.

از آنجا که مجاری صوتی با افزایش سن تغییر می‌کنند، اکثر سامانه ‌های واپایش دسترسی فعال‌ شده توسط صدا با تغییر تدریجی در صدای صوتی کاربر به‌ مرور زمان برای جبران آن ردیابی می ‌شوند.

مواردی که می ‌توانند بر کیفیت الگوی تشخیص صدا تأثیر بگذارد عبارت‌اند از:

دستگاه ‌های مختلف ضبط و ثبت ‌نام
محیط‌ های مختلف ثبت ‌نام و شناسایی
افرادی که آهسته یا به نرمی صحبت می ‌کنند
ضعف صدا برداری یا وجود دستگاه ضبط دیگر
کیفیت خط تلفن، جایی که عبارت عبور به ‌صورت تلفنی تکرار می‌شود.

منبع:

Biometric Security Institute. (2024). Biometric access control: Face and voice recognition technologies. Educational publication.