فناوریهای شناسایی زیستسنجی: تشخیص صوت
فناوریهای شناسایی زیستسنجی: تشخیص صوت
مقدمه:
با گسترش نیاز به امنیت و مدیریت دسترسی در محیط های فیزیکی و دیجیتال، فناوری های شناسایی زیست سنجی به یکی از مهم ترین ابزارهای کنونی تبدیل شده اند. در میان این فناوری ها، تشخیص صدا به دلیل ویژگی های منحصربه فرد خود، جایگاه ویژه ای یافته اند. تشخیص صدا، با استفاده از ویژگی های صوتی فرد، امکان واپایش دسترسی بدون تماس و با حداقل مداخله انسانی را فراهم می آورند. این فناوری در صنایع مختلف از جمله بانکداری، بهداشت، گمرک، انبارداری و مراکز تماس کاربرد دارند و به طور پیوسته در حال پیشرفت برای افزایش دقت، سرعت و امنیت هستند. این یادداشت به بررسی اصول عملکرد، کاربردها، ارزیابی عملکرد و آسیب پذیری های فناوری تشخیص صوت میپردازد.
شناسایی با صوت
فناوری تشخیص صدا برای تأیید هویت افراد از جنبه های یکتای الگوهای صوتی انسان استفاده میکند. تئوری اساسی برای تشخیص صدا این است که هر صدا برای شناسایی گوینده به اندازه کافی متمایز و یکتا باشد. شکل صحبت صوتی همانطور که یک شخص صحبت میکند تغییر میکند. اشکال مختلفی که دستگاه صوتی فرض میکند و رفتارهای گفتاری فرد به یکتا بودن اثر صدا کمک میکند.
در حال حاضر، تشخیص صدا در تعدادی از بخشهای بازار از جمله انبارداری و توزیع، تجارت الکترونیکی، خدمات مالی، دولت، مراقبتهای بهداشتی و ارتباط از راه دور استفاده میشود. اگرچه برای راهحل های با امنیت بالا به عنوان یک روش واحد واپایش دسترسی مناسب نیست، اما فناوری تشخیص صدا در امنیت پایین تر و در کاربردهای چند مودی همراه با دیگر زیستسنجی ها و فناوری های واپایش دسترسی الکترونیکی مفید است.
برخی سامانه ها ریتم، لحن و تون صدا را که فرد برای تکرار یک یا چند عبارت عبور استفاده میکند را اندازهگیری میکنند. سامانه های جدیدتر از الگوریتم های اختصاصی برای تجزیه و تحلیل دستگاه صوتی استفاده میکنند تا صدایی مطمئن ایجاد کنند. یکی دیگر از ویژگی های افزایش امنیت صوتی، استفاده از عبارات تصادفی است. یک انسان میتواند عباراتی را گوش کند و تکرار کند که ضبط ها نمیتوانند آن را تکرار کنند. فن آوری تشخیص صدا همچنان در حال پیشرفت است و سامانهها پیشرفته تر می شوند تا عبارات شامل هر کلماتی باشد که فرد بخواهد از هر زبانی استفاده کند. این عبارات تا زمانی که با آنچه بانک اطلاعاتی ثبت کرده باشد مطابق باشند اهمیتی ندارد. این ویژگی های یکتای خود صدا است که یک الگو می شود.
تشخیص صدا تنها اخیراً بهعنوان ابزاری برای واپایش دسترسی فیزیکی ظاهرشده است. تشخیص صدا تقریباً 30 سال به شکل دیگر مورد استفاده قرارگرفته است، اما تنها در چند سال گذشته پیشرفت هایی در قدرت پردازش رایانه و توسعه نرمافزارها باعث شده است تا این صنعت از نظر تجاری سودمند باشد. استفاده های قبلی بیشتر برای اهداف تشخیص گفتار (به عنوان مثال، ترجمه کلمات گفتاری به متن) یا برای دسترسی منطقی به سامانه های رایانه ای بود.
فناوریهای شناسایی زیستسنجی: تشخیص صوت
تشخیص صدا می تواند از هر وسیله ضبط صدا استفاده کند. بیشتر نرم افزارها حاوی صافی های گسترده ای برای تمایز بین نویز پس زمینه و عبارات گفتاری کاربر هستند. در محیطهای پر سر و صدا، سامانه باید از میکروفونی صافی کننده صوت و فاصله از نزدیک استفاده کند که صدای کاربر را تنها قرار داده و اکثر سر و صدای عجیب اطراف را از بین ببرد. سطح نویز محیط در نقاط دستیابی و ثبت نام باید بر انتخاب دستگاه ورودی تأثیر بگذارد.
شکل 1 عملکرد یک سامانه تشخیص صدا را نشان می دهد. در حین ثبت نام، کاربر یک عبارت یا دنباله اعداد را تکرار میکند. عبارات عبور باید به طول تقریبی 1 تا 1.5 ثانیه باشد. عبارات بسیار کوتاه فاقد داده های شناسایی کافی هستند و عبارات عبور طولانی داده های بیش از حد دارند. هر دو مورد منجر به کاهش دقت می شوند. فرد عبارت معینی را بارها و بارها تکرار میکند و ثبت نام معمولاً در حدود 30 ثانیه انجام می شود که کمی طولانی تر از سایر سامانه های واپایش دسترسی زیست سنجی است.

کاربردهای این فناوری شامل واپایش و حمل و نقل موجودی انبار، بانکی، ادارات اصلاح کننده، واپایش دسترسی عمومی، واپایش دسترسی به اطلاعات محرمانه، مراکز تماس و دسترسی به پرتالهای صوتی است.
عملکرد سامانه های تشخیص صدا میتواند با کیفیت پیام صوتی و تفاوت بین دستگاه های ثبتنام / تشخیص و محیط های مختلف متفاوت باشد. برای ثبتنام و شناسایی باید از همان نوع دستگاهها نیز استفاده شود.
خطای اعطای مجوز ورود اشتباه به فرد غیرمجاز یا عدم اعطای مجوز ورود به فرد مجاز در مقایسه با چندین فناوری زیستسنجی دیگر می توانند در این نوع سامانه بالاتر باشند. اگرچه این نرخها بسته به کاربرد سامانه مقیاسپذیر است، اما واحدها ممکن است سازگاری بالایی داشته باشند (امنیت کم) یا امنیت بالایی داشته باشند با سازگاری کم.
بسته به سامانه، روند تأیید در تشخیص صدا میتواند از 2 ثانیه تا 10 ثانیه نیاز داشته باشد. این نرخ بر کارایی تأثیر میگذارد.
اندازه الگوهای تشخیص صدا می تواند یک مشکل ذخیره سازی برای جمعیت های بزرگ کاربر ایجاد کند.
فناوریهای شناسایی زیستسنجی: تشخیص صوت
نگرانی در مورد کاربر مبتلا به بیماری که بر کیفیت پاسخ های گفتاری تأثیر می گذارد از طریق توسعه نرم افزار به حداقل رسیده است. اثرهای صوتی بر اساس دستگاه صوتی و عادت های گفتاری آموخته شده تولید میشود. سرما خوردگی در این صفات تأثیر نمیگذارد؛ اما اگر کاربر با بیماری التهاب حنجره داشته باشد دقت اندازهگیری کاهش مییابد.
هیچکس نمی تواند الگوهای صوتی منحصربه فرد شخص دیگر را تقلید کند. تقلیدها به شیوه گرایی، ریتم و تقارن برای جعل هویت فرد بستگی دارند، اما فناوری تشخیص صدا بر ویژگی های مختلفی متمرکز است که متفاوت از گوش انسان عمل میکند. هرگونه تلاش برای نقض سامانه تشخیص صدا با استفاده از جعل هویت کاربر ثبت نام شده معتبر، ناکام می ماند زیرا این سامانه بهجای روش ها و ریتم گفتار، به تون های یکتای تولید شده توسط تارهای صوتی متکی است.
حملات توسط نوار ضبط شده به سامانه واپایش دسترسی نیز بهراحتی دفع میشود. هیچ وسیله ضبط نمی تواند ویژگی های یک ثبت صوتی را به طور کامل بازتولید کند، بنابراین صداهای ضبط شده معمولاً مطابق با الگو کار نمی کنند. همچنین اکثر دستگاه های جدید از زمان واقعی برای استفاده از عبارات استفاده میکنند و پاسخ ها را نمی توان از پیش ثبت کرد.
از آنجا که مجاری صوتی با افزایش سن تغییر میکنند، اکثر سامانه های واپایش دسترسی فعال شده توسط صدا با تغییر تدریجی در صدای صوتی کاربر به مرور زمان برای جبران آن ردیابی می شوند.
مواردی که می توانند بر کیفیت الگوی تشخیص صدا تأثیر بگذارد عبارتاند از:
- دستگاه های مختلف ضبط و ثبت نام
- محیط های مختلف ثبت نام و شناسایی
- افرادی که آهسته یا به نرمی صحبت می کنند
- ضعف صدا برداری یا وجود دستگاه ضبط دیگر
- کیفیت خط تلفن، جایی که عبارت عبور به صورت تلفنی تکرار میشود.
منبع:
Biometric Security Institute. (2024). Biometric access control: Face and voice recognition technologies. Educational publication.