هوش مصنوعی به زبان ساده-1
هوش مصنوعی به زبان ساده-1
در قسمت اول به زبان ساده در مورد این که هوش مصنوعی چیست و اهمیت داده های کلان در هوش مصنوعی کدام است و میزان دقت در هوش مصنوعی بایستی چگونه ارزیابی شود مطالبی بیان خواهد شد.
در قسمت دوم به چگونگی تشخیص زنده بودن کاربران در موقع ارتباط یا ثبت نام و گستره شناسنامه های ثبت نام کنندگان و پشتیبانی از داده های یک هوش مصنوعی می پردازد.
هوش مصنوعی و یادگیری ماشین به زبان ساده
معیارهایی که اهمیت دارند
چگونه فناوری تأیید هویت را ارزیابی کنیم
بیایید به طور مستقیم به سادهسازی مفاهیم فنی بپردازیم تا آنچه را که واقعاً نیاز دارید بدانید.
هوش مصنوعی (AI) فناوریای است که به یک ماشین اجازه میدهد رفتار انسانی را شبیهسازی کند. یک دستیار هوشمند در تلفن شما مثال خوبی است — او میتواند آنچه را که میگویید درک کند و بر اساس درخواست شما اقدام کند.
یادگیری ماشین (ML) زیرمجموعهای از هوش مصنوعی است که به یک ماشین اجازه میدهد به طور خودکار از دادههای گذشته یاد بگیرد.
اگر دستیار هوشمند تلفن شخصی میتواند بر اساس تاریخچه گوش دادن شما، یک آهنگ برایتان پیشنهاد دهد، در واقع این؛ یک یادگیری ماشین در عمل است.
اما باید توجه کنید هدف هوش مصنوعی، ایجاد فناوری هوشمند است که به ماشینها اجازه دهد مسائل پیچیده را حل کند، هدف یادگیری ماشین ها نیز بر این است که آنها اجازه داشته باشند تا از دادهها یاد بگیرند و بتوانند خروجی دقیقی ارائه دهند.
به طور مثال هوش مصنوعی برای فعالسازی یک راهحل تأیید هویت حیاتی؛ تلاش می کند تا بخشهای مختلف مدرک شناسایی (ID) که کاربر قبلا ارائه داده است را با عکس های سلفی زنده مقایسه کند.
چرا به روز بودن یادگیری ماشین از طریق اضافه نمودن داده ها توسط کارشناسان به اندازه دانشی که قبلا به ماشین داده شده است مهم است زیرا این کار به شناسائی رونده ای جدید خلاف کاری کمک خواهد کرد.
اما یادگیری ماشین ها به اندازهای که به نظر میرسد خودآموز نیستند. دانشمندان داده باید پروتکلهای یادگیری (که به آنها الگوریتم نیز گفته میشود) و مجموعههای داده جامع و حاشیهنویسی شدهای را توسعه دهند که به هوش مصنوعی اجازه دهد تا یاد بگیرد چگونه دادههای مشابه را در آینده بررسی و شناسایی کنند.
در مثال دستیار هوشمند، الگوریتم ممکن است به آن بگوید که به تمام آهنگهایی که در سال گذشته گوش دادهاید نگاه کند، ویژگیهای مشترک در سازبندی و ژانر را پیدا کرده و آهنگهای جدید با ویژگیهای مشابه را شناسایی کند.
بهطور مشابه، در تأیید هویت، دانشمندان؛ داده الگوریتمهایی ایجاد میکنند که به راهحل دستور میدهند تا به دنبال ویژگیهای مشترک در هر دو نوع تراکنشهای قانونی و تقلبی بگردد، از جمله جزئیات در مورد این که فیلدهای داده در شناسنامه باید چگونه به نظر برسند و چگونه میتوان دستکاری عکس یا داده را شناسایی کرد.
هیچ برنامهنویسی نمیتواند دستورالعملهای دقیقی بنویسد که تمام سرنخهای ممکن برای هر شناسنامه در کره زمین را پوشش دهد. در عوض، از طریق یادگیری ماشین، سیستم، بررسیهایی بر روی الگوهای هدف (یا خانوادههای الگوها) انجام میدهد تا قادر شود این سرنخها را در طول مسیر کشف کند.
به همین دلیل، هوش مصنوعی و یادگیری ماشین، که زمانی بهعنوان فناوری پیشرفته در نظر گرفته میشدند، اکنون نیز برای ارائه یک راهحل تأیید هویت ضروری هستند.
کلید این کار در این است که اطمینان حاصل شود، فروشنده منابع مناسب را برای توسعه الگوریتمهای پیچیده سرمایهگذاری کرده و آنها را بر روی دادههای صحیح، آموزش داده است.
اهمیت دادههای کلان
برای به حداکثر رساندن دقت هوش مصنوعی خود، باید یک مجموعه داده وسیع و متنوع داشته باشید. به عنوان مثال، در جومیو، ما بیش از ۱ میلیارد تراکنش از سرتاسر جهان پردازش کردهایم. گفتن این که تمام موارد را دیدهایم ایده آل است اما در واقع از هر شناسنامه جعلی و تلاش خلافکارانه جهت بهبود کیفیت که توانسته به ما کمک کند استفاده شده است.
مهم نیست که تکنولوژی جدید چقدر تحول زا است، اما اگر تامینکننده اولیه، از دادههای واقعی و زیادی مربوط به تولید برای آموزش به آن تکنولوژی را در اختیار نداشته باشد، به سادگی ماشین عملکرد خوبی نخواهد داشت. این موضوع جهت پرهیز از اشتباه اهمیت دارد.
در یک مثال معروف، اتحادیه آزادیهای مدنی آمریکا، ابزار شناسایی چهره آمازون را با مقایسه عکسهای هر یک از اعضای کنگره ایالات متحده در برابر پایگاه داده تصاویر چهره ۲۵,۰۰۰ مجرم آزمایش کرد. نتیجه این بود که به غلط ۲۸ نفر از اعضای کنگره به عنوان مجرم شناسایی شدند و ۳۹٪ از این مجرمان افراد رنگین پوست بودنده اند که تنها ۲۰٪ از کنگره را تشکیل میدهند.
به همین دلیل است که انتخاب یک تأمینکننده با تجربه که قبلاً حجم زیادی از تراکنشهای تأیید هویت را با نمایندگی کافی از جمعیتهای مختلف جهان پردازش کرده، حیاتی است. به طور مثال اگر یادگیری ماشین شما تنها بر روی چهرههای نروژی آموزش ببیند، بعید است این سیستم عملکرد خوبی بر روی مشتریان آسیایی و آفریقایی داشته باشد.
علاوه بر این، اگر تراکنشهای خلافکارانه در مجموعه داده به درستی به عنوان تقلب برچسبگذاری نشوند، اتوماسیون فقط مشکلات موجود را مقیاسدهی (آمار دهی) خواهد کرد، بنابراین ضروری است که تامینکننده اولیه؛ تیمی از کارشناسان داشته باشد که دادهها را به درستی برچسبگذاری کنند تا دقت ماشین به حداکثر برسد.
درک معیارهای دقت
دقت می تواند با پردازش خود نشان دهد راهحل احراز هویت چقدر خوب توانسته بازیگران بد را از پلتفرم شما دور نگه دارد و در نتیجه تا چه تعداد مشتریان قانونی را به داخل راه داده است. اگرچه این موضوع به نظر ساده میرسد، روشهای زیادی برای اندازهگیری دقت وجود دارد.
چهار معیار رایج عبارتند از:
دقت رد اعتبارسنجی تقلب (که در علم داده به آن دقت نیز گفته میشود) — درصد معاملههایی که به عنوان تقلب رد کردهاید و در واقع تقلب بودند. اگر ۱۰۰ معامله اعتبارسنجی را به عنوان شناسائی تقلب رد کردهاید و ۹۹ مورد از آنها واقعاً تقلبی بودند هر چند یکی از آنها در واقع یک مشتری قانونی بود، دقت رد اعتبارسنجی تقلب شما ۹۹% است. هرچه این عدد بالاتر باشد، دقت تبدیل شما بهتر است. این به این معناست که مشتریان قانونی شما رد نمیشوند.
نرخ کشف تقلب (که در علم داده به آن یادآوری نیز گفته میشود) — درصد تقلبهای واقعی که به درستی رد شدهاند. اگر ۱۰۰ خلافکار تلاش کردند به پلتفرم شما وارد شوند و شما ۹۹ نفر از آنها را شناسایی کردید، نرخ کشف تقلب شما ۹۹% است. هرچه این عدد بالاتر باشد، دقت شناسائی تقلب شما بهتر است. این به کاهش تهدید عبور مجرمان کمک میکند.
درک معیارهای دقت
نرخ رد نادرست (FRR) درصد مشتریان معتبر که به نادرستی رد شدهاند. این عدد باید تا حد ممکن پایین باشد تا حداکثر تبدیل را به ارمغان بیاورد و بتوانید کسب و کار خود را رشد دهید.
نرخ پذیرش نادرست (FAR) درصد مشتریان تقلبی که به نادرستی تأیید شدهاند. این عدد نیز باید تا حد ممکن پایین باشد تا ایمنی پلتفرم شما حداکثر شود.
دقت رد تقلب = (جستجوهایی صحیحی که به عنوان تقلب رد شدهاند) / (تمام جستجوهایی که به عنوان تقلب رد شدهاند)
مثال:
99 جستجو که به درستی رد شدهاند / 100 جستجو رد شده = 99% دقت رد تقلب
نرخ کشف تقلب = (جستجوهایی که به درستی به عنوان تقلب رد شدهاند) / (تمام جستجوهای تقلبی پردازش شده)
مثال:
99 جستجو که به درستی رد شدهاند / 100 جستجو تقلبی = 99% نرخ کشف تقلب
نرخ رد کاذب = (جستجوهایی که به غلط به عنوان تقلب رد شدهاند) / (تمام جستجوهای تایید شده + تمام جستجوهایی که به عنوان تقلب رد شدهاند)
مثال:
1 جستجو که به غلط رد شده است / (65 جستجو تایید شده + 35 جستجو رد شده) = 1% نرخ رد کاذب
نرخ پذیرش کاذب = (جستجوهای تقلبی که به غلط تایید شدهاند) / (تمام جستجوهای تایید شده + تمام جستجوهایی که به عنوان تقلب رد شدهاند)
مثال:
1 جستجو که به غلط تایید شده است / (65 جستجو تایید شده + 35 جستجو رد شده) = 1% نرخ پذیرش کاذب
تأمینکنندگان معتبر تأیید هویت، این آمارها را بسیار جدی میگیرند و تیمهای باکیفیتی دارند که به طور مداوم به بررسی، اندازهگیری و بهبود دقت راهحل اختصاص می پردازند.
شرکت جمیو به طور منظم بخش قابل توجهی از معاملات تأیید هویت را بررسی میکند تا اطمینان حاصل کند موتور تأیید ما به درستی شناساییهای تقلب را علامتگذاری کرده و مشتریان خوب را در زمان مناسب تأیید میکند.
هماهنگی سیگنالهای تهدید
در حین فرآیند جذب مشتری، قبل از این که حتی شناسنامه فرد را بررسی کنید و از او بخواهید سلفی بگیرد، میتوانید یک سری بررسیهای تقلب بدون اصطکاک و با هزینه کم انجام دهید.
به عنوان مثال، میتوانید بررسیهایی بر روی دستگاه آنها انجام دهید بدون این که نیازی به ورودی از سمت آنها باشد. اگر آنها در حال تلاش برای باز کردن حساب از گوشیای باشند که در معاملات خلافکارانه دیگر استفاده شده یا سیگنالهای تهدید دیگری با آن مرتبط است، میتوانید بررسیهای سختگیرانهتری را به فرآیند جذب اضافه کنید.
این قابلیت برای انجام چندین بررسی و تنظیم دینامیک جریان کار بر اساس ورودیهای زمان واقعی، “هماهنگی” نامیده میشود و به شرکتها این امکان را میدهد که تجربهای بدون اصطکاک برای مشتریان معتبر خود فراهم کنند و نظارت بیشتری بر روی افراد با تهدید بالاتر داشته باشند. نتیجه این امر هم افزایش نرخ تبدیل و هم افزایش جلوگیری از تقلب است.
برای این که این راهحل مؤثرتر باشد، هماهنگی ها باید انعطافپذیر باشد و به شما این امکان را بدهد که جریانهای کاری دینامیکی طراحی کنید تا نیازهای دقیق کسبوکار خود را برآورده کنید. علاوه بر این، باید مجموعهای گسترده از سیگنالهای تهدید را ارائه دهد که بتوانید از بین آنها انتخاب کنید، مانند اثر انگشت دستگاه، بررسی آدرس، سن و اعتبار ایمیل و تهدید جغرافیایی. (زیست سنجی)
به عنوان مثال، شرکت جمیو بیش از 500 منبع داده جهانی در دسترس دارد که تمامی سیگنالهای تهدیدی که ممکن است نیاز داشته باشید را فراهم میکند.
هنگام بررسی سیگنالهای تهدید متعدد، بسیار مفید است که تمام نتایج را در یک داشبورد واحد مشاهده کنید به جای این که مجبور باشید به برنامههای مختلف مراجعه کنید. حتی بهتر این است که یک نمره تهدید تجمیعی داشته باشید که ارزیابی فوری از تهدید توسط مشتری را بالقوه به شما ارائه دهد.