هوش مصنوعی به زبان ساده-1

0

هوش مصنوعی به زبان ساده-1

در قسمت اول به زبان ساده در مورد این که هوش مصنوعی چیست و اهمیت داده های کلان  در هوش مصنوعی کدام است و میزان دقت در هوش مصنوعی بایستی چگونه ارزیابی شود مطالبی بیان خواهد شد.

در قسمت دوم به چگونگی تشخیص زنده بودن کاربران  در موقع ارتباط یا ثبت نام و گستره شناسنامه های ثبت نام کنندگان و پشتیبانی از داده های یک هوش مصنوعی می پردازد.

هوش مصنوعی و یادگیری ماشین به زبان ساده

معیارهایی که اهمیت دارند 

چگونه فناوری تأیید هویت را ارزیابی کنیم

بیایید به طور مستقیم به ساده‌سازی مفاهیم فنی بپردازیم تا آنچه را که واقعاً نیاز دارید بدانید.

هوش مصنوعی (AI) فناوری‌ای است که به یک ماشین اجازه می‌دهد رفتار انسانی را شبیه‌سازی کند. یک دستیار هوشمند در تلفن شما مثال خوبی است — او می‌تواند آنچه را که می‌گویید درک کند و بر اساس درخواست شما اقدام کند.

یادگیری ماشین (ML) زیرمجموعه‌ای از هوش مصنوعی است که به یک ماشین اجازه می‌دهد به طور خودکار از داده‌های گذشته یاد بگیرد.

 اگر دستیار هوشمند تلفن شخصی می‌تواند بر اساس تاریخچه گوش دادن شما، یک آهنگ برایتان پیشنهاد دهد، در واقع این؛ یک یادگیری ماشین در عمل است.

اما باید توجه کنید هدف هوش مصنوعی، ایجاد فناوری هوشمند است که به ماشین‌ها اجازه ‌دهد مسائل پیچیده را حل کند، هدف یادگیری ماشین ها نیز بر این است که آنها اجازه داشته باشند تا از داده‌ها یاد بگیرند و بتوانند خروجی دقیقی ارائه دهند.

به طور مثال هوش مصنوعی برای فعال‌سازی یک راه‌حل تأیید هویت حیاتی؛ تلاش می کند تا بخش‌های مختلف مدرک شناسایی (ID) که کاربر قبلا ارائه داده است را با عکس های سلفی زنده مقایسه کند.

چرا به روز بودن یادگیری ماشین از طریق  اضافه نمودن  داده ها  توسط کارشناسان به اندازه  دانشی که قبلا به ماشین داده شده است مهم است زیرا این کار به شناسائی رونده ای  جدید خلاف کاری کمک خواهد کرد.

اما یادگیری ماشین ها به اندازه‌ای که به نظر می‌رسد خودآموز نیستند. دانشمندان داده باید پروتکل‌های یادگیری (که به آن‌ها الگوریتم نیز گفته می‌شود) و مجموعه‌های داده جامع و حاشیه‌نویسی شده‌ای را توسعه دهند که به هوش مصنوعی اجازه ‌دهد تا یاد بگیرد چگونه داده‌های مشابه را در آینده بررسی و شناسایی کنند.

در مثال دستیار هوشمند، الگوریتم ممکن است به آن بگوید که به تمام آهنگ‌هایی که در سال گذشته گوش داده‌اید نگاه کند، ویژگی‌های مشترک در سازبندی و ژانر را پیدا کرده و آهنگ‌های جدید با ویژگی‌های مشابه را شناسایی کند.

به‌طور مشابه، در تأیید هویت، دانشمندان؛ داده الگوریتم‌هایی ایجاد می‌کنند که به راه‌حل دستور می‌دهند تا به دنبال ویژگی‌های مشترک در هر دو نوع تراکنش‌های قانونی و تقلبی بگردد، از جمله جزئیات در مورد این که فیلدهای داده در شناسنامه باید چگونه به نظر برسند و چگونه می‌توان دستکاری عکس یا داده را شناسایی کرد.

هیچ برنامه‌نویسی نمی‌تواند دستورالعمل‌های دقیقی بنویسد که تمام سرنخ‌های ممکن برای هر شناسنامه در کره زمین را پوشش دهد. در عوض، از طریق یادگیری ماشین، سیستم، بررسی‌هایی بر روی الگوهای هدف (یا خانواده‌های الگوها) انجام می‌دهد تا قادر شود این سرنخ‌ها را در طول مسیر کشف کند.

به همین دلیل، هوش مصنوعی و یادگیری ماشین، که زمانی به‌عنوان فناوری پیشرفته در نظر گرفته می‌شدند، اکنون نیز برای ارائه یک راه‌حل تأیید هویت ضروری هستند.

کلید این کار در این است که اطمینان حاصل شود، فروشنده منابع مناسب را برای توسعه الگوریتم‌های پیچیده سرمایه‌گذاری کرده و آن‌ها را بر روی داده‌های صحیح، آموزش داده است.

اهمیت داده‌های کلان

برای به حداکثر رساندن دقت هوش مصنوعی خود، باید یک مجموعه داده وسیع و متنوع داشته باشید. به عنوان مثال، در جومیو، ما بیش از ۱ میلیارد تراکنش از سرتاسر جهان پردازش کرده‌ایم. گفتن این که تمام موارد را دیده‌ایم ایده آل است اما در واقع از هر شناسنامه جعلی و تلاش خلافکارانه جهت بهبود کیفیت که توانسته به ما کمک  کند استفاده  شده است.

مهم نیست که تکنولوژی جدید چقدر تحول زا است، اما اگر تامین‌کننده اولیه، از داده‌های واقعی و زیادی مربوط به تولید برای آموزش به آن تکنولوژی را در اختیار نداشته باشد، به سادگی ماشین عملکرد خوبی نخواهد داشت. این موضوع جهت پرهیز از  اشتباه اهمیت دارد.

در یک مثال معروف، اتحادیه آزادی‌های مدنی آمریکا، ابزار شناسایی چهره آمازون را با مقایسه عکس‌های هر یک از اعضای کنگره ایالات متحده در برابر پایگاه داده تصاویر چهره ۲۵,۰۰۰ مجرم آزمایش کرد. نتیجه این بود که به غلط  ۲۸ نفر از اعضای کنگره به عنوان مجرم شناسایی شدند و ۳۹٪ از این مجرمان افراد رنگین پوست بودنده اند که تنها ۲۰٪ از کنگره را تشکیل می‌دهند.

به همین دلیل است که انتخاب یک تأمین‌کننده با تجربه که قبلاً حجم زیادی از تراکنش‌های تأیید هویت را با نمایندگی کافی از جمعیت‌های مختلف جهان پردازش کرده، حیاتی است. به طور مثال اگر یادگیری ماشین شما تنها بر روی چهره‌های نروژی آموزش ببیند، بعید است این سیستم عملکرد خوبی بر روی مشتریان آسیایی و آفریقایی داشته باشد.

علاوه بر این، اگر تراکنش‌های خلافکارانه در مجموعه داده به درستی به عنوان تقلب برچسب‌گذاری نشوند، اتوماسیون فقط مشکلات موجود را مقیاس‌دهی (آمار دهی) خواهد کرد، بنابراین ضروری است که تامین‌کننده اولیه؛ تیمی از کارشناسان داشته باشد که داده‌ها را به درستی برچسب‌گذاری کنند تا دقت ماشین به حداکثر برسد.

درک معیارهای دقت

دقت می تواند با پردازش خود نشان دهد  راه‌حل احراز هویت چقدر خوب توانسته بازیگران بد را از پلتفرم شما دور نگه دارد و  در نتیجه تا چه تعداد مشتریان قانونی را به داخل راه داده است. اگرچه این موضوع به نظر ساده می‌رسد، روش‌های زیادی برای اندازه‌گیری دقت وجود دارد.

چهار معیار رایج عبارتند از:

دقت رد اعتبارسنجی تقلب (که در علم داده به آن دقت نیز گفته می‌شود) — درصد معامله‌هایی که به عنوان تقلب رد کرده‌اید و در واقع تقلب بودند. اگر ۱۰۰ معامله اعتبارسنجی را به عنوان شناسائی تقلب رد کرده‌اید و ۹۹ مورد از آن‌ها واقعاً تقلبی بودند هر چند یکی از آن‌ها در واقع یک مشتری قانونی بود، دقت رد اعتبارسنجی تقلب شما ۹۹% است. هرچه این عدد بالاتر باشد، دقت تبدیل شما بهتر است. این به این معناست که مشتریان قانونی شما رد نمی‌شوند.

نرخ کشف تقلب (که در علم داده به آن یادآوری نیز گفته می‌شود) — درصد تقلب‌های واقعی که به درستی رد شده‌اند. اگر ۱۰۰ خلافکار تلاش کردند به پلتفرم شما وارد شوند و شما ۹۹ نفر از آن‌ها را شناسایی کردید، نرخ کشف تقلب شما ۹۹% است. هرچه این عدد بالاتر باشد، دقت شناسائی تقلب شما بهتر است. این به کاهش تهدید عبور مجرمان کمک می‌کند.

درک معیارهای دقت

نرخ رد نادرست (FRR) درصد مشتریان معتبر که به نادرستی رد شده‌اند. این عدد باید تا حد ممکن پایین باشد تا حداکثر تبدیل را به ارمغان بیاورد و بتوانید کسب و کار خود را رشد دهید.

نرخ پذیرش نادرست (FAR) درصد مشتریان تقلبی که به نادرستی تأیید شده‌اند. این عدد نیز باید تا حد ممکن پایین باشد تا ایمنی پلتفرم شما حداکثر شود.

دقت رد تقلب = (جستجوهایی صحیحی که به عنوان تقلب رد شده‌اند) / (تمام جستجوهایی که به عنوان تقلب رد شده‌اند)

مثال:

99 جستجو که به درستی رد شده‌اند / 100 جستجو رد شده = 99% دقت رد تقلب

نرخ کشف تقلب = (جستجو‌هایی که به درستی به عنوان تقلب رد شده‌اند) / (تمام جستجو‌های تقلبی پردازش شده)

مثال:

99 جستجو که به درستی رد شده‌اند / 100 جستجو تقلبی = 99% نرخ کشف تقلب

نرخ رد کاذب = (جستجو‌هایی که به غلط به عنوان تقلب رد شده‌اند) / (تمام جستجوهای تایید شده + تمام جستجو‌هایی که به عنوان تقلب رد شده‌اند)

مثال:

1 جستجو که به غلط رد شده است / (65 جستجو تایید شده + 35 جستجو رد شده) = 1% نرخ رد کاذب

نرخ پذیرش کاذب = (جستجو‌های تقلبی که به غلط تایید شده‌اند) / (تمام جستجو‌های تایید شده + تمام جستجو‌هایی که به عنوان تقلب رد شده‌اند)

مثال:

1 جستجو که به غلط تایید شده است / (65 جستجو تایید شده + 35 جستجو رد شده) = 1% نرخ پذیرش کاذب

تأمین‌کنندگان معتبر تأیید هویت، این آمارها را بسیار جدی می‌گیرند و تیم‌های باکیفیتی دارند که به طور مداوم به بررسی، اندازه‌گیری و بهبود دقت راه‌حل اختصاص می پردازند.

شرکت جمیو به طور منظم بخش قابل توجهی از معاملات تأیید هویت را بررسی می‌کند تا اطمینان حاصل کند موتور تأیید ما به درستی شناسایی‌های تقلب را علامت‌گذاری کرده و مشتریان خوب را در زمان مناسب تأیید می‌کند.

هماهنگی سیگنال‌های تهدید

در حین فرآیند جذب مشتری، قبل از این که حتی شناسنامه فرد را بررسی کنید و از او بخواهید سلفی بگیرد، می‌توانید یک سری بررسی‌های تقلب بدون اصطکاک و با هزینه کم انجام دهید.

به عنوان مثال، می‌توانید بررسی‌هایی بر روی دستگاه آن‌ها انجام دهید بدون این که نیازی به ورودی از سمت آن‌ها باشد. اگر آن‌ها در حال تلاش برای باز کردن حساب از گوشی‌ای باشند که در معاملات خلافکارانه دیگر استفاده شده یا سیگنال‌های تهدید دیگری با آن مرتبط است، می‌توانید بررسی‌های سخت‌گیرانه‌تری را به فرآیند جذب اضافه کنید.

این قابلیت برای انجام چندین بررسی و تنظیم دینامیک جریان کار بر اساس ورودی‌های زمان واقعی، “هماهنگی” نامیده می‌شود و به شرکت‌ها این امکان را می‌دهد که تجربه‌ای بدون اصطکاک برای مشتریان معتبر خود فراهم کنند و نظارت بیشتری بر روی افراد با تهدید بالاتر داشته باشند. نتیجه این امر هم افزایش نرخ تبدیل و هم افزایش جلوگیری از تقلب است.

برای این که این راه‌حل مؤثرتر باشد، هماهنگی ها باید انعطاف‌پذیر باشد و به شما این امکان را بدهد که جریان‌های کاری دینامیکی طراحی کنید تا نیازهای دقیق کسب‌وکار خود را برآورده کنید. علاوه بر این، باید مجموعه‌ای گسترده از سیگنال‌های تهدید را ارائه دهد که بتوانید از بین آن‌ها انتخاب کنید، مانند اثر انگشت دستگاه، بررسی آدرس، سن و اعتبار ایمیل و تهدید جغرافیایی. (زیست سنجی)

به عنوان مثال، شرکت جمیو بیش از 500 منبع داده جهانی در دسترس دارد که تمامی سیگنال‌های تهدیدی که ممکن است نیاز داشته باشید را فراهم می‌کند.

هنگام بررسی سیگنال‌های تهدید متعدد، بسیار مفید است که تمام نتایج را در یک داشبورد واحد مشاهده کنید به جای این که مجبور باشید به برنامه‌های مختلف مراجعه کنید. حتی بهتر این است که یک نمره تهدید تجمیعی داشته باشید که ارزیابی فوری از تهدید توسط مشتری را بالقوه به شما ارائه دهد.

 ادامه دارد…

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.