گوگل به کمک هوش مصنوعی و پردازش تصویر، محتوای موجود در تصاویر را بررسی کرده و توضیحات عکس را با دقت ۹۳.۹ درصد ایجاد می‌کند! در ادامه به جزئیات بیشتر این روش می‌پردازیم.

در جست‌وجوی تصاویر به کمک گوگل، یکی از مهم‌ترین مسائل این است که عکس‌ها نام مرتبط و مناسبی داشته باشند که معمولاً این‌گونه نیست! ممکن است درون عکسی با نام سفید، پدیده‌های کاملاً تیره وجود داشته باشد. لذا گوگل علاوه بر نام و توضیح فایل‌ها، دست به کار می‌شود و با پردازش تصویر و هوش مصنوعی، محتوای موجود در تصاویر را شناسایی کرده و تصاویر را دسته‌بندی می‌کند.

الگوریتم Show and Tell گوگل با بروزرسانی اخیر توانمند و خوشبختانه متن‌باز شده است؛ لذا ممکن است در اپلیکیشن‌های مختلفی از آن استفاده شود. الگوریتم بهینه‌شده‌ی جدید، تعلیم شبکه‌ی عصبی را سریع‌تر کرده و توضیحات دقیق‌تری برای تصاویر ایجاد می‌کند. مثلاً به نمونه‌های زیر توجه کنید:

هوش مصنوعی گوگل محتوای تصاویر را پیش‌‎بینی می‌کند

یک سگ نزدیک سگی دیگر در ساحل نشسته؛ هوش مصنوعی دقیقاً متوجه وجود آب و خشکی در کنار هم و وجود دو حیوان که هر دو احتمالاً سگ هستند، شده و در سایر موارد هم دقت بسیار عالی است. نمونه‌ی دیگر را در تصاویر زیر بررسی کنید. الگوریتم جدید نمی‌گوید که خرس در آب شنا می‌کند؛ بلکه می‌گوید دو خرس قهوه‌ای روی سنگ‌ها نشسته‌اند! دقت روش جدید ۹۳.۹ درصد اعلام شده که حیرت‌انگیز است.

هوش مصنوعی گوگل محتوای تصاویر را پیش‌‎بینی می‌کند