ربات‌ها هم ممکن است روزی مثل انسان در مورد پدیده‌های عجیب قضاوت کنند. محققین گوگل روشی برای خواب دیدن ربات‌ها و افزایش نرخ یادگیری ماشینی ابداع کرده‌اند که سرعت یادگیری را ۱۰ برابر می‌کند. در ادامه بحثی کوتاه پیرامون این تحقیق جالب خواهیم داشت.

تحقیقاتی که در زمینه‌ی عصب‌شناسی صورت گرفته نشان می‌دهد که رویا دیدن و خواب در تثبیت حافظه اهمیت زیادی دارد و از این رو کمپانی DeepMind که یکی از زیرگروه‌های گوگل در عرصه‌ی هوش مصنوعی است، به فکر طراحی تکنولوژی جالبی برای رویا دیدن ربات‌ها افتاده است. دیپ‌مایند معتقد است که رویا دیدن صرفاً موضوع جالبی نیست؛ بلکه می‌تواند نرخ یادگیری ربات‌ها را افزایش دهد. نکته‌ی جالب این است که تصاویری که دیپ‌مایند به عنوان رویا انتخاب کرده معمولاً به بازی‌های کنسول آتاری تعلق دارد. دیپ‌مایند قبلاً هم تجربیاتی در زمینه‌ی بازی و هوش مصنوعی داشته؛ به عنوان مثال به هوش مصنوعی آموزش داده تا بازی Breakout و Asteroids را بازی کند. ربات‌ها هم مثل انسان در اینگونه بازی‌ها آموزش می‌بینند و با توجه به تجربیات خود در دنیای واقعی به ایفای نقش می‌پردازند.

برای درک اهمیت رویا دیدن در یادگیری ماشینی ابتدا باید به فرآیندی که موجب رویا دیدن می‌شود توجه کرد. یکی از کشفیاتی که در این زمینه صورت گرفته این است که اغلب رویاها به عاملی منفی یا ترسناک مربوط می‌شود. کافی است خواب‌هایی که در مدت یک ماه می‌بینید را یادداشت کنید و آماری از موضوعات جمع کنید. یکی از تئوری‌های مطرح شده در زمینه‌ی خواب‌ها این است که خواب‌های ترسناک ماندگاری بیشتری در حافظه دارند و در حقیقت اثر بیشتری روی ذهن انسان می‌گذارند. دیپ‌مایند با پیروی کردن از این تئوری صحنه‌ها را انتخاب کرده و روی موضوعات چالش‌برانگیز یا ترسناک متمرکز شده است.

اما به نظر شما یک موقعیت چالش‌برانگیز از نگاه یک ربات چگونه است؟ به عنوان مثال در بازی‌های معروف و پرطرفداری مثل Starcraft II‌ یا Labyrinth یک موقعیت ترسناک چیزی مثل حل یک معمای پیچیده یا رویارویی با یک حریف قدرتمند است. این بخش‌های بازی در قیاس با سایر بخش‌ها که شاید کسل‌کننده و تکراری باشند، با ماندگاری بیشتری در ذهن انسان و همین‌طور هوش مصنوعی ثبت می‌شوند.

دیپ‌مایند با انتخاب این موقعیت‌ها به این نتیجه رسیده که سرعت یادگیری ماشینی هوش مصنوعی در حد ۱۰ برابر بیشتر از حالت معمول بوده است.

روش ایجاد رویا توسط دیپ‌مایند

این سوال پیش می‌آید که چرا برای یادگیری ماشینی هوش مصنوعی باید روش‌های بهینه‌تری مطرح شود؟ همین حالا هم هوش مصنوعی در بازی‌هایی مثل شطرنج، قدرت خویش را به رخ انسان می‌کشد. برای پاسخ به این سوال باید به دو نوع یادگیری ماشینی که این روزها مرسوم است توجه کنید. نوع اول یادگیری با نظارت است. در این روش برنامه‌نویسان و محققین به انتخاب نمونه‌های داده می‌پردازند و ربات با بررسی داده‌های موجود، روندی را شناسایی می‌کند. روش ساده و روبه‌جلویی است.

روش دوم بدون نظارت است. در این حالت یادگیری به سبک انسانی شباهت بیشتری دارد. انسان در مواجه با پدیده‌ها خود به اکتشاف می‌پردازد و اثر اعمال انتخابی روی هدف نهایی را تجربه می‌کند. روش پیچیده‌تری است و بسیار زمان‌بر است. در این سبک ربات مجبور است حالت‌های مختلف را امتحان کند و با توجه به نتایج هوشمندی خویش را افزایش دهد؛ درست مثل انسان.

دیپ‌مایند روی سبک دوم سرمایه‌گذاری کرده؛ چرا که شاید تنها امید محققین در مسیر شبیه‌سازی واقعی هوش انسان است. ربات‌ها هم ممکن است روزی مثل انسان رویا ببینند و شرایط عجیب و غریبی که دور از ذهن است را تصور کنند و با توجه به تجربیات قبلی تصمیم بگیرند که هر عمل ممکن است به چه نتیجه‌ای منتهی شود.