по популярности / по алфавиту

эксперт
Научные и НФ-комиксы на Реакторе

Михаил Заславский: Парадоксальный взгляд комиксиста может подтолкнуть ученых к открытию

«Взрослые и увлекательные комиксы будут следовать за главными событиями науки и дополнят картину мира для интеллектуалов»

подробнее
Роботов приучают к любопытству

Роботов приучают к любопытству

Автор:

Фото: commons.wikimedia.org, 100posto

Дата: 5 июня 2017 16:58

Новый алгоритм даст роботам возможность изучать окружающую среду быстрее и эффективнее

Новый алгоритм TEXPLORE-VENIR позволяет внедрить в работу роботов свойство, схожее с человеческим любопытством. Роботы, использующие алгоритм, получают вознаграждение не только за приближение к решению поставленной задачи, но и за любое знание, которое не ведет напрямую к достижению цели. Авторы TEXPLORE-VENIR — Тодд Хестер из лондонского Google DeepMind и Питер Стоун из Техасского университета в Остине  — создали алгоритм на основе техники «подкрепляющего обучения».

Ученые провели исследования, в рамках которых ставили боту, а позже и человекоподобному роботу, цель, достижение которой предполагало несколько шагов. Сначала робот использовал простую программу, чтобы пошагово достичь результата. Каждое действие приносило ему определенное количество баллов. Когда подключали TEXPLORE-VENIR, робот выполнял не только необходимые для достижения цели шаги, но и другие действия, исследуя окружающую среду. Машина при этом получала бонусные баллы за дополнительные движения, которые совершала на пути к основной цели. Таким образом, робота учили «проявлять любопытство».

Ученые надеются, что в дальнейшем алгоритм заставит машину попытаться достичь цели и получить дополнительное вознаграждение за сопутствующие действия. Таким образом, благодаря «любопытству» роботы смогут быстрее и эффективнее получать знания.

Другие исследователи высказывают опасения, что «любопытство» послужит отвлекающим фактором: в погоне за бонусными баллами робот не будет быстро достигать необходимой цели. Перед создателями алгоритма стоит задача —  найти баланс между внутренней и внешней мотивацией (желанием получить награду за обучение и потребностью выполнить основную задачу).

Тодд Хестер, один из авторов алгоритма,  сообщил, что в дальнейшем ученые попытаются использовать глубокие нейронные сети и алгоритмы, смоделированные по архитектуре человеческого мозга, чтобы научить робота лучше идентифицировать новые области для изучения. Подробно о работе исследователей писал журнал Science.

Напомним, любопытство — не единственное качество, которое люди смогли передать роботам. Недавние исследования показали, что роботы, использующие понятия из интернета, наследуют от людей склонность к нетерпимости.

Понравилась заметка? Поделитесь —

Комментарии (0)

Добавить комментарий

Войти с помощью: