[ad_1]
Команда NVIDIA Research разработала нового интеллектуального агента, который обучил роботизированную руку быстро вращать ручку — впервые так же хорошо, как это может делать человек. И это лишь одна из почти 30 задач, которые виртуальные модели роботов теперь могут мастерски выполнять благодаря ИИ-программе Eureka: они так же легко открывают ящики и шкафы, бросают и ловят мячи, манипулируют ножницами. Сама Эврика основана на большой языковой модели GPT-4.
По сути, Eureka придумывает алгоритмы вознаграждений для обучения с подкреплением, при котором роботы учатся благодаря взаимодействию с внешней средой, а не на заранее загруженных данных. Когда машина выполняет задание верно, она получает сигналы подкрепления — и таким образом может продвигаться дальше к достижению заданной цели.
«Обучение с подкреплением позволило добиться впечатляющих успехов за последнее десятилетие, однако многие проблемы все еще существуют, например дизайн вознаграждений, который остается процессом проб и ошибок. Эврика — это первый шаг на пути к разработке новых алгоритмов, которые объединяют методы генеративного обучения и обучения с подкреплением для решения сложных задач», — сказала Анима Анандкумар, старший директор по исследованиям в области искусственного интеллекта в NVIDIA.
Согласно исследованию, программы вознаграждения от Eureka, позволяющие роботам обучаться методом проб и ошибок, превосходят программы, написанные экспертами, в более чем 80% задач. Это приводит к среднему повышению производительности ботов свыше чем на 50%.
Эврика эффективна при обучении всех видов роботов (точнее, их виртуальных моделей) — четвероногих, двуногих, квадрокоптеров, коботов-манипуляторов и других — в выполнении самых разных задач. Результаты представлены в визуализациях, созданных с помощью платформы для работы с 3D-графикой NVIDIA Omniverse.
[ad_2]
Источник