[ad_1]
Присоединяйтесь к лидерам в Бостоне 27 марта на эксклюзивном вечере общения, идей и бесед. Запросите приглашение здесь.
Несмотря на сообщения предприятий робеем по поводу внедрения генеративного искусственного интеллекта Из-за проблем со стоимостью и точностью становится ясно, что в мире робототехники эра искусственного интеллекта только начинает набирать обороты.
Сегодня Fig, стартап в области робототехники стоимостью 2,6 миллиарда долларов, основанный менее двух лет назад бывшими сотрудниками Boston Dynamics, Tesla, Google DeepMind и Archer Aviation, продемонстрировал свое первое сотрудничество с новым инвестором и партнером OpenAI, создателем ChatGPT, и это, несомненно, впечатляет.
Фигура соучредитель и Генеральный директор Бретт Адкок зашел в свой аккаунт в социальной платформе X. опубликовать демонстрационное видео полноразмерного робота-гуманоида Рисунок, Фигура 01 (произносится как «Рисунок Один»), демонстрирующее его возможности взаимодействия с находящимся поблизости человеком и окружающей средой, демонстрирующее, как робот выполняет приказы человека, находит и передает его. объект (в данном случае яблоко), описывающий, что он делает и разговаривает с человеком (хотя и с немного задержкой времени реакции по сравнению с тем, что мы ожидаем в типичном разговоре между людьми), а также идентификацию, планирование и выполнение полезные задания сами по себе (в данном случае сбор мусора и помещение посуды на сушилку).
В сцене прямо из научно-фантастического фильма видео начинается со слов человека: «Эй, Фигура Один, что ты сейчас видишь?» Робот отвечает: «Я вижу красное яблоко на тарелке в центре стола, сушилку с чашками и тарелкой, а рядом стоишь ты, положив руку на стол».
— Отлично, можно мне что-нибудь поесть? — спрашивает человек.
«Конечно», — заявляет Фигура Один, осторожно протягивая, хватая яблоко и передавая его человеку, понимая, что яблоко — единственный съедобный объект перед ним, хотя человек даже не уточняет.
Далее в видео показано, как Фигура собирает мусор и убирает тарелку и чашку на сушилку.
Появится новая модель? OpenAI ВЛМ
Адкок разместил в теме на X что «бортовые камеры Рисунок поступают в большую модель языка видения (VLM), обученную OpenAI», хотя неясно, является ли это версией GPT-4, флагманского LLM OpenAI, который поддерживает подписную версию ChatGPT (Plus), например GPT-4V, если это доработанная версия уже существующей модели, или если это совершенно новая модель. Мы обратились к OpenAI за более подробной информацией о сотрудничестве и этой демонстрации и сообщим об этом, когда получим ответ.
Во впечатляющем декларацияАдкок также отметил, что «В видео показаны сквозные нейронные сети. Телеопа нет. Кроме того, это было снято со скоростью 1,0x и непрерывно». Другими словами: видео не было ускорено, как это часто делалось в предыдущих демонстрационных видеороликах роботов-гуманоидов, чтобы продемонстрировать большую плавность движений, и при этом не было человека, удаленно управляющего движениями робота в какой-либо части за кадром.
Куда идет рисунок отсюда
Демонстрационное видео, представленное на рисунке, представляет собой значительный шаг вперед в гуманоидных робототехнических взаимодействиях общего назначения — оно показывает, как робот довольно естественно взаимодействует с человеком, подчиняется ему, интуитивно понимает, чего он хочет, и делает это гораздо более плавно, чем многие предыдущие примеры от других компаний и компаний. исследователи.
Однако это, конечно, всего лишь демо, да ещё и прототип. Вероятно, потребуется гораздо больше работы, чтобы подготовить такого робота к коммерческому внедрению и продать его предприятиям и/или частным лицам. Тем не менее, Адкок открыто заявил, в том числе в своей сегодняшней теме X, что «Наша цель — научить модель мира управлять роботами-гуманоидами на уровне миллиардов единиц».
А на веб-сайте «Фигура» в «генеральном плане» Адкока от первого лица говорится, что «цель Фигуры: разработать гуманоидов общего назначения, которые окажут положительное влияние на человечество и создадут лучшую жизнь для будущих поколений. Эти роботы могут устранить необходимость в небезопасных и нежелательных работах, что в конечном итоге позволит нам жить более счастливой и целеустремленной жизнью».
Тем не менее, Адкок продолжает: «Путь нашей компании займет десятилетия – и потребует наличия чемпионской команды, преданной своей миссии, инвестиций в миллиарды долларов и технических инноваций для достижения эффекта на массовом рынке. Мы сталкиваемся с высоким риском и крайне низкими шансами на успех».
Он также клянется: «Мы не будем использовать гуманоидов в военных или оборонных целях, а также в каких-либо ролях, требующих причинения вреда людям».
Прогресс, продемонстрированный сегодня Адоком и Фигурой на базе OpenAI, вероятно, окажет гораздо большее давление на конкурентов в сфере гуманоидной робототехники, таких как Tesla с ее проектом Optimus и Agility, стартап в области гуманоидной робототехники, работающий с Amazon над выполнением функций. Это также происходит по мере того, как в эту сферу входит все больше компаний, в том числе Hugging Face (которая только что наняла бывшего ученого Tesla Optimus, чтобы возглавить свой недавно анонсированный проект робототехники с открытым исходным кодом), а также вчерашнее объявление о стартапе под названием Physical Intelligence.
[ad_2]
Источник