[ad_1]
Nvidia представила Latte3D, в котором используется генеративный искусственный интеллект для мгновенного создания трехмерных фигур из текста. Генеративный ИИ-модель преобразования текста в 3D может создавать высококачественные 3D-фигуры за миллисекунды.
По словам Nvidia, созданный командой лаборатории искусственного интеллекта Nvidia в Торонто, Latte3D представляет собой значительный прогресс в области искусственного интеллекта, предлагая генерацию трехмерных объектов и животных практически в реальном времени из простых текстовых подсказок.
Санджа Фидлер, вице-президент по исследованиям искусственного интеллекта в Nvidia, назвала Latte3D переломным моментом для авторов в разных отраслях.
«Теперь мы можем получать результаты на порядок быстрее, делая преобразование текста в 3D практически в реальном времени доступным для создателей из разных отраслей», — сказал Фидлер в своем заявлении.
Суть Latte3D заключается в его способности преобразовывать текстовые подсказки в подробные трехмерные изображения, подобно виртуальному 3D-принтеру. Используя один графический процессор (GPU), такой как Nvidia RTX A6000, модель может мгновенно создавать сложные 3D-фигуры, устраняя необходимость в трудоемких процессах рендеринга.
Вместо кропотливого проектирования объектов с нуля или изучения библиотек 3D-ресурсов, создатели теперь могут положиться на Latte3D, который быстро и эффективно воплотит свои идеи в жизнь. Модель предлагает несколько вариантов формы на основе каждого введенного текста, что позволяет пользователям выбирать наиболее подходящий дизайн для своих нужд.
Поговорив со многими экспертами в этой области, они обеспокоены тем, что действительно сложно изменить генеративное изображение так, чтобы оно стало именно таким, каким вы хотите. Создать концепцию легко, но затем превратить эту концепцию с помощью слов во что-то, что вам действительно нужно, — непростая задача.
Универсальность Latte3D выходит за рамки исходных наборов обучающих данных, которые включают животных и предметы повседневного обихода. Разработчики имеют возможность обучать модель на различных типах данных, что позволяет применять ее в различных областях, таких как ландшафтный дизайн и робототехника.
Для ландшафтных дизайнеров Latte3D может ускорить процесс заполнения изображений сада реалистичной листвой, а разработчики робототехники могут использовать эту модель для моделирования домашней обстановки для обучения роботов-личных помощников.
Latte3D, основанный на графических процессорах Nvidia A100 Tensor Core и обученный работе с разнообразными текстовыми подсказками, генерируемыми с помощью ChatGPT, демонстрирует приверженность Nvidia развитию инструментов создания контента на основе искусственного интеллекта. Способность модели обрабатывать широкий спектр текстовых описаний обеспечивает точное и быстрое создание форм, адаптированных к потребностям пользователя.
Latte3D является частью постоянных усилий Nvidia Research по расширению границ искусственного интеллекта и компьютерной графики и является свидетельством приверженности компании инновациям. Имея сотни ученых и инженеров по всему миру, Nvidia продолжает способствовать прогрессу в области искусственного интеллекта, компьютерного зрения, беспилотных автомобилей и робототехники.
[ad_2]
Источник