[ad_1]
Исследователи Apple представили новый инструмент искусственного интеллекта под названием Keyframer, который использует возможности больших языковых моделей (LLM) для анимации статических изображений с помощью подсказок на естественном языке.
Это новое приложение, подробно описанное в новой исследовательской статье, опубликованной на arxiv.org, представляет собой гигантский скачок в интеграции искусственного интеллекта в творческий процесс, а также может намекать на то, что будет в новых поколениях продуктов Apple, таких как iPad. Про и Вижн Про.
Исследовательская работа под названием «Keyframer: Расширение возможностей анимационного дизайна с использованием больших языковых моделей» исследует неизведанную территорию в применении LLM в анимационной индустрии, представляя уникальные проблемы, такие как эффективное описание движения на естественном языке.
Представьте себе: вы аниматор, у которого есть идея, которую вы хотите реализовать. У вас есть статичные изображения и история, которую можно рассказать, но мысль о бесчисленных часах, когда вы склоняетесь над iPad, чтобы вдохнуть жизнь в свои творения, утомительна. Введите Ключевой кадр. Всего за несколько предложений эти изображения могут начать танцевать по экрану, как будто они читают ваши мысли. Или, скорее, как если бы они были у больших языковых моделей Apple (LLM).
Как Keyframer улучшает процесс анимации благодаря отзывам пользователей
Keyframer основан на большой языковой модели (в исследовании используется GPT-4), которая может генерировать код анимации CSS из статического изображения SVG и подсказки. «Большие языковые модели могут оказать влияние на широкий спектр творческих областей, но применение LLM к анимации недостаточно изучено и ставит новые проблемы, например, то, как пользователи могут эффективно описывать движение на естественном языке», — объясняют исследователи.
Чтобы создать анимацию, пользователь загружает изображение SVG, вводит текстовую подсказку, например «Заставьте облака медленно дрейфовать влево», и Keyframer сгенерирует код для реализации этой анимации. Затем пользователи могут улучшить анимацию, отредактировав код CSS напрямую или добавив новые подсказки на естественном языке.
Согласно документу, «Keyframer поддерживает исследование и уточнение анимации посредством сочетания подсказок и прямого редактирования сгенерированного вывода». Этот ориентированный на пользователя подход был основан на нескольких интервью с профессиональными анимационными дизайнерами и инженерами, которые предоставили отзывы об инструменте исследования, каждый из которых подчеркивал итеративный дизайн и креативность.
«Я думаю, что это было намного быстрее, чем многое из того, что я делал… Я думаю, что сделать что-то подобное раньше заняло бы всего несколько часов», — сказал один из участников исследования, давший интервью газете.
Расширение горизонтов больших языковых моделей
Исследователи обнаружили, что большинство пользователей использовали итеративный, «декомпозированный» подход к дизайну подсказок, добавляя новые подсказки для анимации отдельных элементов один за другим. Это позволило им постепенно адаптировать свои цели в ответ на результаты работы ИИ.
«Keyframer позволил пользователям итеративно совершенствовать свои проекты с помощью последовательных подсказок, вместо того, чтобы заранее рассматривать весь дизайн», — объясняют исследователи в статье. Функции прямого редактирования кода также обеспечили детальный творческий контроль.
Хотя инструменты искусственного интеллекта для анимации обладают потенциалом демократизации дизайна, исследователи признают обеспокоенность по поводу потери творческого контроля и удовлетворения. Но, сочетая подсказки с редактированием, Keyframer стремится обеспечить доступное прототипирование, сохраняя при этом свободу действий пользователя.
«Благодаря этой работе мы надеемся вдохновить будущие инструменты анимационного дизайна, которые сочетают в себе мощные генеративные возможности LLM для ускорения создания прототипов дизайна с динамическими редакторами, которые позволят создателям сохранять творческий контроль», — заключают исследователи.
Более широкое влияние Keyframer на творческие индустрии
Keyframer обещает изменить анимационную среду, сделав ее более доступной для широкого круга создателей. Keyframer предлагает неспециалистам возможность оживить истории с помощью анимации — задача, которая когда-то требовала значительных технических навыков и ресурсов, что рассматривается как существенное выравнивание правил игры. Это свидетельство растущей роли ИИ как совместной силы в творческом процессе, предполагающее сдвиг в том, как технологии используются в различных секторах.
Значение Keyframer распространяется на ожидаемый культурный сдвиг, когда ИИ становится более интуитивной и неотъемлемой частью творческого опыта человека. Это не просто технологический скачок, но потенциальный катализатор переосмысления самой структуры нашего взаимодействия с цифровой сферой. Переход Apple на Keyframer вполне может стать предвестником новой эры, когда границы между создателем и творением становятся все более размытыми под руководством невидимой руки искусственного интеллекта.
[ad_2]
Источник