[ad_1]
Присоединяйтесь к лидерам в Бостоне 27 марта на эксклюзивном вечере общения, идей и бесед. Запросите приглашение здесь.
Поскольку OpenAI продолжает набирать популярность благодаря контенту, созданному Sora, ее еще не запущенной видеоплатформой искусственного интеллекта, конкуренты делают все возможное, чтобы поднять планку своих предложений. Всего несколько дней назад Pika Labs представила в своем продукте синхронизацию губ. И теперь совершенно новый видеостартап с искусственным интеллектом «Haiper» появился из тайны с начальным финансированием в размере 13,8 миллионов долларов от Octopus Ventures.
Лондонская компания Haiper, основанная бывшими исследователями Google Deepmind Ишу Мяо (генеральным директором) и Зию Ваном, предлагает платформу, которая позволяет пользователям создавать высококачественные видео из текстовых подсказок или анимировать существующие изображения. Платформа имеет собственную визуальную базовую модель и использует существующие на рынке видеоинструменты искусственного интеллекта, такие как Runway и Pika Labs. Однако, судя по ранним тестам, он все еще отстает от того, что OpenAI может предложить с Sora.
Haiper планирует использовать финансирование для масштабирования своей инфраструктуры и улучшения своего продукта, в конечном итоге создавая AGI, способный интернализировать и отражать человеческое понимание мира.
Что предлагает Haiper с видеоплатформой AI?
Как и Runway и Pika, Haiper в своей нынешней форме предоставляет пользователям веб-платформу, где они получают простой интерфейс для ввода текстового приглашения по своему выбору и начала создания AI-видео обо всем, что они могут себе представить. В настоящее время платформа предлагает инструменты для создания видео как в SD, так и в HD-качестве, хотя продолжительность HD-контента остается ограниченной двумя секундами, тогда как SD может достигать четырех секунд. Инструмент для видео более низкого качества также имеет возможность контролировать уровень движения.
Когда мы тестировали продукт, качество HD-видео было более стабильным, вероятно, из-за меньшей длины, в то время как видео более низкого качества, которые он создавал, часто были размытыми, а объект менял форму, размер и цвет, особенно в случаях более высоких уровней. движения. Также нет возможности продлить поколение, как это видно на Runway, хотя компания утверждает, что планирует запустить эту возможность в ближайшее время.
В дополнение к функциям преобразования текста в видео платформа также предоставляет инструменты, позволяющие пользователям загружать и анимировать существующие изображения или перерисовывать видео, изменяя его стиль, цвет фона, элементы или тему с помощью текстовой подсказки.
Хайпер утверждает, что платформа и лежащая в ее основе запатентованная визуальная базовая модель могут удовлетворить широкий спектр вариантов использования: от отдельных приложений, таких как контент для социальных сетей, до бизнес-ориентированных применений, таких как создание контента для студии. Однако компания ничего не рассказала о плане коммерциализации и продолжает предлагать технологию бесплатно.
План создания AGI с восприятием мира
Благодаря этому финансированию Haiper планирует развивать свою инфраструктуру и продукты с конечной целью создания общего искусственного интеллекта (AGI) с полными способностями восприятия. В результате инвестиций общий капитал, привлеченный компанией, составил 19,2 миллиона долларов.
В ближайшие несколько месяцев Haiper планирует учесть отзывы пользователей и выпустить серию крупных обученных моделей, которые повысят качество видеовыходов AI, потенциально сокращая разрыв между конкурирующими предложениями, доступными на рынке.
По мере масштабирования этой работы компания будет стремиться улучшить понимание мира моделями, по сути создавая AGI, который сможет воспроизводить эмоциональные и физические элементы реальности, охватывая мельчайшие визуальные аспекты, включая свет, движение, текстуру и взаимодействие между объектами. – для создания реалистичного контента.
«Наша конечная цель — создать AGI с полными перцептивными способностями, который обладает безграничным потенциалом для содействия творчеству. Наша визуальная базовая модель станет шагом вперед в способности ИИ глубоко понимать физику мира и воспроизводить суть реальности в генерируемых им видеороликах. Такие достижения закладывают основу для искусственного интеллекта, который сможет понимать, воспринимать и улучшать человеческое повествование», — говорится в заявлении Мяо.
Haiper ожидает, что благодаря этим возможностям восприятия следующего поколения ее технология выйдет за рамки создания контента и окажет влияние на другие области, включая робототехнику и транспорт. Такой подход к видеоИИ делает эту компанию интересной, на которую стоит обратить внимание в горячей области ИИ.
[ad_2]
Источник