banner

[ad_1]

Представлено Google для игр


В этом году компания Google добилась больших успехов на конференции разработчиков игр (GDC), сосредоточив внимание на том, как генеративный искусственный интеллект («генеративный искусственный интеллект») оказывает глубокое влияние на игровую индустрию. В серии презентаций, состоящей из трех частей, приняли участие лидеры Google в области игр и искусственного интеллекта, которые подробно рассказали о решениях компании для разработки и публикации искусственного интеллекта и искусственного интеллекта, о преобразующем влиянии искусственного интеллекта на игровой процесс в реальном времени, а также о практических идеях для готовых разработчиков. чтобы начать свой собственный путь в области искусственного интеллекта.

Поколение искусственного интеллекта, позволяющее создавать «живые игры»

«Игры вступают в новую эру», — сказал Джек Базер, директор по играм Google Cloud, и ожидается, что «живые игры» появятся на рынке в течение следующих трех-пяти лет. Они включают в себя многие основы игр с живым сервисом или игр с живыми операциями, но также подкреплены генеративным искусственным интеллектом.

«В конечном итоге игры смогут напрямую реагировать на неявные или явные инструкции игроков», — пояснил он. «Игра сможет создавать контент на лету, чтобы немедленно удовлетворить потребности отдельного человека или даже небольшой группы пользователей. Очень скоро вы увидите, что мои коллеги из Google сообщат именно об этом».

Поколение ИИ в жизненном цикле разработки игр

Тем временем многие студии интегрируют генеративный ИИ в производственный конвейер, часто используя такие инструменты, как Vertex AI от Google Cloud, управляемую платформу для ИИ и генерации ИИ, для разработки игр, локализации игр для других рынков и преобразования игрового опыта. Разработчики даже создают свои собственные LLM, добавил Бузер — например, Google Cloud недавно работал с NCSOFT над разработкой VARCO LLM.

Генеративный ИИ также влияет на сферу публикации и распространения, говорит Лей Чжан, директор Play Partnerships, глобального генеративного ИИ и китайского подразделения Google.

«Мы переходим от простого распространения к охвату всего жизненного цикла как разработчиков игр, так и геймеров», — сказал Чжан. «Мы используем генеративный искусственный интеллект для улучшения обнаружения игр. Мы используем его, чтобы улучшить опыт разработчиков, помогая им создавать маркетинговые ресурсы в Play Store. В обозримом будущем описания и графические ресурсы вашего магазина (игр) можно будет создавать с помощью генеративного искусственного интеллекта».

«По сути, я думаю, что генеративный ИИ может помочь во всех сферах, когда вы смотрите на бизнес», — добавил Саймон Токумине, директор по управлению продуктами Google AI. «Но просто сосредоточившись на творческой стороне вещей на секунду, мы разместили множество наших передовых моделей на портале нашей лаборатории — все это инструменты, помогающие в творческом процессе».

Он указал на недавнюю работу Лупе Фиаско, которая сотрудничала с Google для изучения языковых потоков и новых творческих способов выражения, а также электронного музыканта Дэна Дикона, который использует помощь искусственного интеллекта для точной настройки живых выступлений.

Gemini 1.5 предлагает новые возможности для разработки игр

Gemini 1.5 Pro, мультимодальная модель среднего размера Google, недавно была выпущена в общедоступной предварительной версии более чем в 180 странах и территориях через Gemini API. Он предлагает новые функции, такие как встроенное понимание речи, оптимизирован для задач текста, изображений, видео, аудио и кодирования и может обрабатывать до 1 миллиона токенов в производстве (и до 10 миллионов в лаборатории, добавил Токумине).

«Модели наконец-то способны сохранять контекст и использовать его для генерации убедительного ответа», — сказал он. «Если вы когда-либо пытались реализовать решения для поиска информации на основе RAG, вы знаете, что это серьезная проблема и настоящая проблема. Я в восторге от моделей с точки зрения создания новых вещей».

Google Cloud предлагает разработчикам преимущества управляемой платформы для обеспечения безопасности данных и точной настройки моделей, а также предоставляет доступ к огромной библиотеке сторонних моделей, добавил Токумине, указав на недавнюю сделку Google с Hugging Face, которая имеет больше Доступно более 100 000 моделей.

Потенциал LLM для разработчиков игр

Гленн Кэмерон, менеджер по маркетингу продуктов Google, изучил возможности программ LLM для разработки игр. По словам Кэмерона, эти массивные модели могут понимать сложные запросы и возвращать точные, детальные ответы, что делает их особенно эффективными в качестве творческих помощников через интерфейсы чата.

«Они могут стать вашим двигателем вдохновения, помочь вам преодолеть творческие блоки, особенно когда вы продумываете квесты или истории персонажей. Они могут быть вашими соавторами. Вы можете спросить их о чем угодно, и они помогут вам придумать идеи», — объяснил он. «Эти вещи меняют подход разработчиков к созданию игр, особенно на ранних стадиях».

Модели преобразования текста в изображение, а также такие технологии, как DreamBooth, модель генерации глубокого обучения Google, которую можно использовать для персонализации существующих моделей преобразования текста в изображение путем точной настройки, можно использовать для визуализации символов, рендеринга изображений из текста и фона. , видео и многое другое.

Его можно использовать в качестве естественного помощника по написанию кода для создания нужного вам кода для конкретной функции на предпочитаемом вами языке кодирования или в качестве помощника по завершению кода. Благодаря революционному миллионному контекстному окну такие модели, как Gemini 1.5 Pro, помогут отслеживать все детали истории вашей игры и обеспечить целостное, правдоподобное повествование, включая динамичные диалоги без сценария и открытые чаты с NPC, которые помнят предыдущие встречи.

Легкая открытая модель Google для разработки

Google предлагает два семейства моделей: Gemini и недавно выпущенную Gemma, обе из которых можно использовать в играх. Gemma основана на исследованиях и технологиях, используемых при создании моделей Gemini, но является более легкой и открытой. Он был запущен во всех основных библиотеках и фреймворках, включая Keras, JAX, TensorFlow, PyTorch и Hugging Face, а Gemma можно запускать как двоичный файл на процессоре.

Модель поставляется в двух размерах: с размером в 2 миллиарда параметров, который можно запускать локально на мобильном телефоне или ноутбуке, и моделью с 7 миллиардами параметров, для которой требуется мощность игрового графического процессора настольного компьютера. Gemma также поставляется с набором ответственных генеративных инструментов искусственного интеллекта, который помогает разработчикам устанавливать ограничения на контент, чтобы обеспечить игрокам безопасный и приятный опыт.

Но с большой силой приходит и большая ответственность, добавил Кэмерон.

«LLM обучаются на огромных объемах данных, и эти данные содержат предвзятость. В нем есть токсичное содержание. Эти вещи могут создавать предвзятый контент, что опасно», — сказал он. «Вы должны быть осторожны при использовании этих вещей. Вам нужно убедиться, что вы следите за ними, что вы заботитесь об этом. Если вы этого не сделаете, вы можете понести множество репутационных и финансовых рисков».

Начало работы с поколением ИИ для живых игр

В заключительной презентации Дэн Зарацян, архитектор решений в области искусственного интеллекта и машинного обучения в Google Cloud, и Джоване Моура-младший, специалист по гибридным облакам в Google, продемонстрировали, как генеративный ИИ и Google Cloud могут поддерживать инновационное взаимодействие игроков на примере многопользовательской игры. от Google Cloud. Они построили его на базе управляемого Kubernetes с помощью Google Kubernetes Engine (GKE), что позволяет легко масштабировать и распределять рабочие нагрузки ИИ по всему миру. Он предлагает низкую задержку и гибкую совместимость, что означает, что он может легко переключаться между открытыми моделями — например, с Vertex на локальную открытую модель, и может работать где угодно без блокировки.

Spanner хранит внедрения, что важно для очень быстрого поиска подходов на основе RAG, поскольку он не только извлекает соответствующую информацию о внедрении для передачи в подсказку, но также может интегрироваться с другими структурированными данными — и при этом иметь глобальный масштаб и полную согласованность, соответствующую активам. базу данных, которая может служить глобальному сообществу.

Поддержание долговременной памяти с помощью такой базы данных, как Spanner, особенно в эфемерных типах сервисов, которые являются глобально масштабируемыми, имеет решающее значение для создания реалистичных NPC. История чата и взаимодействия каждого NPC могут храниться в Spanner. Затем, когда NPC задается новый вопрос, мы можем семантически искать исторические разговоры игроков, чтобы вспомнить соответствующие разговоры. Эти разговоры затем используются LLM для разумного ответа на вопрос игрока, принимая во внимание сам вопрос, а также полученные знания, которые он собрал в ходе прошлых разговоров. Поддержка сотен мыслей неигровых персонажей по всему миру, в большом масштабе и с низкой задержкой делает Spanner лучшим выбором для этого приложения.

Будущее генеративного искусственного интеллекта в игровой разработке

В будущем будут продолжать появляться новые инструменты и сервисы, призванные изменить способ работы и мышления разработчиков. Например, команда Google Cloud работает над объединенными запросами, чтобы значительно усложнить поведение NPC. Вместо передачи запросов туда и обратно к одному ограниченному LLM, цепочки или последовательные группы LLM могут объединять запросы к множеству конечных точек — другому LLM, базе данных SQL, API и т. д. Другими словами, если игрок задает NPC вопрос, на который LLM не настроен, чтобы ответить, или его просят выполнить действие, для которого он не предназначен, к базе данных SQL может быть отправлен фоновый запрос с этим информация или запрос API могут быть инициированы.

«Если вы подумаете объединить этих NPC, этих LLM, чтобы сделать что-то очень последовательное и очень мощное, вы сможете начать получать от LLM гораздо больше, чем просто один проход туда и обратно к LLM», — сказал Зарацян.


Спонсорские статьи — это контент, созданный компанией, которая либо платит за публикацию, либо имеет деловые отношения с VentureBeat, и они всегда четко обозначены. Для получения дополнительной информации свяжитесь sales@venturebeat.com.

[ad_2]

Источник

banner

Вам может понравиться

Обзор сервисов ИИ

Искусственный интеллект

Daily AI

ИИ в жизни, бизнесе, науке и искусстве.

@2024 All Right Reserved. Designed and Developed by PenciDesign