[ad_1]
Сегодня Google DeepMind представила Gemma, свои новые модели с открытым исходным кодом 2B и 7B, созданные на основе тех же исследований и технологий, которые использовались при создании недавно анонсированных компанией моделей Gemini.
Модели Gemma будут выпущены с предварительно обученными и настроенными инструкциями вариантами, сообщает Google DeepMind в своем блоге. Веса моделей будут выпущены с разрешительной коммерческой лицензией, а также с новым набором инструментов Responsible Generative AI.
Google также предоставляет наборы инструментов для вывода и контролируемой точной настройки (SFT) во всех основных платформах: JAX, PyTorch и TensorFlow через встроенный Keras 3.0. Существуют готовые к использованию ноутбуки Colab и Kaggle, а Gemma интегрирована с Hugging Face, MaxText и NVIDIA NeMo. Предварительно обученные и настроенные модели Gemma могут работать на ноутбуке, рабочей станции или в облаке Google с развертыванием на Vertex AI и Google Kubernetes Engine.
Nvidia также объявила сегодня, что в сотрудничестве с Google она запустила оптимизацию на всех платформах NVIDIA AI, включая локальные ПК с искусственным интеллектом RTX, для повышения производительности Gemma.
Google теперь предлагает как API, так и открытые модели для рабочего процесса
Джанин Бэнкс, вице-президент и генеральный менеджер разработчика X и руководитель отдела по связям с разработчиками в Google, рассказала VentureBeat на брифинге для прессы, что модели Gemma «чувствовали себя продолжением» истории Google по использованию технологий открытого исходного кода для разработки ИИ с помощью таких инструментов, как TensorFlow. и Jax к другим моделям и системам искусственного интеллекта, таким как PaLM2 и AlphaFold, вплоть до Gemini.
Она также сказала, что благодаря отзывам во время разработки моделей Gemini компания Google DeepMind «пришла к ключевому выводу: в некоторых случаях разработчики будут использовать как открытые модели, так и API дополняющим друг друга в своем рабочем процессе в зависимости от стадии разработки». рабочий процесс, в котором они участвуют».
По ее словам, поскольку разработчики экспериментируют и создают ранние прототипы, может быть легко начать с API для тестирования подсказок, а затем перейти к настройке и точной настройке с помощью открытых моделей. «Мы чувствовали, что было бы идеально, если бы Google мог быть единственным поставщиком API и открытых моделей, предлагающим самый широкий набор возможностей для работы сообщества».
Google DeepMind выпустит полный набор тестов
Трис Варкентин, директор по управлению продуктами Google DeepMind, рассказал VentureBeat на брифинге для прессы, что компания выпустит полный набор тестов, сравнивающих Gemma с другими моделями, которые каждый сможет сразу увидеть в списках лидеров OpenLLM.
«Мы сотрудничаем как с Nvidia, так и с Hugging Face, поэтому практически все публичные тесты сравниваются с этими моделями», — сказал он. «Это полностью прозрачный и открытый для сообщества подход, поэтому мы на самом деле очень гордимся этим, потому что, если посмотреть на цифры, я думаю, что мы проделали чертовски хорошую работу».
Джемму назвали «ответственной по замыслу»
Варкентин также подчеркнул безопасность Gemma: «Все они были тщательно оценены как самые безопасные модели, которые мы могли бы выпустить на рынок в таких размерах, наряду с предварительным обучением и оценкой», — сказал он.
В сообщении в блоге Google DeepMind говорится: «Gemma разработана с учетом наших принципов искусственного интеллекта. Чтобы сделать предварительно обученные модели Gemma безопасными и надежными, мы использовали автоматизированные методы для фильтрации определенной личной информации и других конфиденциальных данных из обучающих наборов. Кроме того, мы использовали обширную настройку и обучение с подкреплением на основе обратной связи с людьми (RLHF), чтобы привести наши модели, настроенные с помощью инструкций, в соответствие с ответственным поведением. Чтобы понять и снизить профиль риска для моделей Gemma, мы провели тщательные оценки, включая ручное объединение в красные команды, автоматическое состязательное тестирование и оценку возможностей модели для опасных действий. Эти оценки изложены в нашей типовой карточке*».
Помимо безопасности, Варкентин подчеркнул роль открытой экосистемы в развитии ответственного ИИ.
«Мы считаем, что это действительно важно — нам нужны разнообразные точки зрения разработчиков и исследователей со всего мира, чтобы получить правильную обратную связь и построить еще более совершенные системы безопасности», — сказал он. «Поэтому часть пути к открытой модели заключается в том, чтобы убедиться, что мы интегрируем (эти точки зрения) и что обратная связь, это общение с сообществом является важной частью того, как мы оцениваем ценность этого проекта».
[ad_2]
Источник