[ad_1]
Mistral, стартап в области искусственного интеллекта, созданный год назад, который попал в заголовки газет благодаря своему уникальному логотипу Word Art и крупнейшему в истории Европы посевному раунду, представил Mistral Large — свою новейшую и крупнейшую модель для предприятий — и заключил стратегическое партнерство с Microsoft. это дает стартапу новый канал сбыта и 16 миллионов долларов свежего капитала.
Mistral Large, доступный с сегодняшнего дня, был разработан как модель генерации текста, способная решать сложные многоязычные задачи рассуждения, включая понимание, преобразование и генерацию кода текста. Согласно результатам тестирования массового многозадачного понимания языка (MMLU), предоставленным компанией, он работает довольно хорошо, занимая лишь вторую лучшую модель, обычно доступную через API, после GPT-4.
Mistral утверждает, что большая модель будет доступна в первую очередь через API, а также через Azure AI благодаря новому партнерству с Microsoft. Компания также запустила оптимизированную версию Mistral Small, меньшую модель, которую она предлагает, и приложение для чата, которое поможет бизнес-командам получить представление о том, что предлагает компания.
Мистраль Большой: Чего ожидать?
Будучи многоязычной моделью, Mistral Large будет понимать, рассуждать и генерировать текст на родном языке не только на английском, но и на других языках, начиная с французского, испанского, немецкого и итальянского. Это не что-то новое, поскольку Google и OpenAI также предлагают многоязычные модели, но Mistral подчеркивает, что их предложение имеет «тонкое понимание грамматики и культурного контекста» для всех языков, что приведет к лучшим результатам.
Модель имеет контекстное окно на 32 тыс. токенов, что позволяет ей обрабатывать большие документы и точно вызывать информацию. Он также обеспечивает точное следование инструкциям, что позволяет разработчикам разрабатывать свои политики модерации и собственные вызовы функций.
Пока еще неизвестно, как новая модель поведет себя в реальном мире, особенно в сравнении с более крупными предложениями, такими как Gemini 1.5, поддерживающими до 1 миллиона токенов, но Mistral утверждает, что модель неплохо справляется с конкурирующими предложениями.
Например, в тестах MMLU точность Mistral Large составила 81,2%, уступая только 86,4% точности GPT-4. В тест не вошел Gemini Pro 1.5, но Gemini Pro 1.0 набрал 71,8%. Llama 2 70B также остался позади с результатом 69,9%.
Предложение Meta даже не смогло превзойти (или сравниться) с Mistral в языковых тестах.
Хотя аналогичные результаты были замечены в тесте GSM8K Math с участием Llama и семейства GPT, кодирование оказалось слабым местом для Mistral Large. В тесте производительности кодирования HumanE новая большая модель показала точность 45,1%, значительно отставая от GPT-3.5, GPT-4 и Gemini Pro 1.0.
Компания также выпустила новую версию своей меньшей модели Mistral Small с оптимизацией задержки и стоимости. Он превосходит Mixtral 8x7B и служит промежуточным решением между предложением компании с открытым весом и Mistral Large.
Стратегическое партнерство с Microsoft и новое приложение Chat
Хотя создание моделей, которые хорошо работают, имеет решающее значение, вы должны обеспечить, чтобы они охватывали нужных клиентов, когда и когда это необходимо – аспект, критически важный для роста. Именно здесь на помощь приходит стратегическое партнерство Mistral с Microsoft.
В рамках этого соглашения Mistral получит 16 миллионов долларов от компании, возглавляемой Сатьей Наделлой, а все ее открытые и коммерческие модели, включая новое крупное предложение, будут доступны в Azure AI Studio и Azure Machine Learning. Это делает Mistral лишь второй компанией, которая сделала свои коммерческие языковые модели доступными в Azure.
Mistral утверждает, что пользователи Azure могут использовать модели с имеющимися у них кредитами и использовать их «так же удобно, как и с собственными API». Компания также предоставит прямой доступ к своей команде поддержки клиентам, приходящим через Azure.
«В Mistral AI мы делаем генеративный искусственный интеллект повсеместным — посредством наших моделей с открытым исходным кодом и внедрения наших коммерческих моделей там, где разработчики создают. Мы очень рады сообщить о доступности Mistral Large на Azure AI. Доверие Microsoft к нашей модели — это шаг вперед на пути к тому, чтобы передать передовой искусственный интеллект в руки каждого», — заявил в своем заявлении Артур Менш, соучредитель и генеральный директор Mistral AI.
Тем не менее, для Mistral Microsoft не будет единственным партнером по распространению. Несколько дней назад главный адвокат разработчиков Amazon Web Services (AWS) Донни Пракосо также объявил, что открытые модели французского стартапа появятся на Amazon Bedrock, его управляемом сервисе для предложений поколения AI и разработки приложений. Однако он не уточнил, когда именно это произойдет.
Чтобы завоевать доверие компаний и в конечном итоге привлечь их к работе по этим каналам, Mistral также запускает приложение для чата, многоязычного диалогового помощника, который показывает, что команды могут создать с помощью его моделей и развернуть в соответствующей бизнес-среде.
Пользователи могут создать учетную запись на веб-сайте Mistral для доступа к бета-версии Mistral Chat и в педагогической и увлекательной форме взаимодействовать с моделями, которые предлагает компания. Однако компания предупреждает, что не сможет получить доступ к Интернету и в некоторых случаях может предоставлять неточную или устаревшую информацию. Компания также разрабатывает корпоративную версию помощника с возможностью самостоятельного развертывания и детальной модерацией.
«Благодаря настраиваемому механизму модерации на системном уровне le Chat неинвазивно предупреждает вас, когда вы продвигаете разговор в направлении, где помощник может создавать конфиденциальный или противоречивый контент», — отметила компания в другом сообщении в блоге.
По данным Crunchbase, Mistral привлекла более $500 млн в рамках посевных раундов и раундов серии А под руководством таких известных инвесторов, как Lightspeed Venture Partners и Andreessen Horowitz (a16z).
[ad_2]
Источник