[ad_1]
HumanSignal, фирма, стоящая за широко используемой программой Label Studio с открытым исходным кодом для маркировки данных, сегодня расширяет свои усилия, запустив платформу с открытым исходным кодом Adala для автономных агентов маркировки данных.
HumanSignal ранее была известна как Heartex и провела ребрендинг в июне 2023 года, чтобы привлечь внимание к своему основному ценностному предложению по включению людей в цикл обучения машинному обучению (ML). Разметка данных является основополагающим видом деятельности для моделей обучения и в прошлом была очень трудоемким процессом. С помощью Label Studio ученые, работающие с данными, получают инструменты для маркировки различных типов данных, включая текст и видео. В условиях быстрого развития машинного обучения HumanSignal стремится сформировать будущее надежной и эффективной обработки данных с помощью своей новой платформы Adala с открытым исходным кодом.
Адала — это аббревиатура от Аавтономный Дата лприношение Аgent, и это подход, который использует агенты искусственного интеллекта новым способом, чтобы помочь ускорить и улучшить процесс маркировки данных.
«Мы начали спрашивать себя, что значит создать то, что мы называем надежным агентом ИИ, которому можно доверять», — рассказал VentureBeat Майкл Малюк, соучредитель и генеральный директор HumanSignal. «Adala — это наш ответ, призванный помочь в создании автономных надежных агентов, специально ориентированных на задачи обработки данных».
Как Adala помогает ускорить процесс маркировки данных
Агенты Adala предназначены для обучения и совершенствования в таких задачах, связанных с данными, как классификация и маркировка, при наличии базовых наборов данных. Базовый набор данных является основой для определения меток данных и может быть разработан с использованием технологии Label Studio.
Малюк объяснил, что в рамках Adala существует концепция среды, которая в основном определяет, как агент учится, при этом основная истина является частью среды. Агент Adala будет взаимодействовать с окружающей средой, учиться на ней, и после нескольких итераций обучения он становится механизмом прогнозирования. В первоначальном целевом варианте использования Adala прогнозы используются для применения маркировки данных к остальной части набора данных, которая еще не маркирована.
Агенты Adala работают на том, что Малюк назвал средой выполнения, которая по сути представляет собой большую языковую модель (LLM). Среда выполнения выполняет задачу, назначенную для агента, и возвращает ответы.
Николай Любимов, технический директор HumanSignal, объяснил, что частью архитектуры платформы Adala является требование к некоторой форме хранилища, которым обычно является векторная база данных. Он отметил, что процесс получения метки данных, которую можно применить к новым данным, во многом аналогичен тому, как работает технология расширенной генерации (RAG) для LLM.
Adala — это не только маркировка данных
Малюк отметил, что сообщество пользователей Label Studio просит о всевозможных автоматизациях.
Первоначальной возможностью Adala является маркировка данных, но он подчеркнул, что она может быть универсальным агентом для различных задач обработки данных. Поскольку проект Adala имеет открытый исходный код, он надеется, что пользователи будут предлагать идеи и код того, как они хотят, чтобы Adala расширялась.
«Через год это будут разные типы агентов с разными навыками, которые смогут взаимодействовать и получать обратную связь из разных типов среды», — сказал Малюк. «И это чрезвычайно мощный подход, которым мы хотим поделиться с более широким сообществом».
[ad_2]
Источник