[ad_1]
В последнее время было много разговоров о том, как революция искусственного интеллекта уменьшит роль инженеров по обработке данных. Я не думаю, что это так — на самом деле, экспертиза данных будет более важна, чем когда-либо. Однако специалистам по данным придется приобрести новые навыки, чтобы помочь своим организациям получить максимальную отдачу от ИИ и улучшить свои карьерные перспективы в будущем.
ИИ открывает организациям возможность извлекать больше пользы из своих данных и делать это более эффективно, но это не может произойти само по себе. Инженерам по обработке данных необходимо будет узнать, как и где применять эту технологию, а также какие модели и инструменты использовать в каких ситуациях.
Вот четыре области, в которых ИИ изменит аналитику данных в следующем году, а также навыки, которые инженеры данных должны приобрести для удовлетворения этих потребностей.
Создание более интеллектуальных конвейеров данных
Конвейеры данных объединяют источники данных, которые могут быть необработанными, неструктурированными и дезорганизованными, и задача инженеров — извлекать информацию из этих источников для предоставления ценной информации. ИИ собирается изменить эту работу.
Внедрение искусственного интеллекта в конвейеры данных может значительно ускорить способность инженеров данных извлекать ценность и ценную информацию. Например, представьте, что у компании есть база данных стенограмм обслуживания клиентов или других текстовых документов. С помощью нескольких строк SQL инженер может подключить модель ИИ к конвейеру и дать ей указание получить ценную информацию из этих текстовых файлов. Выполнение этого вручную может занять много часов, а некоторые наиболее ценные сведения могут быть обнаружены только с помощью ИИ.
Инженеры по обработке данных, которые понимают, где и как применять модели ИИ для извлечения максимальной пользы из конвейеров данных, будут очень ценны для своих организаций, но это требует новых навыков в отношении того, какие модели выбирать и как их применять.
Меньше сопоставления данных, больше стратегии данных
Различные источники данных часто хранят информацию по-разному: например, в одной исходной системе название штата может называться «Массачусетс», а в другой — аббревиатура «МА».
Сопоставление данных для обеспечения их согласованности и отсутствия дубликатов — это специально разработанная работа для ИИ. Инженеры могут создать подсказку, которая по существу гласит: «Возьмите эти 20 источников данных о клиентах и создайте мне каноническую базу данных клиентов», и ИИ выполнит задачу за гораздо меньшее время.
Это потребует знаний о том, как писать хорошие подсказки, но, что более важно, это высвободит время инженеров, и они смогут тратить меньше времени на сопоставление данных и больше на стратегию данных и архитектуру данных своей организации.
В конечном итоге цель состоит в том, чтобы понять все источники данных, доступные организации, и то, как их лучше всего использовать для достижения бизнес-целей. Передача таких задач, как отображение данных, в модель ИИ, высвободит время для этой работы более высокого уровня.
BI-аналитики должны повысить уровень своей игры
Аналитики бизнес-аналитики (BI) сегодня тратят много времени на создание статических отчетов для руководителей бизнеса. Когда у этих руководителей возникают дополнительные вопросы по поводу данных, аналитики должны выполнить новый запрос и создать дополнительный отчет. Генеративный искусственный интеллект кардинально изменит ожидания этих руководителей.
По мере того, как руководители приобретают больше опыта работы с чат-ботами, управляемыми искусственным интеллектом, они будут ожидать, что будут взаимодействовать со своими бизнес-отчетами аналогичным диалоговым способом. Это потребует от BI-аналитиков усовершенствовать свою игру и научиться предоставлять эти интерактивные возможности. Вместо того, чтобы создавать статические диаграммы, им нужно будет понять конвейеры, плагины и подсказки, необходимые для создания динамических интерактивных отчетов.
Платформы облачных данных включают некоторые из этих возможностей с минимальным использованием кода, давая BI-аналитикам возможность расширить свои навыки для удовлетворения новых требований. Но есть кривая обучения, и приобретение этих навыков станет для них проблемой в 2024 году.
Управление сторонними сервисами ИИ
Когда десять лет назад облако стало популярным, ИТ-команды тратили меньше времени на создание инфраструктуры и программного обеспечения и больше времени на управление сторонними облачными сервисами. Ученые, работающие с данными, собираются пройти через аналогичный переход.
Рост поколения искусственного интеллекта потребует от ученых, работающих с данными, больше сотрудничать с внешними поставщиками, которые предоставляют модели искусственного интеллекта, наборы данных и другие услуги. Знание вариантов, выбор правильной модели для поставленной задачи и управление взаимоотношениями с третьими сторонами будут важным навыком, который необходимо приобрести.
Ждём ещё большего удовольствия
Многие команды данных сегодня говорят, что они застряли в реактивном режиме, постоянно отвечая на последние запросы о работе или исправляя вышедшие из строя приложения. Это никому не доставляет удовольствия, но появление искусственного интеллекта в области обработки данных изменит ситуацию.
ИИ позволит инженерам автоматизировать самые трудоемкие части своей работы и освободить время для размышлений над более широкой картиной. Это потребует новых навыков, но позволит им сосредоточиться на более стратегической, проактивной работе, что сделает инженеров данных еще более ценными для своих команд, а их работу — намного более приятной.
Джефф Холлан — директор по управлению продуктами Snowflake.
[ad_2]
Источник