По данным консалтинговой компании McKinsey Global Institute, к 2018 году только в США понадобятся дополнительно 190 тысяч специалистов по данным. Кроме того, McKinsey предполагает, что менеджерам среднего звена в скором времени также будут необходимы базовые навыки работы с данными. Другими словами, если вы не помешаны на анализе информации, то через десять лет вам просто не найдется места на руководящих должностях.
Сегодня профессия data scientist по-прежнему окружена массой мифов. Чаще всего специалист по анализу данных представляется эдаким универсальным солдатом, способным решать разноплановые задачи, стоящие перед аналитиками. Или другая крайность — когда с этой профессией связывают почти любого ИТ-специалиста, работающего с данными.
Для начала нужно определиться в понятиях. Согласно Wikipedia, data science — раздел информатики, изучающий проблемы анализа, обработки и представления данных в цифровой форме. Другими словами, это объединение традиционных методов информатики по проектированию и разработке баз данных, обработке данных в условиях больших объемов, статистических методов, методов интеллектуального анализа данных и т.д. С начала 2010-х годов, во многом благодаря популяризации концепции "больших данных", специализация data scientist считается одной из самых привлекательных, высокооплачиваемых и перспективных профессий.
В чем же заключаются основные навыки специалистов data scientist? Это в первую очередь способность находить логические связи в системе собранной информации и на основании этого принимать те или иные бизнес-решения. Именно такое сочетание компетенций определяет ценность профессионала по изучению данных. Что касается используемых технологий, то специалисты data scientist, как правило, в своей работе применяют такие аналитические инструменты, как визуализация данных, машинное обучение, распознавание скрытых взаимосвязей, подготовка данных, текстовая аналитика и т.д.
Среди ключевых обязанностей специалиста data scientist я бы выделил следующие:
- сбор больших объемов разрозненных данных и приведение их в более удобный формат
- решение бизнес-задач, связанных с использованием продвинутых методов обработки данных
- работа с различными языками программирования, в том числе с SAS, R и Python
- специализированные знания в области статистики, в том числе статистических тестов и статистического распределения
- владение продвинутыми аналитическими инструментами, такими как машинное обучение и текстовая аналитика
- поиск скрытых связей и закономерностей в данных, а также анализ основных тенденций
- понимание бизнес-запросов своей организации, глубинный опыт в соответствующей бизнес-сфере
Однако речь идет не только о программировании. Помимо вышеперечисленных задач, специалист data scientist должен быть связующим звеном между всеми участниками бизнес-процесса, другими словами — говорить на одном языке как с аналитиками и разработчиками, так и с ключевыми сотрудниками, руководством компании и ее собственниками.
Где готовят таких специалистов в мире? В первую очередь, это традиционные вузы. Кроме того, курсы по анализу данных есть практически во всех ведущих университетах США и Европы. Искать подобные образовательные программы также можно на таких порталах, как Coursera и edX. Например, SAS Academy for Data Science предлагает шестинедельную программу по подготовке специалистов data science и Big Data.
Зачастую мировые вендоры также создают совместные образовательные программы с ведущими университетами мира. В Украине это Академическая программа SAS, которая проводится совместно с "Институтом системного прикладного анализа" НТУУ "КПИ". Однако у нас пока нет системного подхода к этой профессии, никто не готовит таких специалистов, в то время как во всем мире на них уже есть реальный спрос. И я считаю, что у нашей страны есть отличный потенциал в их подготовке.
Важный момент — привлечение специалиста data scientist должно быть потребностью бизнеса, а не просто данью моде. Как понять, когда бизнес готов нанять такого профессионала? Для этого необходимо ответить на следующие вопросы:
- Речь идет о больших объемах данных и сложных задачах, которые должны быть решены? Как правило, эти специалисты востребованы в таких отраслях, как финансы, госсектор и фармацевтика.
- Ценны ли данные для компании? Есть ли в компании "место" для аналитики?
- Готова ли компания к переменам? Это касается как руководителей и собственников, так и рядовых сотрудников.
На мой взгляд, через 3-4 года базовые навыки data science будут необходимы любому менеджеру среднего звена. Это как английский язык сегодня — уже не конкурентное преимущество, а необходимое требование.
Кроме того, data scientist — это профессия изменений, и международный бизнес, который уже сегодня стоит на пороге этих самых изменений, столкнется с потребностью в таких специалистах в первую очередь. Основные доходы наша компания получает от телекома, финансового сектора и ритейла. Сегодня это наиболее динамично развивающиеся отрасли, поэтому, на мой взгляд, именно им в скором времени и потребуются специалисты data science и в Украине.