Up-to-data: где искать специалиста по данным

Lynda.com
Lynda.com
Хайп вокруг работы с big data вряд ли в ближайшее время пойдет на спад, поэтому крупным компаниям не помешает обзавестись своим датологическим отделом. Редакция разбиралась, как и где искать редкого зверя — data-scientist, и как его удержать

Рынок дата-саентистов нельзя назвать новым — он появился в 2015 году, и в таком быстрорастущем мире IT его вряд ли можно назвать чем-то из ряда вон выходящим. Существует проблема в востребованности подобных специалистов на рынке — они просто на разрыв. И если 1,5-2 года назад в Украине насчитывалось 250 специалистов по дата-анализу, то сейчас, с учетом всеобщего увлечения big data, за ними просто открыли охоту. За последние 2 недели только на одном из популярных сайтов поиска работы work.ua появилось более 200 вакансий на должность data specialist/scientist.  

Где и кого искать 

Понятно, что стать хорошим дата-специалистом, пройдя всего лишь пару занятий на Coursera, Prometheus или Udemy, нереально. Поэтому, по словам хедхантеров, основные места обитания перспективных специалистов по работе с данными — математические факультеты, особенно кибернетика и статистика. Чем лучше у кандидата знание статистики — тем лучше.  Подойдут и студенты последних курсов, но лучше — магистры. 

В крупных IT-компаниях, много работающих с данными, data-департаменты заинтересованы в кандидатах математических наук, особенно в части статистики.  

Второе место где стоит искать – экономические факультеты, а также финансовые департаменты аудиторских или страховых компаний, которые занимались анализом рисков или прогнозированием. Оттуда можно переманить заинтересованного, хоть и не полностью сформированного профи с хорошими навыками. 

Третье — специализированные программы университетов и бизнес-школ. Так, например, data-саентистов в Украине целенаправленно  готовят Украинский католический университет (УКУ) и львовская школа LITS. Эти два заведения — отличные поставщики стажеров, которые в дальнейшем смогут стать полноценными членами команды. К примеру, в IT-компании Ciklum сейчас работают два стажера из УКУ. 

 

Например, в телеком-компании "Киевстар" считают, что специалистов по работе с данными пока еще слишком мало, поэтому предпочитают готовить их сами. В 2016 году прошла первая Big Data School, целью которой было обучить 27 студентов азам работы с data с перспективой их трудоустройства в компанию. Впрочем, продолжения этот проект не имел, хотя в компании и не исключают следующего набора. 

Проблемы поиска 

Специалистов по данным чрезвычайно мало. Еще несколько лет назад в Украине их насчитывалось всего 250. Сегодня же спрос на них возрастает, и с ним появляются проблемы. 

Большинство тех, кто в достаточном объеме знает и понимает работу со статистикой, работают на внутреннем рынке, и они часто не понимают специфику работы в IT-отрасли. Это часто касается бизнес-аналитиков из финансового сектора, которым сложно приспособиться к необходимости изучения новых инструментов работы, например, языков программирования.

К тому же, в хедхантинговых компаниях говорят, что такие кандидаты не слишком хотят рисковать своим местом, поэтому, чтобы их привлечь, нужно поручить им интересный и нетривиальный проект. 

Другая проблема заключается в том, что программистов сложно переквалифицировать в дата-специалистов, хотя, казалось бы, бэкграунд у них в математике достаточен. Во-первых, они менее сильны в статистике, во-вторых, инструменты дата-аналитики сильно отличаются от обычных инструментов программиста, например, используются другие языки, более "заточенные" под статистику (тот же R, которым никто кроме математиков и специалистов по данным широко не пользуется). 

Что он должен знать? 

Но если уж удалось найти достойного кандидата, стоит внимательно проверить его базу знаний. Тем не менее математиком или программистом в чистом виде быть не обязательно, но и гуманитарий здесь не подойдет. В компаниях выделяют два основных блока, которые стоит проверять у кандидата – теоретический и практический. Теоретический – дискретная математика, математическая статистика и ее анализ, алгоритмы, в частности, машинного обучения. Знания в экономике также немаловажны — в IT-компаниях говорят, что проще взять кандидата с отличным знанием экономики, финансовой системы и статистики и научить его: для junior достаточно знания минимальных основ программирования, на позиции middle либо senior требуется опыт работы с пакетами обработки данных. Они охватывают множество инструментов, платформ, аппаратного и программного обеспечения. Например, Microsoft Excel, SQL и R являются основными инструментами. На уровне предприятия важны SPSS, Cognos, SAS, MATLAB, также Python, Scala, Java, Linux, Hadoop и HIVE. 

 

Важными умениями являются также сторителлинг и визуализация – аналитик должен уметь объяснить не "технарю", о чем говорит модель, анализ, и при необходимости визуализировать его. Для этого чаще всего используются программа Tableau и пакет Splunk для анализа и визуализации данных. Кроме того, дополнительным преимуществом будет знание HTML5, которое даст возможность создать интерактивную визуализацию. Впрочем, средствами R и программы для работы с этим языком можно также сделать простейшую диаграмму. 

Как проверять и как устраивать 

Сейчас у компаний уже появились критерии отбора. Если раньше искали просто адекватных людей с некоторым аналитическим бэкграундом, которые готовы были учиться, то сейчас обращают больше внимания на тестовые задания. Кроме того, довольно легко проверить, интересуется ли кандидат аналитикой больших данных — многие участвуют в дата-соревновании Kaggle, там также можно найти лучших из лучших. Стоит отметить, что украинские дата-саентисты занимают неплохие места в решении задач, поэтому часто слава идет впереди кандидата. 

ЧИТАЙТЕ ТАКЖЕ: Приемы против кибер-лома: как big data защищает от хакеров

HR-профи особо обращают внимание на комбинацию "тестовое задание + испытательный срок", потому что даже при идеальном выполнении теста остается вероятность того, что новичок просто не впишется в команду. Особых секретов для проверки совместимости именно для команды дата-аналитики нет — для нее действуют те же принципы, что и для программистов. Да и системы работы предпочтительны те же – Agile, Scrum, Kanban, которые минимизируют возможность ошибки.  

В то же время лучший способ работы – оформление по контракту на длительный срок. Есть одна особенность, которая делает дата-саентистов "непригодными" для разового участия в конкретном проекте. И сами аналитики, и HR говорят, что лучше создавать готовую команду и поддерживать в ней здоровую атмосферу, нежели каждый раз составлять ее заново и тратить время на притирку. 

Эффективность и ее измерение 

Сложность измерения эффективности дата-саентиста в том, что не все этапы его работы очевидны для стороннего наблюдателя. Лучше всего, если оценивать его будет руководитель аналитической группы, который будет видеть процессы и понимать их стадии. Например, самой "занудной" является фаза очистки информации, во время которой измерить эффективность профи просто нереально. Самая активная фаза — моделирование — наиболее пригодна для оценки эффективности. И Scrum с его регулярными отчетами в этом в помощь. 

 

Часто вопрос измерения эффективности работы дата-саентиста возникает из-за того, что клиент или заказчик проекта не всегда видят работу команды. В анализе данных есть некоторые этапы, на которых посторонний может начать спрашивать "а мы уже приехали?" Это сбивает и саму команду с настроя и может в итоге увеличить длительность выполнения задачи. Поэтому существенны для оценки всего два фактора — экономическая эффективность (сколько он принес компании) и время выполнения задачи, соотнесенное с ее сложностью. 

Сколько надо платить и как удержать 

Понятно, что мы живем не в Кремниевой долине, но даже там заработная плата data-scientist довольно высока по меркам IT-сообщества. Средний оклад senior data scientist – $180-200 тыс. в год, что примерно на 20-25% больше, чем получает senior developer. В Украине соотношение аналогично, только цифра все же меньше:) Ни хедхантеры, ни представители компаний точных сумм не называют, но в целом, просмотрев ставки на dou.ua и прибавив к ним 20%, можно понять, сколько будет стоить работа дата-саентиста – от $1,5 тыс. до $6 тыс.

Стоит учесть, что дополнительные навыки типа той же Java повлекут за собой рост зарплатного предложения на 5-15%. 

Высокая зарплата, к тому же, один из мотиваторов перехода для дата-саентистов из одной компании в другую. Как и мотиватор для того, чтобы остаться. Если в случае с программистами, для которых довольно важны разнообразные "плюшки" от работодателя — спортзал, питание, и другие приятности, для аналитиков важнее все же интересный проект. Ведь в датологии все же больше от этакой работы информационного детектива, нежели чистого программирования.