Как создать новый рынок на основе открытых данных

Инициатор общественной организации SocialBoost Денис Гурский рассказал о том, как сделать массу полезных, социально значимых сервисов, используя открытые данные, как заставить государство эти данные открыть и что это даст экономике

На основе открытых данных организовано много сервисов, в том числе социальных. В Украине для этого есть огромный потенциал — у нас много программистов, которые имеют опыт создания полезных приложений. Интерактивные карты незаконных застроек, трекинг транспорта, поиск доноров крови, региональная карта преступности, которая показывала, что на Донбассе все было плохо задолго до военных действий и т.д. Но все эти полезные начинания рано или поздно сталкиваются с государством — многие сервисы так и не запустили, хотя могли бы. Для этого ничего не нужно — просто поддержать инициативу и открыть данные. Общественная организация Social Boost взялась за то, чтобы решить проблему — подготовить законодательную базу для использования данных госорганов, свести государство с разработчиками и создать портал, который станет единой базой этих данных.

С чего начинался ваш проект по открытию данных?

По-нормальному, такой проект в любой стране появляется с соответствующего закона или с указа президента в зависимости от формы государственного устройства. Мы этим проектом занялись три года назад, но тогда было бесполезно об этом говорить, и не с кем.

Поэтому мы начали с практической плоскости. Мы проводили двухдневные мероприятия, в рамках которых мы собирали общественных активистов и программистов. Одни знают, что надо делать, какие есть проблемы; другие знают, как программировать, как использовать IT-инструменты для решения тех или иных проблем. Мы закрываем их в зале, и через 48 часов хотим увидеть реально работающие мобильные приложения либо веб-сайты. По окончании срока мы даем призовые деньги на разработку. То, что получается в течение двух дней — это минимально жизнеспособный продукт. Одна функция, без которой не может существовать сервис — рабочая, все остальное надо дорабатывать.

И даже при "той" власти с победителем одного из мероприятий встретился Азаров лично. Пообещал фантастическую государственную поддержку.

И?

И все. Но за год-два существования нашей организации благодаря таким мероприятиям мы собрали более 800 идей для сервисов открытых данных. И профинансировали около 20 разных приложений. Это означает, что таких сервисов может быть невероятное количество. Они все очень нишевые, но это и хорошо. Люди пишут их, основываясь на том, что им нужно. Любой успешный стартап основывается на том, что основатель стартапа видит проблему, подбирает решение. Так вот, государство не знает, что людям надо, оно не живет там, где живут люди. А те, кто пишет жизненные сервисы, исходят из того, с чем они сталкиваются каждый день, что их возмущает. Кроме того, есть IT-компании, которые тоже отлично понимают, как выявлять потребности. И потом либо продают сервисы государству, либо делают их прибыльными.

Сейчас мы хотим сделать акселератор социально-значимых сервисов. Обычно то каких-то людей в команде не хватает, то с ними не могут связаться, то им нужны менторы, то они не могут себя презентовать. Нужно открывать программу месяца на два, а не на 48 часов. Потому что спустя 48 часов они начинают сами барахтаться, а это сложно. А так будет возможность их со всеми познакомить, помочь получить деньги — инвестиционные или грантовые.

Мне особенно интересна связь между ростом ВВП и раскрытием данных.

В начале прошлого года было заказано исследование в Варшавском экономическом институте. Который посчитал, что в Евросоюзе рынок открытых данных будет составлять 206 млрд евро уже к 2020 году. Собственно говоря, это единственная адекватная оценка. Кроме того, на сайте измерили экономический эффект от открытия данных для разных отраслей. Открывая данные, можно построить дополнительные сервисы, прибыль от которых сформирует долю рынка — вот откуда деньги берутся. 206 млрд — это примерный оборот за год.

Какие это могут быть дополнительные сервисы?

Например, подсчитано, каким будет прирост в сельском хозяйстве при открытии определенных сервисов, как повысится конверсия продаж и т.д. Можно обеспечить более эффективную логистику, исходя из того, какие посевные почвы как используются. И правильно рассчитать, например, посев на большую территорию на следующий год, учитывая посевы, которые есть сейчас. Можно вести долгосрочное планирование таким образом. Вот уже сервис готовый :)

Расскажите про data.gov.ua.

Сейчас мы сделали при поддержке Майкрософта и Фонда "Відродження" портал открытых данных. Он находится у нас на обслуживании, но скоро перейдет на баланс госагентства по вопросам науки, инноваций и информатизации. Портал написан на первоклассной системе, которая по всему миру используется, в частности, в Британии. Мы провели уже несколько хакатонов, которые используют и портал, и открытые данные, которые на него выложены. Один был в апреле прошлого года, второй — в октябре.

На данный момент мы разработали законопроект по открытию данных. В экспертную группу вошли представители агентства, программы развития ООН, Реанимационный пакет реформ и SocialBoost — четыре организации. Задача законопроекта — обязать государство выкладывать данные.

Пока то, что я увидела на data.gov.ua — это данные, которые и так были доступны.

Все эти данные просто собраны там, чтобы продемонстрировать активистам и волонтерам, как это работает. Собирали все что можно собрать для того, чтобы, во-первых, привести в машиночитаемый вид. Во-вторых, чтобы обеспечить к этим данным доступ через API — протокол доступа к базе данных.

Например, я сделал интерактивную инфографику — визуализацию бюджета, где есть разные статьи бюджета. Каждый сегмент диаграммы или столбец обращается в базу данных за цифрой. Соответственно, когда меняется база данных (редактируется государством), меняется инфографика, она взаимодействует с базой данных через API-протокол. Суть в том, что эта система позволяет делать кастомные запросы. Там не нужна вся база, только отдельные ячейки: например, чтобы сделать сервис, в котором будет видно, какое количество мужчин пропадает без вести, я делаю запрос в базу данных о людях, пропавших без вести и выбираю только мужчин. И через API вытаскивается только одна строчка. Это дает кучу экономических возможностей — сделал сервис про транспорт, повесил баннер — все, сервис уже генерирует какие-то деньги.

Сколько времени нужно, чтобы система заработала?

Работы еще много. Во-первых, нужен закон, по которому открывается определенный реестр. Во-вторых — подзаконные акты: постановления Кабинета мМинистров, которые обязывают все органы власти открывать данные. Отдельно мы хотим, чтобы конкретные перечни данных, подлежащих раскрытию, определялись постановлением.

И технической работы не на один год.

Ну, не так все сложно. Если документ будет принят, то министерству деться некуда, начнут со следующего месяца все открывать.

У вас готов перечень данных, которые должны быть открыты?

Постановление готово и подписано. Для каждого реестра есть комментарий, как этот реестр должен открываться. А вот то, что касается нереестровых данных (их на самом деле больше), то есть список, рекомендованный Большой двадцаткой. Процесс налажен во всех странах более-менее одинаково.

Но какая-то их часть у нас уже тоже в открытом доступе есть?

Нет. Открытые данные — это данные, пригодные для повторного использования. Если это табличка на сайте — она ничего не дает, ее нельзя скопировать, нельзя сделать запрос, по ней нельзя построить график. Если это табличка в виде строк, проблем нет.

Ясно. Пришел мне ответ на запрос из Киевсовета — они составили нужную таблицу, распечатали на бумажке, бумажку отсканировали и мне прислали, пришлось переносить цифры вручную.

Вот это и есть проблема с повторным использованием. Потому что если эти данные на бумажке, их повторно использовать уже никак нельзя. Бумажку выдали — и до свидания. Многие данные не имеют компьютерного аналога, с этой базой ничего сделать нельзя, даже столбцы местами поменять в ней нельзя.

Почему нельзя решить это на уровне министерств, зачем законопроект?

Это же государство, без законопроекта не получится. Экономические возможности мы проговорили — за счет сервисов, налоговых отчислений. Если государство запускает сервис открытых данных и делает его платным, то в этом тоже ничего плохого нет. Например, парковки Киева. Сервис, по сути, базируется на открытой базе всех парковочных мест и возможности заплатить за парковку еще до того, как ты туда приехал. Там используется база данных, но администрация снимает плату за парковку и это может стоить дороже — ты платишь за то, что едешь в центр и знаешь, что тебя уже ждет место.

Сейчас цель — свести государство с разработчиками?

Да, в нашем проекте так и происходит. Многие сервисы направлены на повышение прозрачности. То, что ребята с госзакупками делают — это тоже, по сути, открытые данные. Они когда узнали, что у нас есть портал, предложили все данные по госзакупкам поставлять нам. Я думаю, что количество данных будет просто сумасшедшее. Соответственно, будет расти количество проектов.

Меня поразила там база данных США — законодательно они должны все данные предоставлять в общий доступ. База данных парламента показала, какие законопроекты были лоббированы, кем они были проплачены от украинской стороны. Это действительно может хоть как-то обеспечить прозрачность.

Я пока всей этой темой занимался, спалил кучу денег, катаясь по миру и смотря, как работают с открытыми данными в разных странах. Мы начинали не с открытых данных, а с того, что люди делают сами какие-то сервисы, мы пытались их объединить, помочь им. Потом оказалось, что большинство идей упирается в то, что нет данных. Так медленно я влез в эту систему.

А по поводу более глобальных вещей — например, можно сделать электронную базу данных по ЖЭКам? Чтобы не нужно было ехать за карточкой, которая хранится в деревянном ящичке?

Это называется "державний реєстр виборців". Но тут сразу три темы соединяются. Во-первых, открытые данные, во-вторых — административная услуга, связанная с тем, что не нужно ехать в ЖЭК. Не может независимый разработчик на основе открытых данных сделать услугу по выдаче справок. Третий — это персональные данные. Открытые данные не могут быть персонализированы. Иначе тогда их нельзя открывать вообще.

Не в контексте открытых данных, а в смысле адекватного предоставления услуг.

Это сложно, но это возможно. ЖЭКи не имеют возможности подключаться к реестру, я не могу увидеть, где зарегистрирован, кроме как придя в ЖЭК и посмотрев в их большую амбарную книгу.