Дмитрий Клещёв

Дмитрий Клещёв

руководитель центра прикладной экономики Пермского филиала НИУ ВШЭ

Портал «Открытые данные» приближает нас к новым возможностям

Поделиться

Портал «Открытые данные», разработанный Министерством правительственных информационных коммуникаций приближает нас к новым возможностям, о которых невозможно было думать ещё совсем недавно. Мгновенный доступ практически к любой информации, так называемая «точка бога» — это то, о чём говорили фантасты. Теперь мы видим, как это становится реальностью.

Кому интересен портал?

«Открытые данные» как один из аспектов информационной открытости, безусловно, интересен большому количеству людей, но только если эти данные подготовлены и удобно представлены. Портал открытых данных — это, скорее, первый шаг на этом пути. Пока основными потребителями размещенной на нём информации будут скорее профессионалы, те, кто на постоянной основе занимается аналитикой, так как именно здесь они могут получить быстрый и более удобный для предварительного анализа доступ к данным.

ИТ-компании, разрабатывающие сервисы на основе этих данных, получают доступ к новому рынку, предоставляя более удобный способ доступа к важной для пользователей информации (например, на основе данных о преступности показывать наиболее опасные места в городе в разное время суток, и человек, пользующийся таким приложением, может выбирать оптимальный маршрут).

Научные и образовательные организации получают новый объект для исследований, кроме этого на данной базе можно развивать и образовательные программы, менять образовательный процесс, делать его более содержательным, прикладным.

Общественные организации и неравнодушные граждане, заинтересованные в изучении или получении знаний по проблемам, которыми они занимаются (обманутые дольщики, ТСЖ, выборы, транспорт, городская среда, экология и т. д.). Наиболее интересной группой потребителей информации, которую представляет данный портал, являются как раз общественные активисты и НКО (некоммерческие организации), так как именно они влияют на реализацию основных принципов гражданского общества и могут активно «пиарить» этот инструмент.

Пока основной проблемой большинства решений, которые предлагаются в России, является недостаток представленных данных и неудобство их обработки. Именно поэтому использование данного портала ограничивается лишь поиском наборов данных (датасетов), которые невозможно найти, например, на сайте Росстата. Хотя постепенно с появлением новых источников информации и визуализированных показателей пользоваться им становится все интереснее.

Так как мы занимаемся профессионально анализом информации и поиском данных, наш интерес к этому порталу достаточно высок, и мы регулярно используем его в своей работе, в среде преподавателей и студентов вышки все не так однозначно. Так если говорить о студентах и преподавателях профильных специальностей, например, «бизнес-информатика», «государственно-муниципальное управление», то о портале и используют его в образовательном процессе. На других специальностях такое использование портала носит скорее характер исключения, чем правила.

Какие есть проблемы?

Правильнее говорить скорее об общих проблемах подобного рода порталов, так как, на мой взгляд, у них есть общие черты. Как я уже говорил выше, портал в настоящее время — это первый шаг на пути доступа к открытым данным в режиме реального времени, и как первый шаг, он, безусловно, положительный. Наличие возможностей по быстрому доступу к различным показателям, преднастроенные данные, когда можно увидеть наиболее часто используемые данные, возможность самостоятельно построить собственные графики и визуализации — всё это не может не радовать. Кроме этого, так как удобству портала уделялось особое внимание, он обладает дружественным интерфейсом.

Но вместе с тем необходимо отметить ряд проблем, которые во многом носят временный характер, но, несомненно, являются критичными для успеха данной работы.

Так, одной из самых важных проблем является то, что данные размещенные на портале пока крайне малочисленны, их временные ряды не совпадают, сами наборы данных фрагментарны и почти не связанны между собой. Это приводит к тому, что поиск и извлечение полезной информации требуют столь же много времени, как и при работе с другими источниками, а интерес к собственно порталу гаснет.

Другой существенной проблемой является то, что инструментарий позволяющий обрабатывать данные является очень слабым и не позволяет проводить сложные вычисления и сопоставления. Атрибуция (или по-другому паспортизация) данных пока развита слабо.

Наиболее перспективным, на мой взгляд, видится развитие портала в двух основных направлениях. С одной стороны, это взаимодействие с разработчиками, так как портал должен быть всё же набором качественных, хорошо подготовленных и актуальных данных, в этом мне кажется его основная задача. А способ обработки этих данных их представление в таком виде, чтобы они были «вкусными» для обычного человека, — это задача разработчика. Поэтому нужно не только выкладывать данные, но и обеспечивать интерфейсы для удобной их обработки сторонними разработчиками. Наглядный пример — сайт госзакупок, который сделал открытый интерфейс и как следствие появились десятки решений по поиску, обработке и анализу госзакупок.

С другой стороны, в условиях ограниченных ресурсов, Министерству правительственных информационных коммуникаций необходимо собирать информацию о том, какие данные наиболее востребованы, какую информацию стоит выложить в открытый доступ в первую очередь, чтобы поддерживать интерес к системе. Здесь помощь могут оказать те самые общественные организации, но не только они, которые занимаясь исследованием острых общественных проблем, смогут формулировать актуальные запросы к власти.

Наиболее серьезную работу необходимо проводить по выравниваю временных рядов данных, для того что бы получать возможность проводить сравнение по максимально длинным и сопоставимым временным шкалам. И если на первом этапе это вопрос сбора и актуализации информации последнего десятилетия, то в последующем необходимо удлинять историческую перспективу данных.

Что касается наборов данных, на мой взгляд, самый простой вариант выкладывать наиболее простые, затрагивающие максимальное количество людей данные (например, данные по экологической ситуации в Пермском крае, аварийность на дорогах, состояние жилых домов и других объектов недвижимости, данные по заплатам и доходам населения, данные по доходам и расходам бюджетов). Тогда посещение портала станет более массовым.

Подпишитесь на наш Telegram-канал и будьте в курсе главных новостей.

Поделиться