Що означає для країни відкриття державою баз даних

Держоргани почали реальне наповнення порталу data.gov.ua реєстрами
Фото: maub.com.ua

У понеділок, 18 квітня, Міністерство юстиції виклало в вільний доступ дані Єдиного державного реєстру юридичних та фізичних осіб, які кожен може завантажити в повному обсязі і без реєстрації.

Про це повідомив заступник гендиректора з технічних питань держпідприємства Інформаційно-ресурсний центр (входить до Мін'юсту) Олексій Зеливянский. "1,2 Гб текстових даних у форматі CSV, близько 5,5 млн записів. У вибірку попадають абсолютно всі підприємства та ФОП, в тому числі вже закриті", - написав він у Facebook.

Що таке "великі дані"

Україна зробила перший крок до формування ринку відкритих даних у березні 2015 року, коли парламент прийняв законопроект, що передбачав створення єдиного державного веб-порталу відкритих даних. Мова йде про сайт, де буде зібрана статистична інформація від усіх відомств у єдиному форматі. Такі дані можна буде легко обробляти, аналізувати та систематизувати.

У листопаді 2015 р. Кабмін прийняв відповідну постанову, в якому прописав порядок відкриття переліку, що складається з більш ніж 300 першочергових наборів даних, багато з яких є повноцінними реєстрами. Цей перелік буде регулярно доповнюватися новими наборами даних, виходячи з суспільного попиту та ініціативи державних органів.

У відкритий доступ вирішили передати всю нормативно-правову базу України, реєстр юросіб та ФОП, реєстр адміністративно-територіального устрою, реєстр патентів України, реєстр медичних засобів та цін на медичні засоби, фінансові плани держпідприємств, єдиний реєстр спортивних споруд, кадастр родовищ і проявів корисних копалин України і т. д.

Всі ці дані завантажуються на Національний портал відкритих даних data.gov.ua. Він був створений ще в 2014 році за ініціативою співзасновник громадської організації SocialBoost Дениса Гурського, радника тодішнього прем'єр-міністра Арсенія Яценюка з питань відкритих даних, на гроші USAID. Але, по суті, портал був порожнім і з моменту запуску не оновлювався.

Зоряний час порталу настав навесні 2016 року, коли підійшов шестимісячний дедлайн виконання держорганами постанови Кабміну - 21 квітня. На data.gov.ua почали завантажувати величезні масиви інформації. Процес йде динамічно. Станом на вівторок, 19 квітня, на порталі було 888 наборів даних. Через добу, 20 квітня - вже 946. Хоча, очевидно, багато хто вже не встигнуть зробити це вчасно.

Навіщо це потрібно

На порталі не завжди з'являються абсолютно нові дані, до яких громадяни раніше ніколи не мали вільного доступу. Як правило, вони вже є на сайтах держорганів-розпорядників. Наприклад, на сайті Нацбанку є дані про власників банків. А Єдиного держреєстру юросіб з 2013 року відкрито на базі сайту Мін'юсту. Однак всі вони мають певні обмеження в користуванні. Власники українських банків вказані в PDF-документах. А дані про юросіб вимагають введення захисного коду для перегляду однієї конкретної запису.

Відкриті дані в машиночитаемом форматі, на думку чиновників, є кроком до прозорості в діяльності державних органів і допомогою в боротьбі з корупцією. Це також величезний ринок інноваційних сервісів і платних послуг, які можуть бути створені на базі цих даних. Бізнес зможе отримувати оперативні дані у вигляді електронних таблиць, стане простіше спілкуватися з інвесторами і партнерами. ЗМІ буде легше аналізувати роботу держави - на основі викладеної інформації нескладно побудувати інтерактивну графіку за допомогою онлайн-інструментів на зразок Google Charts.

Ось свіжий приклад аналізу відкритих даних з Єдиного реєстру юросіб і фізосіб-підприємців - знайшовся адреса масової реєстрації по вул. Мельникова 12 (р. Київ). "А, також - Мельникова 36, 81 і 2/10 та ін. І всі вони враховуються при оцінці якості переможця гостендера в нашій системі", - наводить приклад співзасновник Бюро кредитних історій "Українське кредитне бюро" Дмитро Остапчук.

Єдиний реєстр юросіб - лише один з прикладів. У квітні Міністерство Внутрішніх справ виклало у відкритий доступ інформацію про всіх викрадених та перебувають у розшуку транспортних засобів. Сотні тисяч записів дозволяють проаналізувати не тільки на рівні областей, але і на рівні районів марки машин, викрадених там, колір автомобілів, років.

По суті, це перший крок для створення в майбутньому на основі цієї інформації сервісів, які дадуть абсолютно фантастичні, на перший погляд можливості. Наприклад, ідея превентивного виїзду поліції - як у фільмі "Особлива думка" Стівена Спілберга. В США ця ідея перестала бути фантастикою ще в 2013 році, коли поліція Лос-Анджелесі приступила до тестування в окремих районах міста, технології, яка, за запевненнями розробників, вгадує, де відбудеться пограбування або викрадення автомобіля, в два рази краще в порівнянні з людиною.

Ґрунтуючись на статистичних даних (раніше скоєних злочинах, час, місце), ПЗ, розроблене компанією PredPol, показує на карті в мобільних пристроях патрульних "гарячі точки", де з більшою часткою ймовірності може відбутися правопорушення. В команду розробників поліцейського ЗА входять математики, антропологи і кримінологи.

Такі сервіси сама держава, в даному випадку МВС, створити просто не в змозі. В кінці 2015 року організація SocialBoost за підтримки Western NIS Enterprise Fund, компанії "Майкрософт Україна" та уряду України оголосила про запуск "1991 Open Data Incubator" - першого в Україні некомерційного інкубатора IT-проектів на основі відкритих даних. Проект покликаний "оцифрувати" такі сектори економіки як агробізнес, енергетику, інфраструктурні проекти, державні послуги для громадян і внутрішні аналітичні системи в державі, налагодивши взаємодію ІТ-розробників, громадських організацій та аналітичних центрів з органами державної влади.

Поки не все гладко

Однак якість даних ще далеко від досконалості. Є питання щодо достовірності та деталізації. Зараз у багатьох держструктурах експерти оцінюють рівень похибки в базах даних - 40% і вище. Крім того, багато масиви інформації не містять важливі дані - в даних того ж ЄДР, приміром, немає інформації про кінцевих власників компаній. За даними "ДС", це пов'язано з відсутністю узгодження з боку Кабміну.

Також не всі відкриваються дані однаково корисні. Багато держоргани пішли через чур формально до вимогу відкривати дані на порталі data.gov.ua почавши відверто "спамити", наприклад, добіркою контактів регіональних управлінь, які тепер є на їх сайтах і ніякої додаткової цінності не представляють. Через це банк даних вже трохи перевантажений "сміттям".