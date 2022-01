V druhej polovici roka 2020 spustil magistrát hlavného mesta portál opendata.bratislava.sk, ktorý má za cieľ uľahčiť prístup k dátam mesta, či zlepšiť transparentnosť. Prvotné hodnotenie portálu som spravil v decembri 2020, pár týždňov po tom, čo vyhrali ocenenie "najlepší projekt digitalizácie spoločnosti" na konferencii ITAPA. V čase, keď ocenenie vyhrali, som spustil projekt Otvorená Bratislava, ktorý z opendata portálu spracúva finančné dáta a dáva ich do prehľadnej podoby.

Svoje skúsenosti s ich dátami som spísal už vtedy v síce kritický, ale v konečnom dôsledku pozitívne naladenom blogu, kde aj napriek detským chybám som veril, že tie budú vyladené a portál sa bude zlepšovať. Keďže tempo opravy chýb bolo žalostne pomalé, o 5 mesiacov neskôr som ešte aj na popud iných udalostí spísal všeobecný edukatívny blog (postavený na skúsenostiach s dátami Bratislavy) ako správne zverejňovať otvorené dáta. Ubehol však rok od môjho prvého blogu a môj optimizmus sa postupne mení na hnev a zúfalstvo v jednom. V tomto blogu sa pokúsim vysvetliť, prečo inde vychvaľovaný projekt, často spomínaný ako úspech vedenia mesta, je v podstate nefunkčná, pekne vyzerajúca hračka, nevyužiteľná k tomu, k čomu by mala slúžiť.

Skryť Vypnúť reklamu Článok pokračuje pod video reklamou

K čomu slúžia opendata?

Portál opendata.bratislava.sk vznikol ako iniciatíva zverejňovať dáta mesta na ďalšie spracovanie. Faktúry, zmluvy, či iné údaje, je mesto už dávno povinné zverejňovať a preto ich je možné nájsť (dosť kostrbato) priamo na webe mesta. Avšak zverejnenie týchto dát vo formáte otvorených dát (opendata) by malo uľahčiť ľudom ich spracovanie na ďalšie účely a umožniť vytvárať projekty s pridanou hodnotou nad týmito dátami. Preto som aj ten nápad na začiatku vítal, keďže mňa a veľa iných baví prepájať zaujímavé dáta a dávať im ďalší zmysel. Viac o samotných otvorených dátach sa dá dozvedieť aj na portáli datalab.digital, prevádzkovaným Ministerstvom informatizácie.

Problémy bratislavských otvorených dát

Prvotné problémy som spísal už vo vyššie spomenutom blogu, avšak tu pridám aj ďalšie a dám ich do časového kontextu. Zatiaľ čo pred rokom som časť z nich považoval za detské choroby nového projektu, po roku neefektívnych zmien, ich už tak hodnotiť nemôžem.

Rozbeh (jeseň/zima 2020)

Dáta, ktoré boli po rozbehnutí opendata.bratislava.sk prístupné v kategórii "Rozpočet, dane a zmluvy" mali chyby v štruktúre, bola použitá rôzna znaková sada pri jednotlivých súboroch, ale kvalita samotných dát sa zdala použiteľná.

Po niekoľkých mesiacoch (leto 2021)

Aj viac ako pol roka po spustení mestské opendata portálu boli súbory pridávané ručne, nepravidelne a s obrovských meškaním (mesiac aj dva neskôr). Po prvotnom chaose, keď datasety v rovnakej kategórii mali rôznu štruktúru sa aspoň tá už zdala ustálená. Rozhodol som sa teda zautomatizovať procesy, nech spracúvajú nasledovné dáta už bez môjho dohladu a asistencie. Samozrejme hneď ďalší súbor, ktorý pribudol v priebehu leta moje procesy nevedeli spracovať a ja som si len v chybovej hláške našiel "Nerozpoznaná štruktúra". Po analýze ostatných datasetov som si všimol, že niekto si možno môj edukatívny blog aj prečítal a pokúsil sa zjednotiť štruktúru datasetov pre zmluvy, faktúry aj objednávky. Na jednej strane ma nahnevalo, že to spravili už po vypublikovaní veľkého množstva súborov a bez nejakého oznámenia o zmene, na druhej potešilo, že konečne to bude jednotné.

Upravil som teda opäť štruktúru v kóde čo spracúva dáta a čakal.

Veľký chaos (jeseň/zima 2021)

Po letnej úprave som očakával, že sa veci pohnú a dáta budú pribúdať rýchlejšie a na pravidelnej báze. Prvé varovanie, že sa nedočkám, som mal tušiť už keď v lete porušili "štandard" jeden súbor na mesiac, ale zverejnili súbor s údajmi za jún a júl spolu. Ďalší súbor pribudol až niekedy v novembri. Čo ma však okrem veľmi neskorého zverejnenia zarazilo bolo, že obsahoval dáta len do 13. októbra a nie za celý mesiac. Nebola to chyba, súbor bol tak aj pomenovaný. Takto sa však dáta, ktoré bežne zverejňujete na mesačnej báze, jednoducho nezverejňujú.

Rozhodol som sa teda počkať, než zas sprocesujem niečo, čo možno opäť prerobia. V januári nastalo niekoľko zmien. Názvy jednotlivých datasetov a aj niektorých súborov niekoľkokrát premenovali, pričom ponechali ich UID (unikátny identifikátor). Súbory pribúdali, ubúdali, čo teraz na portáli nie je možné vidieť, ale keďže si všetky dáta ťahám k sebe a zapisujem do databázy, vidím aké mali pôvodné názvy a ktoré už zmizli. Výsledok bol ten, že pre faktúry napr vytvorili opäť nový dataset. Takže aktuálne existuje jeden s názvom "Faktúry Magistrátu hlavného mesta SR Bratislava 2011 - 2020" a ďalší s názvom "Faktúry Magistrátu hlavného mesta SR Bratislava v roku 2021". Čo na tom, že zmluvy majú dataset s názvom ....do 01.07.2021 a ďalší ....od 01.07.2021. Podobne štrukturované boli pritom aj faktúry ešte mesiac/dva dozadu.

Rozhodol som sa teda cez voľné dni spracovať dáta ako boli a moja frustrácia nabrala novú úroveň. Nie len že súbory nedodržiavali štandardy, ktoré mali, ešte aj obsahovali miesto všetkých dát za rok 2021 dáta len za december a samozrejme mali opäť novú štruktúru.

Chýbajúce dáta onedlho opravili, avšak ako naschvál, súbor mal opäť novú štruktúru!! Ktorá narozdiel od doterajších zmien ide úplne proti prúdu a všetky dobré dielčie úpravy hádže do koša. (po kliknutí na obrázok sa zobrazí aktuálna štruktúra priamo na webe mesta)

Sumár

Odhliadnuc od technických nedokonalostí, rok 2021 bol rokom neuveriteľného chaosu v otvorených dátach Bratislavy. Veľakrát sa menili názvy datasetov aj štruktúra súborov, dáta boli pridané, zmazané a opäť pridané, či pravidelnosť zverejňovania doteraz nebola nastavená.

Prečo to všetko píšem? Premýšľam, či mám spracovať aktuálne dáta, alebo počkať, či zas nezmenia štruktúru. Na takto nekvalitných a nekvalitne zverejňovaných dátach sa dá len s veľkým sebazaprením prevádzkovať aplikácia, ktorá má dáť tým dátam vyšší zmysel.

Na opendata.bratislava.sk mi aktuálne bliká informácia, že tam majú už 16025 súborov. To je síce krásne číslo, ale kvantita na úkor kvality nie je smer, akým by sa otvorené dáta mali uberať. Je smutné, že tento magistrátny projekt sa prezentuje vedením mesta ako jeden z úspechov, pritom to je taká potemkinova dedina pre tých, ktorý ho reálne nepotrebujú využívať na to, k čomu je určený. Pôsobí moderne, je tam toho veľa, čo na tom, že to je nekvalitné. A na emaily nik zo zodpovedných nereaguje.