Je v Sloveniji dovolj podatkov kakovostno dostopnih?

Global Open Data Index 2014

Naša sodelavka Polona Tepina je sodelovala pri sestavi indeksa odprtosti podatkov, ki so potencialno lahko na razpolago za ponovno uporabo. Slovenija je med 97 analiziranimi državami zasedla 26. mesto, kar je kar 18 mest slabše kot v letu 2013.

Polona ugotavlja sledeče:

  • Kaj pomeni ta indeks oziroma kaj ocenjuje? Kako si lahko razlagamo njegove ugotovitve?

Open Data Index pripravlja nevladna organizacija Open Knowledge Foundation, ki se zavzema za čim širšo dostopnost javnih podatkov na spletu, v strojno berljivih formatih, brezplačno in pod odprtimi licencami. Javni podatki imajo namreč izjemno uporabnost, saj jih je mogoče uporabiti za razne aplikacije (npr. za navigacijo, vremenske napovedi, za prikaz voznega reda, za prikaz čakalnih vrst na urgencah itd.), uporablja se jih v raziskovalnih centrih, za novinarske namene itd. Govorimo celo o kulturi odprtih podatkov, ki se zavzema za to, da so javni podatki, ki jih države »proizvajajo,« čim bolj dostopni javnosti, saj to spodbuja boljše upravljanje države, pa tudi ekonomski in družbeni napredek.

Indeks torej ocenjuje, koliko in kakšne podatke države proaktivno, same od sebe, objavljajo na svetovnem spletu in s tem prispevajo k transparentnosti in razvoju odprte družbe.

Po eni strani ugotovitve iz raziskave kažejo na to, koliko je država sposobna nameniti sredstev v proaktivno transparentnost in ponovno uporabo javnih informacij. Še pomembneje pa je, koliko se posamezni državi to področje zdi pomembno, ali je sposobna prepoznati potencial v odprtih podatkih, tudi v ekonomskem smislu, da omogoči zasebnemu sektorju uporabo javnih podatkov za ustvarjanje novih storitev in produktov.

Če za primer vzamemo Slovenijo, ugotovimo, da obstaja volja ponujati javne podatke na svetovnem spletu. Vendar moramo še ogromno storiti pri uporabnosti in formatu teh podatkov. Še vedno se podatki brez razloga ponujajo v pdf obliki, celotni podatkovni nizi za takojšnji prenos velikokrat niso na voljo, licence za prosto uporabo niso urejene. Dva pozitivna zgleda, ki ju je prepoznal tudi Indeks, sta Supervizor in ARSO, zaradi katerega smo se lani pri okoljskih podatkih uvrstili na prvo mesto. Tudi v resnici je ARSO zelo napreden pri tem, koliko, kakšne in v kakšni obliki ponuja podatke, ki nastanejo pri opravljanju njihovih funkcij, na spletu.

Pomembna je torej politična volja in zavedanje o kulturi odprtih podatkov in njihovem potencialu.

  • Slovenija je samo v enem letu padla s 6. na 26. mesto. Kaj to pomeni? Oziroma, kaj pomeni podatek, da je država 54-odstotno odprta (še leto nazaj je bil ta odstotek 73)?

Rezultat je treba jemati z rezervo, saj raziskava temelji na t.i. »crowdsourcingu« – različni posamezniki so Open Knowledge Foundation sami poslali podatke o svoji državi. Čeprav so podatke pregledali tudi »revizorji«, je marsikatera ocena lahko tudi napačna. Recimo za Supervizor so leta 2013 ocenili, da ponuja podatke pod odprto licenco, leta 2014 pa ne, čeprav se Supervizor v tem pogledu ni spremenil.

Vseeno pa to pomeni, da je Slovenija začela zaostajati za globalnimi trendi v odprtosti podatkov. Ker se namreč ti globalni trendi dvigujejo, se tudi pogoji za to, da lahko rečemo, da je država »odprta« dvigujejo oz. zaostrujejo. Slovenija je bila nekaj let predstavljena v zelo pozitivni luči, zdaj pa morda spi na lovorikah, druge države pa se hitro razvijajo in dvigujejo standarde.

54 odstotna odprtost je seveda zelo nizek rezultat. Podatki kažejo, da bomo morali veliko narediti predvsem pri formatih, v katerih ponujamo podatke. Zaklepanje informacij v pdf-je, s katerimi nato inovatorji, raziskovalci, novinarji itd. ne morejo narediti nič razen gledati na zaslonu (včasih bi še to radi omejili) bo treba čim prej odpraviti. Skupaj s tem bo moralo narasti zavedanje o kulturi odprtih podatkov.

Opozoriti pa je treba, da gre tu za proaktivno, samodejno objavljanje podatkov, ne za podatke, ki jih lahko državljani dobijo z zahtevami po Zakonu o dostopu do informacij javnega značaja. Pri slednjem se Slovenija še vedno uvršča med države z najmočnejšim zakonom na svetu, ki pomaga pri odkrivanju nepravilnosti pri upravljanju države. Pri objavljanju javnih podatkov na spletu pa smo se »polenili« oziroma ne dohajamo nekaterih držav, ki postavljajo trende pri proaktivni transparentnosti.

  • Je spremenjeno mesto Slovenije povezano tudi s tem, da so v letošnjem letu na seznamu dodane nove države, ki jih prej ni bilo?

Seveda, tudi to je eden od faktorjev. Kot omenjeno pri prejšnjem vprašanju, gre za globalni trend in za višanje standardov, države pa so začele tudi malo tekmovati med seboj, katera se bo uvrstila više na lestvicah transparentnosti in odprtosti baz javnih podatkov. Seveda pa večinoma tekmujejo le pri odprtosti zelo nedolžnih podatkov, takšnih, ki jih bodo pokazale v pozitivni luči in ne, ki bodo razkrivale kakšne nepravilnosti.

  • V razlagi metodologije piše, da je ta indeks neodvisna presoja z vidika državljanov. Lahko to pojasnite?

Kot omenjeno, gre za princip »crowd-sourcinga«, ko zainteresirani posamezniki pošljejo podatke, spletne povezave in komentarje o dejanskem stanju za vsako vrsto podatkov, na primer za odprtost podatkov o porabi javnih sredstev, volilnih rezultatov itd. V ta namen so sestavili vprašalnik, ki ga je izpolnil »zainteresiran posameznik«, ki je o temi kaj vedel, nato pa so informacije preverili še revizorji.

Takšno zbiranje podatkov je lahko tudi precej nezanesljivo, vendar je pozitivno, da podatke preverijo revizorji in da pri vsaki vrsti podatkov navedejo imena posameznikov, ki so jih prispevali.

  • Na prvih mestih so Velika Britanija, Danska, Francija, Finska, Avstralija, … Bi lahko bili takšni zaključki tudi politično motivirani, kar je pogosta kritika kakšnih drugih indeksov?

Ta indeks se od drugih indeksov, ki jih pripravljajo organizacije same in so upravičeno deležni kritike o politični motiviranosti, razlikuje po tem, da so podatke prispevali posamezniki, vsak je lahko prispeval

odgovore na vprašalnik, sodelovali pa so lahko tudi zaposleni v državnih institucijah.

Mislim torej, da tu ne gre za politično motiviranost, lahko pa gre ponekod za nezanesljive podatke ali za nerazumevanje, kaj resnično pomeni prosta dostopnost podatkov, strojna berljivost, možnost prenašanja celotnih podatkovnih nizov itd.

Članek v Delu si lahko preberete tukaj.