Novinarstvo i baze podataka

Novinarstvo i baze podataka

Posljednjih godina, mnoge su institucije - od državnih vlada do međunarodnih organizacija kao što je Svjetska banka - preuzele filozofiju i počele primjenjivati praksu da podatke čine dostupnima za slobodnu upotrebu. Novinari su, također, polako počeli da otkrivaju potencijale tako dostupnih podataka.

 

Danas, kada najveće novinske kuće, kao što je Guardian, počinju da čine dostupnim podatke koje obrađuju, svima je omogućeno da pravlje vizualizacije ili ´web mash-ups´ (web stranice ili aplikacije koje kombinuju podatke, prezentacije ili funkcionalnost iz više izvora, kako bi stvorili nove usluge, prim.prev.) na osnovu takvih informacija.

 

Kako raste dostupnost podataka na internetu, tako moć njihove obrade sve više dolazi i u ruke novinara; umjesto da se za uvide i zaključke oslanjaju na vanjske stručnjake kao što su kreatori politika, sada u redakcijama mogu sami analizirati i tumačiti sirove podatke. 

 

To je novo polje novinarstva koje se zasniva na obradi podataka, pri čemu novinari sakupljaju, analiziraju i vizualno predstavljaju često velike količine podataka, a tu analizu kombinuju sa uzbudljivom i vjerodostojnom naracijom.

 

Evropski centar za novinarstvo (EJC) je intervjuisao Jonathana Graya, koordinatora zajednice iz Fondacije otvorenog znanja, neprofitne organizacije iz Ujedinjenog kraljevstva posvećene međunardnoj promociji otvorenog znanja i pitao ga kako novinari mogu iskoristiti potencijal slobodno dostupnih podataka. Jonathan je ujedno i osnivač web aplikacije WhereDoesMyMoneyGo.org (gdje odlazi moj novac, prim. prev.) koja korisnicima omogućava da istraže i vizuelno predstave javnu potrošnju Ujedinjenog kraljevstva.

 

EJC: Gdje i kako novinari mogu na internetu pristupiti besplatnim i otvorenim izvorima podataka?

 

Jonathan Gray: Postoji ogromno bogatstvo slobodno dostupnih podataka na internetu, razbacanih po web-prostoru ministarstava, univerziteta, NVOa, medijskih organizacija, tehnološkog sektora i drugih. Pa ipak, uprkos činjenici da na webu postoji toliko mnogo informacija, nije uvijek lako naći tačno onu koju tražite, ili doći do izvora sirovih informacija (za razliku od izvještaja, članaka i drugih materijala o ovim izvorima), i saznati da li možete slobodno koristiti te informacije iznova ili ne (činjenica da je nešto dostupno onlajn ne znači uvijek da ga možete ponovo iskoristiti ili ponovo objaviti).

 

Kako bismo se pozabavili ovim pitanjem, započeli smo CKAN projekat koji za cilj ima olakšavanje procesa pronalaženja dokumenata i podataka koji se mogu slobodno višestruko koristiti u različite svrhe.

 

CKAN sada koristi Vlada UK u sklopu svog projekta data.gov.uk, a pomažemo i pobornicima otvorenih vladinih podataka širom svijeta da pronađu izvore otvorenih podataka u više od desetak zemalja. Pored toga, ulažemo napore da kataloge podataka iz drugih zemalja učinimo interoperatibilnima sa CKAN-om, te da promovišemo projekat u drugim zajednicama koje stvaraju i koriste javne grupe podataka - od analitičara geoprostora do građanaskih hakera, od onih koji se bave simulacijom klimatskih promena do semantičkih web tehnologa. Nadamo se da će CKAN postati međunarodni, višejezični izvor otvorenih podataka i svega u vezi sa njima.

 

Ukoliko ste zainteresovani za to da koristite ovu tehnologiju i tako pokrenete registar podataka u svojoj zemlji (bilo da ste pobornik ove ideje ili državni službenik), voleli bismo da nam se javite.

 

EJC: Da li su novinarima potrebne posebne vještine, naprimjer programiranja, kako bi mogli istraživati i analizirati ove podatke?

 

JG: Nema sumnje da je posjedovanje nekih programskih vještina korisno za novinare čiji rad možda zavisi od izvlačenja, analiziranja i razumijevanja informacija iz velikih baza podataka. To je posebno korisno za novinare koji se bave istraživačkim novinarstvom i koji pročešljavaju javno dostupne izvore kako bi izgradili bogatiju sliku o složenim slijedovima događaja ili situacija. Međutim, mnoge digitalne tehnologije sve više olakšavaju istraživanje i analiziranje setova podataka i onim novinarima koji nemaju programerske vještine.

 

Servisi društvenog weba, kao što su Many Eyes ili Google Chart Tools, omogućavaju bilo kome da vizualno predstavi setove podataka. Besplatne desktop aplikacije otvorenog koda takođe omogućavaju ljudima sve sofisticiranije korišćenje baza podataka.

 

Iako ovi alati mogu puno toga, ipak postoje očigledna ograničenja onoga što tehnološki neobrazovani novinari mogu raditi. Dobar primjer za to je nedavno objavljivanje COINS podataka u Ujedinjenom Kraljevstvu – to je ogromna količina podataka o javnoj potrošnji, neprevaziđena po obimu i detaljnosti. Novinari mnogih nacionalnih novina i medijskih kuća su nas zvali i pitali šta se nalazi u tim podacima, i naročito da li smo našli materijal za dobre priče. Nekoliko osoba je izrazilo razočaranje zbog objavljivanja ovih podataka, a u suštini su se žalili na to da je proces dobijanja korisnih i interesantnih informacija iz ove baze podataka izuzetno težak. Dobra vijest je da se od tada pojavilo nekoliko novih projekata koji ljudima omogućavaju da sortiraju, pretražuju, istražuju podatke i daju svoje komentare na njih, a bez sumnje će ih biti još više u narednih nekoliko mjeseci i godina.

 

Da citiram Petera Murray-Rusta, člana Savjetodavnog odbora Fondacije otvorenog znanja  i neumornog pobornika otvorenih podataka u hemiji: ˝Rad s podacima je težak˝. Bilo da je riječ o statističkim, ekološkim ili finansijskim podacima, lanac od proizvodnje do prezentacije podataka je često dug i komplikovan. Što je više ljudi uključeno u čišćenje, provjeravanje, interpretiranje i vizuelno predstavljanje setova podataka, tim bolje. Upravo zbog toga mi iz Fondacije se čvrsto zalažemo za pristup koji se zasniva na zajednici, kao i za uključivanje stručnjaka iz inostranstva, i zainteresovanih i motiviranih građana.

 

Nadamo se da ćemo doći u situaciju u kojoj ćemo umjesto samo jednog zvaničnog mjesta ili kontakta za setove podataka (bilo da se radi o vladama, međunarodnim tijelima ili NVO-ima) imati ekosistem otvorenih podataka sa velikim brojem međusobno povezanih setova podataka kojima se može pristupiti preko različitih interfejsa, uz mnoštvo alata koji će pomoći da se ti podaci razumiju i interaktivno koriste.

 

Umjesto tradicionalne «potrage za blagom», kao što je traženje podataka zatrpanih negdje u mnoštvu informacija na nekoj zvaničnoj web stranici ili u PDF dokumentu, mi nastojimo što više koristiti atraktivne interfejse za pristup podacima i nadamo se da će se razvijati dvosmjerna veza između informacija i njihovih korisnika, tj. serviranje podataka «on demand» i prema interesima, komentarisanje, novinarske priče zasnovane na podacima, mogućnost «ugrađivanja» dinamičkih vizuelnih predstavljanja podataka koji se linkuju na izvore, i tako dalje. Otvaranjem setova podataka drugima kako bi ih mogli slobodno iznova koristiti bez ograničenja omogućavamo da procvjeta na hiljade cvjetova.

 

Iako će osnovni zadaci novinarstva vjerovatno ostati uglavnom isti, dakle tumačenje, prenošenje, te oblikovanje informacija u smislene narative, praćeno komentarima i analizama, mislim da se precizna podjela radnih obaveza novinara i drugih tek treba izdefinisati. Nadam se da ćemo uskoro biti svjedoci brisanja nekih granica.

 

EJC: Koji su to uobičajeni izazovi u upotrebi, proizvodnji i prezentovanju podataka? I šta novinari koji žele slijediti vaš primjer mogu naučiti?

 

JG: Kao što sam ranije spomenuo, organizovanje i interpretiranje podataka može biti veoma težak zadatak. (Sam pristup podacima može biti značajno otežan, ali to je priča za sebe!). Mnogo je primjera za to, od analize nedavnog članka koji je objavio Guardian o stopi smrtnosti u britanskim državnim bolnicama, do sumnjivih grafikona u novinama (pogledajte, naprimjer, ovu prezentaciju Simona Fielda, glavnog tehničkog urednika Ureda za državnu statistiku Ujedinjenog Kraljevstva).

 

Imali smo mnogo poteškoća kada smo pokušali da prikažemo podatke o javnoj potrošnji u Ujedinjenom Kraljevstvu u sklopu projekta ˝Where does my money go?˝, uključujući (ali ni u kom slučaju ne ograničavajući se na) podatke koji nedostaju, različite cifre od različitih vladinih izvora, promjenjive kategorije, više različitih kodova, podatke na hiljadama listova papira, i tako dalje.

 

 

Vizualizacija budžeta Ujedinjenog Kraljevstva, Where Does My Money Go?

 

 

Prije ovog projekta, nikada nisam znao da podaci o tome na šta se troše javna sredstva mogu biti toliko slični teologiji, i to zbog određenih nedodirljivih, nedosežnih osnovnih slojeva (stvarna potrošnja), te interpretiranja stvari tako da odgovaraju određenim ciljevima, sa različitim pravilima, objašnjenjima, kalendarima i terminologijom. Srećom, situacija se polako sređuje, ali naravno uz pomoć mnoštva vladinih službenika i spoljnih stručnjaka.

 

Razumjeti određeni set podataka se rijetko svodi na puko razumijevanje gomile činjenica o svijetu. To zahtijeva razumijevanje različitih pretpostavki i procesa koji prate proizvodnju podataka. To je ujedno razlog više zašto treba imati više parova očiju i ruku!

 

Što se tiče stvari koje novinari trebaju naučiti, mislim da bih ja lično volio da vidim kako više ne tražimo podatke samo kada nam zatrebaju za neki određeni slučaj kako bismo našli činjenice za priče na kojima radimo, već da naše priče izrastaju iz podataka (a to je upravo novinarstvo koje se zasniva na podacima!). To bi, naprimjer, značilo sistematičnije praćenje transkripata i kopanje po bazama podataka državnih parlamenata i međunarodnih tijela kao što su EU ili UN. Ili mogućnost da se događajima da širi kontekst, recimo tako što bi postojala mogućnost da se uspostavi direktna veza sa dokumentima i bazama podataka, a ljudima se otvorio prostor za diskutovanje i komentarisanje tih podataka.

 

Mislim da bi se alati za vizualizaciju mogli pokazati kao veoma moćni u pružanju ´šire slike´. Trenutno koračamo malim koracima, ali sam siguran da će se stvari ubrzati kako se razvija i tehnolgija, i da ćemo početi graditi vizuelni jezik za komunikaciju sa setovima podataka, sličan grafičkom korisničkom interfejsu na koje smo već svi navikli na našim operativnim sistema ili na web pretraživačima i aplikacijama.

 

EJC: Mislite li da su novinari sposobni da stvore projekte slične vašem 'Where does my money go?' ili projektu CKAN?

 

JG: Da, naravno! Nema dobrog razloga zašto novinari ne bi trebali nastaviti pružati svoj doprinos ovakvim projektima. Mislim da je to više pitanje vremena i prioriteta.

 

Više mogućnosti za učenje kodiranja na kursevima novinarstva je možda dobar način da se novinari sistematski ohrabruju za rad na ovakvim projektima. Ali mislim da je često najbitnija motivacija. Neki veoma dobri programeri koje znam nisu imali nikakvu formalnu obuku, već su učili radeći na nekom projektu ili zahvaljujući različitim zajednicama koje se bave softwerom otvorenog koda (open source software, prim. red.). Formalna obuka često nije ni neophodna niti dovoljna za kodiranje na projektima kao što je projekat Where does my money go?, They work for you (Oni rade za vas, prim.red.), i tako dalje – najbitnije je odvojiti vrijeme i biti uporan.

 

Šire prihvatanje nečega ovakvog kao nečeg´legitimne´ novinarske prakse može opravdati (njima samima, nadređenima, itd.) vrijeme koje ona zahtijeva. Čini se da je interes sve veći – kod BBC-ja, Guardiana, Telegrapha, New York Timesa, i tako dalje -  tako da, nadajmo se, neće proći mnogo vremena prije nego programiranje bude prihvaćeno kao vrijedan dio vrijedan dio novinarskog repertoara.

 

EJC: Vaš rad predstavlja odličan primjer, mada se čini da nedostaje jedan aspekt – pričanje priče. Da li će Vam kratke priče, intervjui i video zapisi posati prioriteti u budućnosti?

 

JG: Da, definitivno. Smatram da je jedna od glavnih stvari koje Gapminder Hansa Roslinga odvajaju od ostalih silnih projekata - njegov predivan set zabavnih predavanja u kojima govori o određenim temama (rast populacije, razvoj, zdravlje, kvalitet života, itd.) i referira na Trendalyzer, Gapminder-ov alat za vizualizaciju. Iznimno smo ponosni na to što je Hans dio Savjetodavnog odbora Fondacije Otvoreno znanje i mislim da baš on zaista razumije vezu između priča i alata za interaktvnu vizualizaciju. S jedne strane, njegova naracija objašnjava šarene balone (kojima su predstavljeni podaci, prim.red.), a s druge strane oni su nezamjenjivi u njegovim predavanjima! Dobra ilustracija izreke da slika vrijedi hiljadu riječi je bilo koji od video-snimaka u kojima on objašnjava putanje stotine balončića koji se kreću po ekranu kao što sportski komentator prenosi bitne poteze za vrijeme utakmice. Iako riječi mogu pomoći razumijevanju i ukazati na suštinu, ne mogu zamijeniti sliku. Ti video-snimci su korisni takođe i zato što vam daju ideju kako da koristite pomenuti alat da biste smislili sopstvena pitanja i kreirali sopstvene vizualizacije.

 

Ovakve vrste alata su nove i često se ne koriste posebno intuitivno, djelomično zato jer još uvijek nemamo 'opšteprihvaćeni' način na koji bismo to radili. Tutorijali i meniji za pomoć mogu biti zamorni, pa su stoga video-predavanja odličan način da ljudi uče kako koristiti alate a da i ne osjete! Zaista bismo voljeli uraditi još takvih stvari kroz naše pojekte. Mislim da će narativne vještine imati bitnu ulogu pri korištenju novih alata za vizualizaciju – od stvaranja narativa unutar vizuelnog dizajna i korisnikovog iskustva, do toga da ćemo biti u mogućnosti integrirati vizualizacije u vanjskim člancima, tekstovima i drugim medijima.

 

-----------------------------------------------------------------------------------------------------------

Originalni tekst ‘Journalism meets 'big' data' dostupan je na web sajtu European Journalism Centre-a www.ejc.nl gdje je objavljen 28.07.2010.

 

Tekst je preuzet, preveden i objavljen na MC Online uz odobrenje European Journalism Centre-a. Svako dalje korištenje i distribucija ovog teksta podliježe uvjetima korištenja koji su u cjelosti dostupni na web sajtu www.ejc.nl.

 

Oprema teksta: redakcija MC Online.