9656 kilometrov cest, 965 kilometrov podzemne železnice, 643 kilometrov kolesarskih poti, in 804 metri tramvajske proge če ste kdaj bili na Roosevelt Island-u. To so številke, ki sestavljajo infrastrukturo mesta New York. To je statistika naše infrastrukture. To so številke, ki jih lahko najdete v poročilih mestnih agencij. Na primer, Oddelek za transport vam bo najbrž povedal koliko kilometrov ceste nadzorujejo. MTA se hvali, koliko km podzemne železnice je tu. Večina mestnih agencij nam da statistiko. To je poročilo iz tega leta iz Komisije za taksije in limuzine, kjer izvemo da je v mestu New York 13,500 taksijev. Precej zanimivo, kajne? Ste kdaj pomislili, odkod vse te številke? Da te številke obstajajo, se je moral nekdo v mestni agenciji ustaviti in reči, hmm, tu je številka, ki bi jo nekdo morda hotel vedeti. Tu je številka, ki jo želijo vedeti meščani. Vzamejo gole podatke, štejejo, dodajajo, računajo in izdajo poročila, in ta poročila bodo imela številke, kot so te. Težava je, kako vedo vsa naša vprašanja? Imamo veliko vprašanj. Pravzaprav je tu na nek način dobesedno neskončno število vprašanj, ki jih lahko vprašamo o mestu. Agencije nas ne dohajajo. Paradigma torej ne deluje in mislim, da naši odločevalci to vedo, ker je leta 2012 župan Bloomberg podpisal zakon, ki ga je označil za najbolj ambiciozen in izčrpen zakon o dostopnih podatkih v državi. V veliko stvareh, je imel prav. V zadnjih dveh letih je mesto izdalo 1000 setov podatkov na našem portalu dostopnih podatkov in to je precej neverjetno. Greste in takole pogledate podatke in namesto da bi samo šteli število taksijev, lahko vprašate različna vprašanja. Imel sem vprašanje. Kdaj je prometna konica v New Yorku? Lahko je neprijetna. Kdaj točno je prometna konica? In pomislil sem, ti taksiji niso samo številke, so GPS snemalniki, ki se vozijo po naših mestnih cestah in posnamejo vsako vožnjo. Tu so podatki, in pogledal sem jih, in grafično sem prikazal povprečno hitrost taksijev v mestu New York čez dan. Lahko vidite, da se od polnoči do okrog 5:18 zjutraj hitrost poveča in ta tej točki se stvari obrnejo in postajajo počasnejše in počasnejše in počasnejše do 8:35 zjutraj, ko končajo pri 18 kilometrih in pol na uro. Povprečen taksi gre 18 kilometrov in pol na uro po naših cestah in izkaže se, da tako ostane ves dan. (Smeh) Pa sem si rekel, v mestu New York prometna konica ne traja eno uro. Traja kar cel dan. To ima smisel. In je pomembno zaradi nekaj razlogov. Če si načrtovalec prevoza, je to zanimiv podatek. A če bi rad nekam prišel hitro, veš, da moraš nastaviti alarm za 4:45 zjutraj in si pripravljen. New York, kajne? A za temi podatki je zgodba. Ti podatki, se izkaže, niso bili kar na voljo. Prišli so iz obrazca po zakonu o javnih informacijah, oziroma FOIL. Na strani Komisije za taksije in limuzine lahko najdete obrazec. Da bi lahko dostopali do teh informacij, morate izpolniti obrazec in obvestili vas bodo in možakar Chris Whong je naredil točno to. Chris je šel tja in povedali so mu: "Prinesi nov trdi disk v našo pisarno, pusti ga tu 5 ur, prekopirali bomo podatke in ti ga vzameš nazaj." Od tu so prišli ti podatki. Chris je take vrste tip, ki bi rad te podatke naredil javne, zato so končali na spletu. Odtod tale graf. Dejstvo, da to obstaja, je neverjetno. Ti GPS snemalniki--res so kul. A dejstvo, da meščani s trdimi diski hodijo okrog agencij in dobivajo podatke, da bi jih objavili-- bili so že delno javni, dostopni, a bili so "javni", ne pa javni. Veliko bolje lahko to naredimo kot mesto. Ni treba, da naši meščani hodijo naokrog z diski. Ni vsak set podatkov posledica obrazca FOIL. Tu je zemljevid, ki sem ga naredil, z najbolj nevarnimi križišči v New Yorku, glede na kolesarske nesreče. Rdeča področja so bolj nevarna. Prvo pokaže vzhodni del Manhattna, še posebej nižji predel Manhattna, ima več kolesarskih nesreč. To ima morda smisel, ker tu pride več kolesarjev z mostov. A tudi druge vroče točke velja preučiti. Tu je Williamsburg. Pa Rooseveltova Avenija v Queensu. Točno take podatke potrebujemo za Vizijo nič. Točno to iščemo. A tudi za temi podatki stoji zgodba. Ti podatki se niso kar pojavili. Koliko vas pozna tale logo? Ja, vidim nekaj kimanja. Ste kdaj poskušali kopirati podatke iz PDF formata in jih nato urediti? Še več kimanja. Več vas je kopiralo, kot pa vas je poznalo logo. To mi je všeč. Zgodilo se je, da so bili ti podatki pravzaprav v PDF formatu. Pravzaprav na stotine in stotine strani PDF, ki jih je izdala naša NYPD, in da bi prišli do njih, bi morali kopirati in lepiti na stotine in stotine ur, ali pa bi bili John Krauss. John Krauss je menil, ne bom kopiral in lepil teh podatkov. Program bom napisal. Imenuje se NYPD obliž za zlomljene podatke in gre na stran NYPD in naloži PDF-je. Vsak dan išče; če bi našel PDF, bi ga naložil in potem bi zagnal nek PDF pretvornik in ven bi prišlo besedilo in potem bi ga dal na internet, da bi lahko ljudje delali take zemljevide. Dejstvo, da so ti podatki tu, dejstvo, da imamo do njih dostop-- Vsaka nesreča, mimogrede, je ena vrstica. Predstavljajte si količino PDF-jev. Dejstvo, da imamo do tega dostop, je super, a ne izdajmo jih v PDF obliki, ker morajo potem naši meščani napisati PDF pretvornike. To ni najboljša raba časa naših meščanov, in mi kot mesto lahko to storimo bolje. Dobra novica je, da je administracija župana De Blasia pravzaprav izdala podatke pred nekaj meseci, tako da imamo sedaj dostop do njih, a še vedno je veliko podatkov v formatu PDF. Na primer, podatki o kriminalu so še vedno dostopni samo v PDF. Ne samo podatki o kriminalu, proračun našega mesta. Proračun našega mesta lahko preberete samo v PDF obliki. Nismo edini, ki ga ne moremo analizirati-- naši zakonodajalci, ki glasujejo o proračunu, ga dobijo samo v PDF obliki. Tako zakonodajalec ne more analizirati proračuna, o katerem glasuje. Mislim, da bi kot mesto lahko izvedli tudi to malo bolje. Veliko je podatkov, ki niso skriti v PDF-jih. To je primer zemljevida in na njem so najbolj umazane vodne poti v New Yorku. Kako merimo umazanost? No, malo je čudno, a pogledal sem raven fekalne bakterije, s čimer merimo fekalije v vsaki vodni poti. Večji ko je krog, bolj umazana je voda, tako so veliki krogi umazana voda, manjši krogi so čistejši. To so kopenske vodne poti. To so vsi podatki, ki bili pridobljeni v mestu v zadnjih petih letih. Kopenske vodne poti so v večini bolj umazane. To je logično, kajne? Večji krogi so bolj umazani. Iz tega sem se naučil nekaj stvari. Prvič: Nikoli ne plavaj v nečem kar se konča s "potok" ali "kanal". Drugič: prav tako sem našel najbolj umazano vodno pot v New Yorku s to meritvijo, eno meritvijo. V potoku Coney Island, na srečo ne tistem, v katerem plavate. Je na drugi strani. V potoku Coney Island ima 94 % vzorcev, vzetih v zadnjih petih letih, tako visoko raven fekalij, da bi bilo protizakonito plavati v tej vodi. In to ni ravno dejstvo, s katerim bi se hvalili v mestnem poročilu, kajne? Ne bo na prvi strani nyc.gov. Tam ga ne boste videli, a dejstvo, da lahko dobimo te podatke, je neverjetno. A še enkrat, ni bilo zelo lahko, ker ti podatki niso bili na prostem portalu. Če bi odprli prost portal podatkov, bi videli samo delček, leto ali pa nekaj mesecev. Bilo je na strani Oddelka za okolje. Vsaka izmed teh povezav je Excelova tabela in vsaka je drugačna. Vsak vrh strani je drugačen: kopiraš, lepiš, preurejaš. Nato lahko ustvariš zemljevid, kar je super, a spet bi lahko kot mesto bolje storili, lahko bi standardizirali stvari. Kmalu bomo tam, ker je tu stran, ki jo izdeluje Socrata, imenovana Portal prostih podatkov NYC. Tu je 1100 setov podatkov, ki ne trpijo za omenjenimi slabostmi, in ta številka raste, kar je enkratno. Lahko si naložite podatke v kateremkoli formatu, naj bo CSV ali PDF ali Excel. Karkoli želite, lahko si jih naložite na tak način. Težava je, da ko to storite, boste videli, da vsaka agencija kodira svoj naslov drugače. Eno je ime ulice, ime križišča, cesta, mestni okraj, naslov, stavba, naslov stavbe. Tako da spet zapravljaš čas kljub portalu, zapravljaš čas z urejanjem polj z naslovi. To ni najboljša raba časa naših državljanov. Kot mesto lahko to naredimo bolje. Lahko standardiziramo naše naslove in če jih bomo, dobimo več takih zemljevidov. To je zemljevid gasilskih hidrantov v New Yorku, a ne katerihkoli. To je top 250 gasilskih hidrantov, kar se tiče kazni za parkiranje. (Smeh) Nekaj stvari sem se naučil iz tega zemljevida in zelo mi je všeč. Prvič, ne parkirajte na zgornjem vzhodnem delu. Enostavno ne. Ni važno, kje parkirate, dobili boste kazen zaradi hidranta. Drugič, našel sem dva največja zaslužkarja med hidranti v New Yorku, sta na nižjem delu vzhodne strani in prinašata več kot 55 000 dolarjev letno v kaznih za parkiranje. Zdelo se mi je malo čudno, ko sem to opazil, zato sem malo pobrskal in izkaže se, da je tam hidrant nato nekaj, imenovano podaljšek robnika, kar je dvometrski prostor za hojo, in potem parkirno mesto. Potem pridejo ti avti, in hidrant-- "Saj je tam daleč, v redu je." Tam je bilo parkirno mesto zanje lepo narisano. Parkirali so tam in NYPD se ni strinjal z njimi in dobili so kazen. Nisem samo jaz dobil kazni. To je Googlov avto Street view, ki je dobil isto kazen. O tem sem pisal na blogu I Quant NY. Urad za transport se je odzval. Dejali so: Čeprav nismo dobili nobene pritožbe o tej lokaciji, bomo preverili označbe na cestah in naredili potrebne popravke. Mislil sem si, tipičen vladni odziv, v redu, in nadaljeval z življenjem. A čez nekaj tednov se je zgodilo nekaj neverjetnega. To mesto so prebarvali in za sekundo sem videl prihodnost prostih podatkov, ker pomislite, kaj se je zgodilo tu. Pet let so delili kazni na tem mestu in bilo je nejasno, potem je meščan našel nekaj, to povedal in čez nekaj tednov so problem rešili. Neverjetno je. Veliko ljudi vidi odprte podatke kot psa čuvaja. Niso, tu gre za partnerstvo. Lahko damo moč državljanom, da bodo boljši partnerji vladi, in to ni tako težko. Potrebnih je le malo sprememb. Ko "FOILate" podatke če vidite da so podatki "FOILani" spet in spet, jih naredite javne, to je znak, da jih naredite javne. Če ste vladna agencija, ki izda PDF, sprejmimo zakon, da ga morate izdati skupaj z osnovnimi podatki, ker so ti podatki morali od nekje priti, ne vem, od kje, a prišli so od nekod, in to lahko izdate poleg PDF. Osvojimo in delimo nekaj standardov. Začnimo z naslovi v New Yorku. Začnimo normalizirati naše naslove. New York je prvi v prostih podatkih. Kljub vsemu smo absolutni prvaki v prostih podatkih. Če začnemo normalizirati stvari in postavimo standarde, bodo drugi sledili. Država, morda federalna vlada. Druge države bodo sledile, in nismo daleč od časa, ko bomo lahko napisali program in načrtali informacije 100 držav. Ni znanstvena fantastika. Zelo blizu smo. Komu smo s tem dali moč? Ker ni samo John Krauss in ni samo Chris Whong. Na stotine srečanj se dogaja v New Yorku, aktivnih srečanj. Na tisoče ljudi se udeležuje teh srečanj. Ti ljudje pridejo po službi in ob vikendih in se udeležujejo srečanj, in gledajo proste podatke in izboljšali naše mesto. Skupine kot je BetaNYC. Ta je ravno prejšnji teden izdala citygram.nyc. ki vam dovoli, da se naročite na pritožbe 311 okrog svojega doma ali okoli svoje pisarne. Vpišeš svoj naslov in dobiš lokalne pritožbe. In ni samo tehnološka skupnost navdušena nad tem. Krajinski arhitekti, kot tisti, ki jih učim na Prattu. Podporniki zakonov, vsi. Meščani iz različnih okolij. In z nekaj majhnimi, postopnimi spremembami lahko odklenemo strast in sposobnost naših državljanov, da izkoristimo proste podatke, da izboljšamo naše mesto, naj gre za en set podatkov ali eno parkirno mesto naenkrat. Hvala. (Aplavz)