Return to Video

Jak znaleźliśmy najgorsze miejsce do parkowania w Nowym Jorku za pomocą danych statystycznych

  • 0:01 - 0:04
    Dziesięć tysięcy kilometrów dróg,
  • 0:04 - 0:06
    1000 kilometrów torów metra,
  • 0:06 - 0:07
    650 kilometrów ścieżek rowerowych
  • 0:07 - 0:09
    oraz kilometr toru tramwajowego,
  • 0:09 - 0:11
    jeśli ktoś był na Roosevelt Island.
  • 0:11 - 0:14
    Te liczby składają się
    na infrastrukturę Nowego Jorku.
  • 0:14 - 0:17
    Oto statystyki naszej infrastruktury.
  • 0:17 - 0:20
    Można je znaleźć w raportach
    agencji miejskich.
  • 0:20 - 0:24
    Na przykład Departament Transportu
    prawdopodobnie poinformuje,
  • 0:24 - 0:26
    iloma kilometrami dróg zarządza.
  • 0:26 - 0:29
    MTA będzie się przechwalać
    długością torów metra.
  • 0:29 - 0:30
    Miejskie agencje publikują statystyki.
  • 0:30 - 0:32
    Te są z tegorocznego raportu
  • 0:32 - 0:34
    Komisji Taksówek i Limuzyn.
  • 0:34 - 0:37
    Można się z nich dowiedzieć,
    że po mieście jeździ 13 500 taksówek.
  • 0:37 - 0:38
    Całkiem ciekawe, prawda?
  • 0:38 - 0:41
    Ale czy zastanawialiście się,
    skąd pochodzą te liczby?
  • 0:41 - 0:44
    Żeby powstały, ktoś w agencji
  • 0:44 - 0:48
    musiał uznać: "Oto liczba,
    którą ktoś chciałby poznać.
  • 0:48 - 0:50
    Oto liczba, którą obywatele chcą znać".
  • 0:50 - 0:52
    Wracają więc do surowych danych,
  • 0:52 - 0:54
    liczą, dodają, obliczają
  • 0:54 - 0:55
    i wydają raporty
  • 0:55 - 0:57
    zawierające liczby takie, jak ta.
  • 0:57 - 1:00
    Skąd jednak znają wszystkie nasze pytania?
  • 1:00 - 1:02
    Mamy ich mnóstwo.
  • 1:02 - 1:05
    O naszym mieście można zadać
    nieskończenie wiele pytań.
  • 1:06 - 1:08
    Agencje nigdy by nie nadążyły.
  • 1:08 - 1:12
    To nie za bardzo działa
    i urzędnicy chyba o tym wiedzą.
  • 1:12 - 1:16
    W 2012 roku burmistrz Bloomberg
    podpisał ustawę, którą nazwał
  • 1:16 - 1:20
    "najbardziej ambitnym i kompleksowym
    prawodawstwem otwartych danych w kraju".
  • 1:20 - 1:21
    Pod wieloma względami ma rację.
  • 1:21 - 1:24
    Przez dwa lata nasze miasto
    umieściło 1000 zbiorów danych
  • 1:24 - 1:26
    na portalu otwartych danych.
  • 1:26 - 1:27
    To jest naprawdę niesamowite.
  • 1:27 - 1:29
    Kiedy je ściągasz i analizujesz
  • 1:29 - 1:32
    zamiast liczyć taksówki,
  • 1:32 - 1:34
    można zadawać inne pytania.
  • 1:34 - 1:35
    Zadałem pytanie.
  • 1:35 - 1:36
    Kiedy w NY są godziny szczytu?
  • 1:36 - 1:39
    Są trochę uciążliwe, ale kiedy dokładnie?
  • 1:39 - 1:42
    Pomyślałem, że taksówki
    nie są jedynie numerami,
  • 1:42 - 1:44
    są rejestratorami GPS
    jeżdżącymi po ulicach miasta,
  • 1:44 - 1:46
    nagrywającymi każdy przebyty kurs.
  • 1:46 - 1:49
    Przyjrzałem się tym danym
  • 1:49 - 1:53
    i stworzyłem dzienny wykres
    średniej prędkości nowojorskich taksówek.
  • 1:53 - 1:56
    Można zaobserwować,
    że od północy do 5:18 rano
  • 1:56 - 2:00
    prędkość rośnie,
    a następnie zaczyna spadać.
  • 2:00 - 2:04
    Maleje i maleje i maleje aż do około 8:35,
  • 2:04 - 2:06
    kiedy to wynosi około 18,5 km/h.
  • 2:06 - 2:10
    Przeciętna taksówka przemierza miasto
    z prędkością 18,5 km/h.
  • 2:10 - 2:12
    Okazuje się, że ta prędkość
  • 2:12 - 2:15
    utrzymuje się już do końca dnia.
  • 2:15 - 2:16
    (Śmiech)
  • 2:16 - 2:20
    Stwierdziłem, że w Nowym Jorku
    nie ma godzin szczytu.
  • 2:20 - 2:21
    Jest natomiast dzień szczytu.
  • 2:21 - 2:24
    To ma sens. I jest ważne z paru powodów.
  • 2:24 - 2:28
    To interesujące dla planisty transportu.
  • 2:28 - 2:30
    Jeśli chcesz dokądś sprawnie dojechać,
  • 2:30 - 2:33
    wystarczy ustawić budzik
    na 4:45 rano i gotowe.
  • 2:33 - 2:34
    W końcu to Nowy Jork.
  • 2:34 - 2:36
    Z tymi danymi wiąże się opowieść.
  • 2:36 - 2:38
    Nie były one dostępne wprost.
  • 2:38 - 2:42
    Pochodzą z "Zapytania na podstawie
    Ustawy o Wolności Informacji"
  • 2:42 - 2:43
    lub Zapytania FOIL.
  • 2:43 - 2:46
    Ten formularz jest na stronie
    Komisji ds. Taksówek i Limuzyn.
  • 2:46 - 2:49
    Żeby uzyskać dostęp do tych danych,
    należało go pobrać i wypełnić,
  • 2:49 - 2:50
    a potem cię zawiadomią.
  • 2:50 - 2:53
    Zrobił to facet o nazwisku Chris Whong.
  • 2:53 - 2:55
    Chris usłyszał:
  • 2:55 - 2:59
    "Przynieś nam fabrycznie nowy dysk twardy
    i zostaw go na pięć godzin.
  • 2:59 - 3:01
    Dostaniesz skopiowane dane".
  • 3:01 - 3:03
    Tak powstały te dane.
  • 3:03 - 3:06
    Chris chciał upubliczniać dane.
  • 3:06 - 3:10
    Udostępnił je w internecie,
    dzięki czemu powstały te wykresy.
  • 3:10 - 3:13
    Fajnie, że istnieją takie dane.
    Rejestratory GPS - fajna rzecz.
  • 3:13 - 3:16
    Ale żeby to obywatele mieli
    spacerować z twardymi dyskami
  • 3:16 - 3:18
    kopiować dane w celu upublicznienia,
  • 3:18 - 3:21
    dane niby już "publiczne",
    bo dało się je zdobyć,
  • 3:21 - 3:23
    ale nie naprawdę publiczne.
  • 3:23 - 3:25
    Miasto może zrobić to lepiej.
  • 3:25 - 3:28
    Nie potrzeba obywateli
    krążących z dyskami twardymi.
  • 3:28 - 3:31
    Nie każdy pakiet danych
    jest związany z FOIL.
  • 3:31 - 3:34
    Stworzyłem mapę najniebezpieczniejszych
    skrzyżowań w Nowym Yorku
  • 3:34 - 3:37
    w oparciu o wypadki rowerzystów.
  • 3:37 - 3:39
    Czerwone obszary są niebezpieczniejsze.
  • 3:39 - 3:44
    Od razu widać,
    że we wschodniej części Manhattanu,
  • 3:44 - 3:46
    jest więcej wypadków rowerowych.
  • 3:46 - 3:46
    To ma sens.
  • 3:46 - 3:49
    W tym miejscu rowerzyści
    zjeżdżają z mostów.
  • 3:49 - 3:50
    Są też inne punkty zapalne.
  • 3:50 - 3:53
    To Williamsburg
    i aleja Roosvelta w Queens.
  • 3:53 - 3:56
    Takich danych potrzeba do Vision Zero.
  • 3:56 - 3:58
    Tego właśnie szukamy.
  • 3:58 - 4:00
    Za tymi danymi też kryje się historia.
  • 4:00 - 4:02
    Te dane nie wzięły się z powietrza.
  • 4:02 - 4:04
    Ile z was zna to logo?
  • 4:04 - 4:06
    Kilka osób potakuje.
  • 4:06 - 4:08
    Próbowaliście kiedyś
    skopiować i wkleić dane z PDFa,
  • 4:08 - 4:10
    żeby miały jakiś sens?
  • 4:10 - 4:12
    Więcej próbowało funkcji kopiuj-wklej,
  • 4:12 - 4:14
    niż zna to logo. Nieźle.
  • 4:14 - 4:18
    Dane, które właśnie widzieliśmy,
    były w właśnie w pliku PDF,
  • 4:18 - 4:21
    na setkach stron dokumentów,
  • 4:21 - 4:23
    tworzone przez naszą własną policję.
  • 4:23 - 4:26
    Aby je wykorzystać,
    trzeba by robić kopuj-wklej
  • 4:26 - 4:27
    przez setki godzin
  • 4:27 - 4:29
    albo być Janem Kraussem.
  • 4:29 - 4:30
    Jan Krauss uznał:
  • 4:30 - 4:33
    "Nie zamierzam kopiować tych danych.
    Stworzę program".
  • 4:33 - 4:36
    Nazywa się "Wsparcie Bazy
    Danych o Wypadkach".
  • 4:36 - 4:39
    Wchodzi na stronę policji i ściąga PDFy.
  • 4:39 - 4:40
    Szuka ich codziennie.
  • 4:40 - 4:44
    Ściąga znaleziony PDF
    i wyodrębnia informacje,
  • 4:44 - 4:46
    tworząc tekst,
  • 4:46 - 4:49
    za pomocą którego można
    tworzyć mapy, jak ta.
  • 4:49 - 4:53
    To, że dane są tutaj
    i że mamy do nich dostęp...
  • 4:53 - 4:55
    Każdy wypadek to wiersz tabeli.
  • 4:55 - 4:57
    Wyobraźcie sobie, ile to PDF-ów.
  • 4:57 - 4:59
    To, że mamy do nich dostęp, jest super,
  • 4:59 - 5:01
    ale nie publikujmy ich w formacie PDF,
  • 5:01 - 5:04
    zmuszając ludzi do pisania
    programów dekodujących PDF-y.
  • 5:04 - 5:06
    To marnowanie czasu mieszkańców.
  • 5:06 - 5:08
    Jako miasto możemy zrobić to lepiej.
  • 5:08 - 5:11
    Dobrze, że administracja de Blasio
  • 5:11 - 5:13
    udostępniła te dane kilka miesięcy temu,
  • 5:13 - 5:15
    i teraz rzeczywiście jest do nich dostęp,
  • 5:15 - 5:18
    ale wiele danych wciąż
    jest zagrzebanych w PDF-ach.
  • 5:18 - 5:23
    Dane kryminalne są dostępne tylko w PDF.
  • 5:23 - 5:25
    Również budżet miasta.
  • 5:25 - 5:29
    Budżet miasta dostępny jest
    tylko w formacie PDF.
  • 5:29 - 5:31
    Nie tylko nam trudno go przeanalizować.
  • 5:31 - 5:34
    Ustawodawcy, którzy głosują nad budżetem,
  • 5:34 - 5:36
    też dostają ten PDF.
  • 5:36 - 5:40
    Prawodawcy nie mogą
    przeanalizować budżetu, za którym głosują.
  • 5:40 - 5:43
    Jako miasto stać nas na więcej.
  • 5:43 - 5:46
    Jest wiele danych,
    które nie są ukryte w plikach PDF.
  • 5:46 - 5:47
    To przykład stworzonej przeze mnie
  • 5:47 - 5:50
    mapy najbrudniejszych
    cieków wodnych w Nowym Jorku.
  • 5:50 - 5:52
    Jak mierzę poziom brudu?
  • 5:52 - 5:54
    To trochę dziwaczne.
  • 5:54 - 5:56
    Zmierzyłem poziom pałeczek z grupy coli,
  • 5:56 - 5:59
    który jest miarą masy kałowej w wodzie.
  • 5:59 - 6:03
    Im większe kółko, tym brudniejsza woda,
  • 6:03 - 6:06
    duże kółka - brudniejsza,
    małe - czystsza.
  • 6:06 - 6:08
    Na mapie widać cieki powierzchniowe.
  • 6:08 - 6:11
    To dane miejskie za ostatnie pięć lat.
  • 6:11 - 6:14
    Cieki powierzchniowe są brudniejsze.
  • 6:14 - 6:15
    To ma sens, prawda?
  • 6:15 - 6:18
    Dowiedziałem się dzięki temu paru rzeczy.
  • 6:18 - 6:23
    Po pierwsze: nie pływaj w niczym,
    co ma w nazwie "potok" lub "kanał".
  • 6:23 - 6:26
    Po drugie: znalazłem najbrudniejsze
    cieki w Nowym Jorku
  • 6:26 - 6:28
    dzięki jednemu pomiarowi.
  • 6:28 - 6:31
    Potok Coney Island,
    nie kąpielisko Coney Island.
  • 6:31 - 6:32
    To po drugiej stronie.
  • 6:32 - 6:36
    W potoku Coney Island 94% próbek
    pobranych przez ostatnie 5 lat
  • 6:36 - 6:39
    miała tak wysoki poziom kału,
  • 6:39 - 6:42
    że pływanie tam byłoby
    niezgodne z prawem stanowym.
  • 6:42 - 6:45
    Nie ma się czym chwalić
  • 6:45 - 6:46
    w miejskim raporcie.
  • 6:46 - 6:49
    Nie znajdziecie tego
    na głównej stronie nyc.gov.
  • 6:49 - 6:50
    ale mimo to fajnie,
  • 6:50 - 6:52
    że dotarliśmy do tych danych.
  • 6:52 - 6:54
    Ale znowu, nie było to łatwe,
  • 6:54 - 6:56
    bo dane nie były na otwartym portalu.
  • 6:56 - 6:58
    Na otwartym portalu można zobaczyć
  • 6:58 - 7:00
    tylko fragment, rok lub parę miesięcy.
  • 7:00 - 7:03
    Znajdowały się na stronie
    Departamentu Ochrony Środowiska.
  • 7:03 - 7:07
    Każdy z tych linków to arkusz Excel
    i każdy jest inaczej zbudowany.
  • 7:07 - 7:11
    Każdy jest inny:
    trzeba je kopiować, organizować.
  • 7:11 - 7:13
    Potem można stworzyć mapy.
  • 7:13 - 7:16
    Miasto powinno to standaryzować.
  • 7:16 - 7:19
    Do tego celu zbliża się Socrata ze stroną
  • 7:19 - 7:21
    Otwarty Portal Danych NYC.
  • 7:21 - 7:23
    Znajduje się tam 1100 zestawów danych,
  • 7:23 - 7:24
    bez wad, o których mówiłem.
  • 7:24 - 7:26
    Ich liczba rośnie.
  • 7:26 - 7:31
    Można ściągnąć dane
    w dowolnym formacie, CSV, PDF lub Excel.
  • 7:31 - 7:33
    Można je ściągnąć w dowolnej chwili,
  • 7:33 - 7:35
    ale problem w tym,
  • 7:35 - 7:39
    że każda agencja inaczej koduje adresy.
  • 7:39 - 7:41
    Tu mamy nazwę ulicy, skrzyżowania,,
  • 7:41 - 7:43
    ulicę, dzielnicę, adres,
    budynek, adres budynku.
  • 7:43 - 7:47
    Nawet mając ten portal,
  • 7:47 - 7:49
    znów tracisz czas,
    ujednolicając pola adresowe.
  • 7:49 - 7:52
    To nie najlepsze wykorzystanie
    czasu obywateli.
  • 7:52 - 7:53
    Możemy zrobić to lepiej.
  • 7:53 - 7:55
    Możemy standaryzować adresy,
  • 7:55 - 7:57
    stworzyć więcej map takich, jak ta.
  • 7:57 - 8:00
    To jest mapa hydrantów w Nowym Jorku,
  • 8:00 - 8:01
    ale nie byle jakich hydrantów.
  • 8:01 - 8:06
    250 hydrantów o największych przychodach
    z mandatów za złe parkowanie.
  • 8:06 - 8:09
    (Śmiech)
  • 8:09 - 8:11
    Sporo mnie ta mapa nauczyła.
    Naprawdę ją lubię.
  • 8:11 - 8:14
    Pierwsze - nie parkuj na Upper East Side.
  • 8:14 - 8:18
    Po prostu nie. Wszędzie dostaniesz mandat.
  • 8:18 - 8:21
    Znalazłem też dwa najbardziej dochodowe
    hydranty w całym Nowym Yorku,
  • 8:21 - 8:23
    oba na Lower East Side,
  • 8:23 - 8:28
    przynoszące ponad 55 000 dolarów rocznie
    z mandatów za parkowanie.
  • 8:28 - 8:32
    Trochę mnie to zdziwiło,
    więc trochę poszperałem.
  • 8:32 - 8:34
    Okazuje się, że stoi hydrant,
  • 8:34 - 8:36
    następnie "przedłużenie krawężnika",
  • 8:36 - 8:39
    2 metry chodnika
    i dopiero miejsce parkingowe.
  • 8:39 - 8:42
    Kierowcy sądzili, że hydrant jest daleko,
  • 8:42 - 8:44
    więc wszystko jest w porządku,
  • 8:44 - 8:47
    było specjalnie namalowane
    miejsce parkingowe.
  • 8:47 - 8:50
    Tylko że policja nie zgadzała się
    z wyborem miejsca
  • 8:50 - 8:51
    i dawała mandaty.
  • 8:51 - 8:52
    Nie tylko ja je znalazłem.
  • 8:52 - 8:55
    Przejeżdżający samochód Google Street View
  • 8:55 - 8:57
    odnalazł te same mandaty.
  • 8:57 - 9:00
    Napisałem o tym na moim blogu, I Quant NY,
  • 9:00 - 9:02
    i DOT odpowiedział mi tak:
  • 9:02 - 9:07
    "Chociaż DOT nie otrzymał żadnych skarg
    w odniesieniu do tego miejsca,
  • 9:07 - 9:11
    sprawdzimy znaki drogowe
    i dokonamy odpowiednich poprawek ".
  • 9:11 - 9:14
    Pomyślałem - typowa urzędnicza odpowiedź.
  • 9:14 - 9:16
    Zapomniałem o sprawie.
  • 9:16 - 9:20
    Kilka tygodni później,
    stało się coś niesamowitego.
  • 9:20 - 9:22
    Przemalowali to miejsce.
  • 9:22 - 9:25
    Pomyślałem,
    że to przyszłość otwartych danych.
  • 9:25 - 9:27
    Pomyślcie, co tu zaszło.
  • 9:27 - 9:33
    Przez pięć lat w tym mylącym miejscu
    wystawiano mandaty,
  • 9:33 - 9:36
    obywatel to zauważył,
    powiedział o tym miastu
  • 9:36 - 9:40
    i w parę tygodni
    problem został rozwiązany.
  • 9:40 - 9:42
    Wiele osób uważa dostęp
    do danych to nadzór.
  • 9:42 - 9:43
    ale tu chodzi o partnerstwo.
  • 9:43 - 9:46
    Obywatele mogą być
    lepszymi partnerami dla władz
  • 9:46 - 9:48
    i nie jest to takie trudne.
  • 9:48 - 9:49
    Potrzeba tylko paru zmian.
  • 9:49 - 9:51
    Jeżeli udostępniasz dane dla FOIL,
  • 9:51 - 9:53
    widzisz, że ktoś wciąż o nie prosi,
  • 9:53 - 9:56
    to jest znak, że trzeba je upublicznić.
  • 9:56 - 9:59
    Jeżeli jako agent rządowy
    wypuszczasz dane w formacie PDF,
  • 9:59 - 10:03
    niech prawo wymaga, żeby publikować je
    wraz z danymi źródłowymi,
  • 10:03 - 10:05
    bo te dane skądś się wzięły,
  • 10:05 - 10:07
    choć nie wiem skąd,
  • 10:07 - 10:09
    więc można je publikować wraz z PDF-em.
  • 10:09 - 10:13
    Przyjmijmy standard otwartych danych.
  • 10:13 - 10:16
    Zacznijmy od ujednolicenia adresów,
  • 10:16 - 10:18
    Nowy Jork jest liderem w otwartych danych.
  • 10:18 - 10:20
    Mimo problemów
    jesteśmy absolutnym liderem.
  • 10:20 - 10:24
    Jeżeli ustalimy standard
    dla otwartych danych,
  • 10:24 - 10:26
    inni za nami podążą.
  • 10:26 - 10:27
    Władze stanowe, rząd, inne kraje.
  • 10:29 - 10:32
    Niewiele brakuje,
    żeby za pomocą jednego programu
  • 10:32 - 10:34
    tworzyć mapy informacji ze 100 krajów.
  • 10:34 - 10:37
    To nie science fiction.
    Jesteśmy naprawdę blisko.
  • 10:37 - 10:39
    Kto na tym skorzysta?
  • 10:39 - 10:42
    Nie tylko John Krauss czy Chris Whong,
  • 10:42 - 10:45
    lecz setki nowojorskich organizacji,
  • 10:45 - 10:46
    aktywnych grup.
  • 10:46 - 10:49
    Tysiące ludzi uczestniczy w spotkaniach,
  • 10:49 - 10:51
    w weekendy, po pracy
  • 10:51 - 10:53
    przyglądają się danym
  • 10:53 - 10:55
    żeby ulepszyć nasze miasto.
  • 10:55 - 10:59
    Na przykład grupa BetaNYC
    założyła citygram.nyc,
  • 10:59 - 11:02
    gdzie można zasubskrybować
    skargi komunalne
  • 11:02 - 11:04
    w okolicach domu lub biura.
  • 11:04 - 11:06
    Wpisujesz adres
    i dostajesz listę lokalnych zażaleń.
  • 11:06 - 11:09
    Dąży do tego nie tylko
    techniczna społeczność,
  • 11:09 - 11:12
    ale też planiści miejscy,
    jak studenci, których uczę w Pratt,
  • 11:12 - 11:14
    aktywiści polityczni, każdy,
  • 11:14 - 11:17
    obywatele z różnych środowisk.
  • 11:17 - 11:19
    Małymi, stopniowymi zmianami
  • 11:19 - 11:23
    możemy uwolnić pasję
    i zdolności naszych obywateli,
  • 11:23 - 11:26
    żeby wykorzystać otwarte dane
    i usprawniać nasze miasto,
  • 11:26 - 11:29
    czy to jednym zestawem danych,
    czy jednym miejscem parkingowym.
  • 11:29 - 11:32
    Dziękuję.
  • 11:32 - 11:35
    (Brawa)
Title:
Jak znaleźliśmy najgorsze miejsce do parkowania w Nowym Jorku za pomocą danych statystycznych
Speaker:
Ben Wellington
Description:

Miejskie agencje mają dostęp do wielu danych i statystyk obejmujących każdą część życia miasta. Ben Wellington, badacz danych pokazuje w tej prelekcji, że czasem po prostu nie wiedzą, co z nimi zrobić. Wellington demonstruje, jak połączenie niespodziewanych pytań i dobrze zorganizowanych danych może stworzyć bardzo użyteczne informacje oraz podpowiada, w jaki sposób udostępniać duże zbiory danych, aby każdy mógł ich użyć.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
11:48

Polish subtitles

Revisions