Return to Video

如何找到紐約市最差的停車位?——用大數據說話

  • 0:01 - 0:04
    六千英里公路,
  • 0:04 - 0:06
    六百英里地鐵路線,
  • 0:06 - 0:07
    四百英里腳踏車專用道,
  • 0:07 - 0:09
    半英里的有軌電車專用道
  • 0:09 - 0:11
    僅在羅斯福島。
  • 0:11 - 0:14
    這些數字構成了紐約市的基建。
  • 0:14 - 0:16
    這些基建的統計數字,
  • 0:16 - 0:19
    都可以在市政機關公佈的報告中找到。
  • 0:19 - 0:22
    譬如,交通部門可能會告訴你,
  • 0:22 - 0:24
    他們維護這多少英里的道路。
  • 0:24 - 0:26
    MTA(紐約交通運輸管理局)會自誇
    他們掌管著多少英里捷運。
  • 0:26 - 0:29
    多數的市政機關都在公佈統計數據。
  • 0:29 - 0:33
    這是今年計程車與轎車委員會發佈的報告,
  • 0:33 - 0:37
    我們從中知道紐約市運營著
    大約一萬三千五百輛計程車。
  • 0:37 - 0:38
    很有趣,是嗎?
  • 0:38 - 0:41
    但你有否想過這些數據來自哪裡?
  • 0:41 - 0:44
    既然有這些數字存在,
    那肯定是因為在市政機關的某個人
  • 0:44 - 0:47
    想過:嗯......這個數字可能有人會想知道。
  • 0:47 - 0:49
    這個數字是市民們想知道的。
  • 0:49 - 0:51
    所以他們找回那些原始數據,
  • 0:51 - 0:53
    他們計數、相加、計算,
  • 0:53 - 0:55
    然後把得出的結果寫進報告中,
  • 0:55 - 0:57
    所以那些報告中會有這樣的數字。
  • 0:57 - 1:00
    那麼問題來了:他們怎麼會知道
    我們的問題都是什麼?
  • 1:00 - 1:01
    我們有很多問題。
  • 1:01 - 1:04
    事實上,可以說我們有無窮無盡的問題
  • 1:04 - 1:06
    有關我們這座城市。
  • 1:06 - 1:08
    市政機關可無法跟得上(我們的節奏)。
  • 1:08 - 1:12
    現有模式並不具有實效,我覺得
    我們的政策制定者也知道這點,
  • 1:12 - 1:16
    因為在2012年,彭博市長
    簽署了一個法令,他稱之為
  • 1:16 - 1:20
    全美最具雄心和綜合性的
    開放數據立法。
  • 1:20 - 1:21
    從各種意義上來說,他是對的。
  • 1:21 - 1:24
    在過去兩年中,市政有1000個數據庫
  • 1:24 - 1:26
    放在我們的開放數據門戶網站上,
  • 1:26 - 1:28
    還是蠻驚人的。
  • 1:28 - 1:29
    我們來檢視這些數據,
  • 1:29 - 1:32
    除了數數計程車的數量,
  • 1:32 - 1:34
    我們也能開始問不一樣的問題了。
  • 1:34 - 1:35
    我有一個問題:
  • 1:35 - 1:36
    紐約市的交通高峰在什麼時候?
  • 1:36 - 1:39
    這簡直煩人。高峰到底是什麼時候?
  • 1:39 - 1:42
    我想到,這些計程車可不僅僅是個數字,
  • 1:42 - 1:44
    它們可以是開遍全市道路的GPS記錄儀,
  • 1:44 - 1:46
    記錄著乘客的每一差車程。
  • 1:46 - 1:49
    數據是現成的。我檢視它們,
  • 1:49 - 1:53
    並制出一張圖表,標出
    一天中紐約市計程車的平均時速。
  • 1:53 - 1:56
    大家可以看到,
    從半夜到凌晨五點十八分,
  • 1:56 - 2:00
    時速一直在增加,然後到了拐點,
  • 2:00 - 2:04
    時速逐漸下降,在早間的八點三十五分,
  • 2:04 - 2:06
    時速降到十一英里半。
  • 2:06 - 2:10
    運營中計程車的平均時速
    保持在十一英里半,
  • 2:10 - 2:12
    結果沒有變化,
  • 2:12 - 2:15
    整天都是如此。
  • 2:15 - 2:16
    (笑聲)
  • 2:16 - 2:19
    我告訴自己,紐約市並不存在高峰時段,
  • 2:19 - 2:22
    而是全天都高峰。
  • 2:22 - 2:24
    這是個有意義的結論,原因有幾點。
  • 2:24 - 2:28
    如果你是做交通規劃的,
    知道這個結論會有意義。
  • 2:28 - 2:30
    如果你要快速到達某地,
  • 2:30 - 2:33
    只要把鬧鐘定在凌晨四點四十五分就行了。
  • 2:33 - 2:34
    紐約嘛!
  • 2:34 - 2:35
    但這個數據背後還有故事。
  • 2:35 - 2:37
    這個數據並不真的是現成的。
  • 2:37 - 2:41
    你需要做一個「信息自由法案申請」,
  • 2:41 - 2:43
    也叫「FOIL申請」。
  • 2:43 - 2:46
    你可以在計程車和轎車委員會的網站上
    找到相關申請表。
  • 2:46 - 2:48
    如果要獲得這些數據,
    你要弄到這張申請表,
  • 2:48 - 2:50
    填好上交,受理人員屆時會通知你。
  • 2:50 - 2:53
    一個叫克里斯▪旺的人就這樣做了。
  • 2:53 - 2:55
    克里斯來到委員會,工作人員告訴他
  • 2:55 - 2:57
    「帶個全新的硬盤來辦公室,
  • 2:57 - 3:01
    我們會把相關數據拷貝給你,
    過五小時來拿。」
  • 3:01 - 3:03
    這就是拿到數據的經過。
  • 3:03 - 3:05
    克里斯想公開這些數據,
  • 3:05 - 3:10
    於是放到網路上供所有人使用,
    所以我才能做出這張圖。
  • 3:10 - 3:14
    這一切——這些GPS記錄儀真是酷。
  • 3:14 - 3:16
    但是,市民要攜帶自己的移動硬盤
  • 3:16 - 3:19
    踏遍市政機關,
    然後通過自己的努力公開,這件事——
  • 3:19 - 3:22
    政府數據可以說是公開的,
    普通市民能得到它,
  • 3:22 - 3:23
    但這只是名義上的「公開」,
    並不是真正的公開。
  • 3:23 - 3:25
    我們的城市可以做得更好。
  • 3:25 - 3:28
    我們不需要費力帶著移動硬盤到處跑。
  • 3:28 - 3:31
    並不是每一個數據庫都需要FOIL申請。
  • 3:31 - 3:34
    我做的這張地圖標出了紐約市最危險的路口,
  • 3:34 - 3:37
    來源是腳踏車騎行者的交通事故數據。
  • 3:37 - 3:38
    紅色區域更危險,
  • 3:38 - 3:41
    圖上顯示,首先,曼哈頓的東側,
  • 3:41 - 3:45
    特別是曼哈頓的下城區域,
    腳踏車事故更多。
  • 3:45 - 3:46
    這可能是因為,
  • 3:46 - 3:48
    在這裡有更多的騎行者從大橋下來。
  • 3:48 - 3:50
    圖上還有其他的熱點區域值得研究。
  • 3:50 - 3:53
    威廉姆斯堡、皇后區的羅斯福大道,
  • 3:53 - 3:55
    這些咨詢才是Vision Zero項目所需要的。
  • 3:55 - 3:58
    這正是我們要找的東西。
  • 3:58 - 4:00
    這個數據背後也有個故事。
  • 4:00 - 4:02
    這個數據並不是現成的。
  • 4:02 - 4:04
    有多少人知道這個符號?
  • 4:04 - 4:06
    我看到有人點頭了。
  • 4:06 - 4:08
    你們有沒有試過從PDF文檔中
    拷貝和黏貼數據,
  • 4:08 - 4:10
    並據此作出結論呢?
  • 4:10 - 4:11
    我看到更多人點頭了。
  • 4:11 - 4:14
    試圖拷貝粘貼的人
    比認識這個標誌的人更多,真有趣。
  • 4:14 - 4:18
    你們剛剛看到的數據是做在PDF裡的。
  • 4:18 - 4:21
    事實上,是成千上萬頁的PDF文檔,
  • 4:21 - 4:23
    由我們的紐約警署發佈。
  • 4:23 - 4:25
    如果你想享用這些數據,
    你要不就持續
  • 4:25 - 4:27
    做複製黏貼的動作,花掉成千上萬小時,
  • 4:27 - 4:29
    要不就像約翰▪克勞斯一樣。
  • 4:29 - 4:30
    約翰▪克勞斯
  • 4:30 - 4:33
    可不想重複地去複製黏貼,
    他寫了一個程式。
  • 4:33 - 4:36
    這個程序叫做
    「紐約警署交通事故數據OK蹦」,
  • 4:36 - 4:39
    它能到紐約警署的網站下載PDF文檔,
  • 4:39 - 4:42
    每天它都去搜索;
    如果找到一個PDF文檔,就下載下來,
  • 4:42 - 4:44
    然後運行某個PDF解碼的程式,
  • 4:44 - 4:46
    把其中的文字信息提取出來,
  • 4:46 - 4:49
    其中的訊息會發佈在網路上,
    人們就可以製作這些地圖。
  • 4:49 - 4:53
    這些數據就在那兒,我們都能得到——
  • 4:53 - 4:55
    每一個交通事故就是一行數據。
  • 4:55 - 4:57
    你們可以想像有多少PDF需要轉碼。
  • 4:57 - 4:59
    ——我們能看到這些數據固然好,
  • 4:59 - 5:01
    但能不能不要弄成PDF格式的,
  • 5:01 - 5:04
    不然市民們就得去寫PDF解碼的程式,
  • 5:04 - 5:06
    這對市民的時間來說是一種浪費,
  • 5:06 - 5:08
    而我們的城市能做的更好。
  • 5:08 - 5:11
    有個好消息,白思豪市長的班底
  • 5:11 - 5:13
    在幾個月前公開了這份數據,
  • 5:13 - 5:15
    所以我們能直接享用這些數據,
  • 5:15 - 5:18
    然而還有很多數據是PDF格式的。
  • 5:18 - 5:21
    譬如,我們的罪案數據目前只有PDF格式的。
  • 5:21 - 5:25
    除了罪案數據,市政預算也是如此。
  • 5:25 - 5:29
    目前我們的市政預算只有PDF格式的。
  • 5:29 - 5:31
    不僅是我們無法分析這些數字,
  • 5:31 - 5:34
    那些為市政預算投票的立法委員們
  • 5:34 - 5:36
    也只能拿到PDF版本的數字。
  • 5:36 - 5:40
    所以我們的立法委員是無法分析
    他們要為之投票的市政預算的。
  • 5:40 - 5:43
    我認為我們的城市還能做得更好。
  • 5:43 - 5:46
    很多數據已經不躲在PDF中了。
  • 5:46 - 5:47
    這裡有一幅地圖可以作為例證,
  • 5:47 - 5:50
    標示了紐約市最骯髒的水路。
  • 5:50 - 5:52
    我是如何衡量「骯髒」的呢?
  • 5:52 - 5:54
    這裡有些奇怪,
  • 5:54 - 5:56
    我衡量的是糞便大腸菌群的水平,
  • 5:56 - 5:59
    這是水路中糞便物質的一種衡量指標。
  • 5:59 - 6:03
    圓圈越大,水就越髒,
  • 6:03 - 6:06
    所以圖上的大圓圈代表髒水,
    小圓圈代表乾淨的水。
  • 6:06 - 6:08
    大家看到的是內河水道。
  • 6:08 - 6:11
    這裡有紐約市過去五年採樣的所有數據。
  • 6:11 - 6:14
    內河水道總的來說變髒了。
  • 6:14 - 6:15
    這個結論挺合理的,對嗎?
  • 6:15 - 6:18
    大圓圈代表髒水。
    我從中學到了幾件事情。
  • 6:18 - 6:21
    第一:千萬別在任何叫做「xx溪」
    或「xx運河」的地方游泳。
  • 6:21 - 6:26
    但是第二:紐約市最髒的水路,
  • 6:26 - 6:28
    只看(糞便大腸菌群)這個唯一的指標,
  • 6:28 - 6:31
    在康尼島溪,幸好不是你們游泳的康尼島。
  • 6:31 - 6:32
    那在島的另一面。
  • 6:32 - 6:36
    但在康尼島溪中,
    過去五年的採樣中有94%
  • 6:36 - 6:38
    含有超標的糞便含量,
  • 6:38 - 6:41
    以至於達到州法律禁止游泳的水平。
  • 6:41 - 6:44
    這種類型的事實
  • 6:44 - 6:46
    你可不會在市政報告中看到,不是嗎?
  • 6:46 - 6:48
    這也不會登上紐約市政府網站的頭條。
  • 6:48 - 6:49
    我們肯定不會看到的,
  • 6:49 - 6:52
    但能看到這些數據真實不錯。
  • 6:52 - 6:54
    同樣,拿到這些數據並不容易,
  • 6:54 - 6:56
    因為它們並不在公開數據門戶網站上。
  • 6:56 - 6:58
    如果你看公開數據的門戶網站,
  • 6:58 - 7:01
    你只能看到其中一些片段,
    只有一年內或幾個月的數據。
  • 7:01 - 7:04
    這些數據其實是在環境保護部門的網站上。
  • 7:04 - 7:08
    每一個鏈接都是一個Excel文件,
    而每個Excel文件都是不一樣的。
  • 7:08 - 7:11
    每一個表頭都不同:
    需要複製、黏貼、還有重新整理。
  • 7:11 - 7:13
    一旦完成你就能做出這些地圖,
    但我要再次重申,
  • 7:13 - 7:16
    我們的城市能做的更好,
    我們可以標準化。
  • 7:16 - 7:19
    我們正在改善這裡有個
    索克拉塔公司建立的網站
  • 7:19 - 7:20
    叫做「紐約市公開數據門戶」。
  • 7:20 - 7:21
    這裡,1100個數據庫
  • 7:21 - 7:24
    都不存在標準化的問題,
  • 7:24 - 7:26
    而且(這些無縫連接的數據庫)數字還在增加。
  • 7:26 - 7:29
    你可以下載任一格式的數據:
    CSV、PDF或Excel文件都可以。
  • 7:29 - 7:33
    按你自己的需求來下載。
  • 7:33 - 7:34
    但問題又來了,
  • 7:34 - 7:40
    你會發現不同的機構
    用不同的代碼來表示地址。
  • 7:40 - 7:41
    有街道名、有路口名、
  • 7:41 - 7:43
    行政區、地址、建築物、建築物地址等等。
  • 7:43 - 7:47
    所以,即使有這個門戶網站的幫助,
  • 7:47 - 7:49
    你還得花時間來標準化地址這塊的數據。
  • 7:49 - 7:52
    這也不是有效利用市民時間的方法。
  • 7:52 - 7:53
    我們的城市能做得更好。
  • 7:53 - 7:55
    我們可以對地址進行標準化,
  • 7:55 - 7:57
    如果做到了,
    我們就能做出更多這樣的地圖。
  • 7:57 - 8:00
    這是紐約市消防龍頭的地圖,
  • 8:00 - 8:01
    但不僅於此。
  • 8:01 - 8:06
    這些是前250個吃到最多違章停車罰單的
    消防栓位置圖。
  • 8:06 - 8:08
    (笑聲)
  • 8:08 - 8:11
    我從圖中學到了幾件事,
    我也真的喜歡這張圖。
  • 8:11 - 8:14
    第一:別在上東區停車。
  • 8:14 - 8:17
    千萬別停。因為不管停哪裡都會吃罰單。
  • 8:17 - 8:21
    第二:我找出了全紐約市最最容易
    吃到違章停車罰單的兩個消防栓的位置,
  • 8:21 - 8:23
    兩個都在下東區,
  • 8:23 - 8:28
    每年能在罰單上創收五萬五千多美金。
  • 8:28 - 8:31
    我注意到這點,覺得有些奇怪,
  • 8:31 - 8:34
    於是深入挖掘了一下原因,
    結果發現消防栓
  • 8:34 - 8:36
    都有一個叫做控制擴展的區域,
  • 8:36 - 8:38
    是約有七英呎的一塊地方,可以走路,
  • 8:38 - 8:39
    然後是一個停車位。
  • 8:39 - 8:42
    所以車開過來,司機發現消防栓,
  • 8:42 - 8:44
    想“還有一段距離,這裡沒問題的”,
  • 8:44 - 8:47
    何況地上還有一個畫得美美的停車位,
  • 8:47 - 8:49
    司機停好車,但紐約警署不同意這種配置,
  • 8:49 - 8:50
    開出了罰單。
  • 8:50 - 8:53
    可不只是我本人吃了罰單,
  • 8:53 - 8:55
    這是谷歌街景拍到的一輛過路車,
  • 8:55 - 8:57
    也吃了同樣的一張罰單。
  • 8:57 - 9:01
    於是我把這件事發到自己的部落格上
    以及“I Quant NY”上,
  • 9:01 - 9:03
    結果交通部門回復如下:
  • 9:03 - 9:06
    “交通部並未就此地點收到相關投訴,
  • 9:06 - 9:11
    我們會重新檢視道路標誌,
    並做出適當的改善措施。”
  • 9:11 - 9:14
    我暗自想:多麼官腔!
  • 9:14 - 9:16
    好吧,我該幹嘛幹嘛去了。
  • 9:16 - 9:20
    然而,幾週時間過去,
    發生了意料之外的事情。
  • 9:20 - 9:22
    停車位重新畫了,
  • 9:22 - 9:25
    那一瞬間我覺得能看到公開數據的未來。
  • 9:25 - 9:27
    大家想想這件事,
  • 9:27 - 9:32
    過去五年,這個讓人困惑的停車位
    一直讓人吃罰單,
  • 9:32 - 9:36
    但某一天,一位市民發現了問題
    報告市政機關,又過了幾週時間,
  • 9:36 - 9:38
    問題車位被修正了。
  • 9:38 - 9:41
    太不可思議了。很多人認為
    公開數據讓市民變成政府的監視者,
  • 9:41 - 9:43
    並非如此,它實則讓人們成為了合作夥伴。
  • 9:43 - 9:46
    市民能夠有底氣成為政府更好的合作夥伴,
  • 9:46 - 9:48
    這並不難。
  • 9:48 - 9:49
    我們只需要作出一些改變。
  • 9:49 - 9:50
    如果我們在申請FOIL信息自由法案數據,
  • 9:50 - 9:53
    如果你看到自己申請的數據已經被反覆申請,
  • 9:53 - 9:57
    讓我們直接向公眾公開,
    因為反覆申請就是需要公開的一种信號。
  • 9:57 - 9:59
    如果某個政府機關正在發佈PDF數據,
  • 9:59 - 10:03
    讓我們通過法案
    要求他們發佈隱藏的數據,
  • 10:03 - 10:05
    因為這些數據必定有來源。
  • 10:05 - 10:07
    我不知道從哪兒,但肯定有來源,
  • 10:07 - 10:09
    可以發佈PDF之外的信息。
  • 10:09 - 10:11
    讓我們運用并分享一些公開數據的標準。
  • 10:11 - 10:14
    讓我們從紐約本市的地址開始,
  • 10:14 - 10:16
    把地址標準化。
  • 10:16 - 10:18
    因為紐約是公開數據的領導者。
  • 10:18 - 10:21
    儘管如此,我們絕對是公開數據的領導者,
  • 10:21 - 10:23
    如果我們開始做標準化的工作,
    建立公開數據的標準,
  • 10:23 - 10:24
    其他人都會追隨的。州里會、聯邦政府也可能,
  • 10:24 - 10:28
    我知道這或許聽上去有些瘋狂,
    但別的國家也未嘗不會追隨。
  • 10:28 - 10:30
    我們不久後也許能開發出
  • 10:30 - 10:33
    可以涵蓋100個國家地圖信息的程式。
  • 10:33 - 10:36
    這可不是科幻小說,
    而是指日可待的事實。
  • 10:36 - 10:38
    這能幫助誰?
  • 10:38 - 10:42
    可不單單是約翰▪克勞斯和克里斯▪旺。
  • 10:42 - 10:45
    紐約城現在正有幾百個聚會在進行,
  • 10:45 - 10:46
    都是活躍的聚會。
  • 10:46 - 10:48
    這些聚會讓幾千人參與其中。
  • 10:48 - 10:51
    他們下班後或在週末會面,
  • 10:51 - 10:53
    共同研究空開數據,
  • 10:53 - 10:55
    幫助我們的城市變得更好,
  • 10:55 - 10:59
    BetaNYC這樣的團體,上週剛剛發佈了
    citygram.nyc
  • 10:59 - 11:02
    讓你能夠訂閱311個
  • 11:02 - 11:04
    自己住家或辦公地周圍的投訴。
  • 11:04 - 11:06
    你輸入地址,就能看到附近的投訴。
  • 11:06 - 11:09
    而且,做這些事情的並不限於技術社團。
  • 11:09 - 11:12
    我在Pratt學院教的城市規劃學生
    也在做同樣的事。
  • 11:12 - 11:14
    還有政策提倡者、以至每個人,
  • 11:14 - 11:17
    是擁有不同領域背景的市民們。
  • 11:17 - 11:19
    隨著一個個小的改變,
  • 11:19 - 11:23
    我們能解開市民們激情和能力的封印,
  • 11:23 - 11:26
    好好利用空開數據,建設更好的城市,
  • 11:26 - 11:29
    就算每次只有一個數據庫,或只是一個停車位。
  • 11:29 - 11:32
    謝謝。
  • 11:32 - 11:35
    (掌聲)
Title:
如何找到紐約市最差的停車位?——用大數據說話
Speaker:
本▪威靈頓
Description:

市政機關擁有反映城市生活方方面面的龐大統計數據。但是,正如數據分析師本▪威靈頓在他有趣的演講中提到的,政府經常不知道如何使用這些數據。他展示了如何結合出乎意料的問題和機智的數據處理,從而產生奇特而有用的洞見,并分享了如何分享大規模數據庫供民眾使用的相關資訊。

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
11:48

Chinese, Traditional subtitles

Revisions