如何找到紐約市最差的停車位?——用大數據說話
-
0:01 - 0:04六千英里公路,
-
0:04 - 0:06六百英里地鐵路線,
-
0:06 - 0:07四百英里腳踏車專用道,
-
0:07 - 0:09半英里的有軌電車專用道
-
0:09 - 0:11僅在羅斯福島。
-
0:11 - 0:14這些數字構成了紐約市的基建。
-
0:14 - 0:16這些基建的統計數字,
-
0:16 - 0:19都可以在市政機關公佈的報告中找到。
-
0:19 - 0:22譬如,交通部門可能會告訴你,
-
0:22 - 0:24他們維護這多少英里的道路。
-
0:24 - 0:26MTA(紐約交通運輸管理局)會自誇
他們掌管著多少英里捷運。 -
0:26 - 0:29多數的市政機關都在公佈統計數據。
-
0:29 - 0:33這是今年計程車與轎車委員會發佈的報告,
-
0:33 - 0:37我們從中知道紐約市運營著
大約一萬三千五百輛計程車。 -
0:37 - 0:38很有趣,是嗎?
-
0:38 - 0:41但你有否想過這些數據來自哪裡?
-
0:41 - 0:44既然有這些數字存在,
那肯定是因為在市政機關的某個人 -
0:44 - 0:47想過:嗯......這個數字可能有人會想知道。
-
0:47 - 0:49這個數字是市民們想知道的。
-
0:49 - 0:51所以他們找回那些原始數據,
-
0:51 - 0:53他們計數、相加、計算,
-
0:53 - 0:55然後把得出的結果寫進報告中,
-
0:55 - 0:57所以那些報告中會有這樣的數字。
-
0:57 - 1:00那麼問題來了:他們怎麼會知道
我們的問題都是什麼? -
1:00 - 1:01我們有很多問題。
-
1:01 - 1:04事實上,可以說我們有無窮無盡的問題
-
1:04 - 1:06有關我們這座城市。
-
1:06 - 1:08市政機關可無法跟得上(我們的節奏)。
-
1:08 - 1:12現有模式並不具有實效,我覺得
我們的政策制定者也知道這點, -
1:12 - 1:16因為在2012年,彭博市長
簽署了一個法令,他稱之為 -
1:16 - 1:20全美最具雄心和綜合性的
開放數據立法。 -
1:20 - 1:21從各種意義上來說,他是對的。
-
1:21 - 1:24在過去兩年中,市政有1000個數據庫
-
1:24 - 1:26放在我們的開放數據門戶網站上,
-
1:26 - 1:28還是蠻驚人的。
-
1:28 - 1:29我們來檢視這些數據,
-
1:29 - 1:32除了數數計程車的數量,
-
1:32 - 1:34我們也能開始問不一樣的問題了。
-
1:34 - 1:35我有一個問題:
-
1:35 - 1:36紐約市的交通高峰在什麼時候?
-
1:36 - 1:39這簡直煩人。高峰到底是什麼時候?
-
1:39 - 1:42我想到,這些計程車可不僅僅是個數字,
-
1:42 - 1:44它們可以是開遍全市道路的GPS記錄儀,
-
1:44 - 1:46記錄著乘客的每一差車程。
-
1:46 - 1:49數據是現成的。我檢視它們,
-
1:49 - 1:53並制出一張圖表,標出
一天中紐約市計程車的平均時速。 -
1:53 - 1:56大家可以看到,
從半夜到凌晨五點十八分, -
1:56 - 2:00時速一直在增加,然後到了拐點,
-
2:00 - 2:04時速逐漸下降,在早間的八點三十五分,
-
2:04 - 2:06時速降到十一英里半。
-
2:06 - 2:10運營中計程車的平均時速
保持在十一英里半, -
2:10 - 2:12結果沒有變化,
-
2:12 - 2:15整天都是如此。
-
2:15 - 2:16(笑聲)
-
2:16 - 2:19我告訴自己,紐約市並不存在高峰時段,
-
2:19 - 2:22而是全天都高峰。
-
2:22 - 2:24這是個有意義的結論,原因有幾點。
-
2:24 - 2:28如果你是做交通規劃的,
知道這個結論會有意義。 -
2:28 - 2:30如果你要快速到達某地,
-
2:30 - 2:33只要把鬧鐘定在凌晨四點四十五分就行了。
-
2:33 - 2:34紐約嘛!
-
2:34 - 2:35但這個數據背後還有故事。
-
2:35 - 2:37這個數據並不真的是現成的。
-
2:37 - 2:41你需要做一個「信息自由法案申請」,
-
2:41 - 2:43也叫「FOIL申請」。
-
2:43 - 2:46你可以在計程車和轎車委員會的網站上
找到相關申請表。 -
2:46 - 2:48如果要獲得這些數據,
你要弄到這張申請表, -
2:48 - 2:50填好上交,受理人員屆時會通知你。
-
2:50 - 2:53一個叫克里斯▪旺的人就這樣做了。
-
2:53 - 2:55克里斯來到委員會,工作人員告訴他
-
2:55 - 2:57「帶個全新的硬盤來辦公室,
-
2:57 - 3:01我們會把相關數據拷貝給你,
過五小時來拿。」 -
3:01 - 3:03這就是拿到數據的經過。
-
3:03 - 3:05克里斯想公開這些數據,
-
3:05 - 3:10於是放到網路上供所有人使用,
所以我才能做出這張圖。 -
3:10 - 3:14這一切——這些GPS記錄儀真是酷。
-
3:14 - 3:16但是,市民要攜帶自己的移動硬盤
-
3:16 - 3:19踏遍市政機關,
然後通過自己的努力公開,這件事—— -
3:19 - 3:22政府數據可以說是公開的,
普通市民能得到它, -
3:22 - 3:23但這只是名義上的「公開」,
並不是真正的公開。 -
3:23 - 3:25我們的城市可以做得更好。
-
3:25 - 3:28我們不需要費力帶著移動硬盤到處跑。
-
3:28 - 3:31並不是每一個數據庫都需要FOIL申請。
-
3:31 - 3:34我做的這張地圖標出了紐約市最危險的路口,
-
3:34 - 3:37來源是腳踏車騎行者的交通事故數據。
-
3:37 - 3:38紅色區域更危險,
-
3:38 - 3:41圖上顯示,首先,曼哈頓的東側,
-
3:41 - 3:45特別是曼哈頓的下城區域,
腳踏車事故更多。 -
3:45 - 3:46這可能是因為,
-
3:46 - 3:48在這裡有更多的騎行者從大橋下來。
-
3:48 - 3:50圖上還有其他的熱點區域值得研究。
-
3:50 - 3:53威廉姆斯堡、皇后區的羅斯福大道,
-
3:53 - 3:55這些咨詢才是Vision Zero項目所需要的。
-
3:55 - 3:58這正是我們要找的東西。
-
3:58 - 4:00這個數據背後也有個故事。
-
4:00 - 4:02這個數據並不是現成的。
-
4:02 - 4:04有多少人知道這個符號?
-
4:04 - 4:06我看到有人點頭了。
-
4:06 - 4:08你們有沒有試過從PDF文檔中
拷貝和黏貼數據, -
4:08 - 4:10並據此作出結論呢?
-
4:10 - 4:11我看到更多人點頭了。
-
4:11 - 4:14試圖拷貝粘貼的人
比認識這個標誌的人更多,真有趣。 -
4:14 - 4:18你們剛剛看到的數據是做在PDF裡的。
-
4:18 - 4:21事實上,是成千上萬頁的PDF文檔,
-
4:21 - 4:23由我們的紐約警署發佈。
-
4:23 - 4:25如果你想享用這些數據,
你要不就持續 -
4:25 - 4:27做複製黏貼的動作,花掉成千上萬小時,
-
4:27 - 4:29要不就像約翰▪克勞斯一樣。
-
4:29 - 4:30約翰▪克勞斯
-
4:30 - 4:33可不想重複地去複製黏貼,
他寫了一個程式。 -
4:33 - 4:36這個程序叫做
「紐約警署交通事故數據OK蹦」, -
4:36 - 4:39它能到紐約警署的網站下載PDF文檔,
-
4:39 - 4:42每天它都去搜索;
如果找到一個PDF文檔,就下載下來, -
4:42 - 4:44然後運行某個PDF解碼的程式,
-
4:44 - 4:46把其中的文字信息提取出來,
-
4:46 - 4:49其中的訊息會發佈在網路上,
人們就可以製作這些地圖。 -
4:49 - 4:53這些數據就在那兒,我們都能得到——
-
4:53 - 4:55每一個交通事故就是一行數據。
-
4:55 - 4:57你們可以想像有多少PDF需要轉碼。
-
4:57 - 4:59——我們能看到這些數據固然好,
-
4:59 - 5:01但能不能不要弄成PDF格式的,
-
5:01 - 5:04不然市民們就得去寫PDF解碼的程式,
-
5:04 - 5:06這對市民的時間來說是一種浪費,
-
5:06 - 5:08而我們的城市能做的更好。
-
5:08 - 5:11有個好消息,白思豪市長的班底
-
5:11 - 5:13在幾個月前公開了這份數據,
-
5:13 - 5:15所以我們能直接享用這些數據,
-
5:15 - 5:18然而還有很多數據是PDF格式的。
-
5:18 - 5:21譬如,我們的罪案數據目前只有PDF格式的。
-
5:21 - 5:25除了罪案數據,市政預算也是如此。
-
5:25 - 5:29目前我們的市政預算只有PDF格式的。
-
5:29 - 5:31不僅是我們無法分析這些數字,
-
5:31 - 5:34那些為市政預算投票的立法委員們
-
5:34 - 5:36也只能拿到PDF版本的數字。
-
5:36 - 5:40所以我們的立法委員是無法分析
他們要為之投票的市政預算的。 -
5:40 - 5:43我認為我們的城市還能做得更好。
-
5:43 - 5:46很多數據已經不躲在PDF中了。
-
5:46 - 5:47這裡有一幅地圖可以作為例證,
-
5:47 - 5:50標示了紐約市最骯髒的水路。
-
5:50 - 5:52我是如何衡量「骯髒」的呢?
-
5:52 - 5:54這裡有些奇怪,
-
5:54 - 5:56我衡量的是糞便大腸菌群的水平,
-
5:56 - 5:59這是水路中糞便物質的一種衡量指標。
-
5:59 - 6:03圓圈越大,水就越髒,
-
6:03 - 6:06所以圖上的大圓圈代表髒水,
小圓圈代表乾淨的水。 -
6:06 - 6:08大家看到的是內河水道。
-
6:08 - 6:11這裡有紐約市過去五年採樣的所有數據。
-
6:11 - 6:14內河水道總的來說變髒了。
-
6:14 - 6:15這個結論挺合理的,對嗎?
-
6:15 - 6:18大圓圈代表髒水。
我從中學到了幾件事情。 -
6:18 - 6:21第一:千萬別在任何叫做「xx溪」
或「xx運河」的地方游泳。 -
6:21 - 6:26但是第二:紐約市最髒的水路,
-
6:26 - 6:28只看(糞便大腸菌群)這個唯一的指標,
-
6:28 - 6:31在康尼島溪,幸好不是你們游泳的康尼島。
-
6:31 - 6:32那在島的另一面。
-
6:32 - 6:36但在康尼島溪中,
過去五年的採樣中有94% -
6:36 - 6:38含有超標的糞便含量,
-
6:38 - 6:41以至於達到州法律禁止游泳的水平。
-
6:41 - 6:44這種類型的事實
-
6:44 - 6:46你可不會在市政報告中看到,不是嗎?
-
6:46 - 6:48這也不會登上紐約市政府網站的頭條。
-
6:48 - 6:49我們肯定不會看到的,
-
6:49 - 6:52但能看到這些數據真實不錯。
-
6:52 - 6:54同樣,拿到這些數據並不容易,
-
6:54 - 6:56因為它們並不在公開數據門戶網站上。
-
6:56 - 6:58如果你看公開數據的門戶網站,
-
6:58 - 7:01你只能看到其中一些片段,
只有一年內或幾個月的數據。 -
7:01 - 7:04這些數據其實是在環境保護部門的網站上。
-
7:04 - 7:08每一個鏈接都是一個Excel文件,
而每個Excel文件都是不一樣的。 -
7:08 - 7:11每一個表頭都不同:
需要複製、黏貼、還有重新整理。 -
7:11 - 7:13一旦完成你就能做出這些地圖,
但我要再次重申, -
7:13 - 7:16我們的城市能做的更好,
我們可以標準化。 -
7:16 - 7:19我們正在改善這裡有個
索克拉塔公司建立的網站 -
7:19 - 7:20叫做「紐約市公開數據門戶」。
-
7:20 - 7:21這裡,1100個數據庫
-
7:21 - 7:24都不存在標準化的問題,
-
7:24 - 7:26而且(這些無縫連接的數據庫)數字還在增加。
-
7:26 - 7:29你可以下載任一格式的數據:
CSV、PDF或Excel文件都可以。 -
7:29 - 7:33按你自己的需求來下載。
-
7:33 - 7:34但問題又來了,
-
7:34 - 7:40你會發現不同的機構
用不同的代碼來表示地址。 -
7:40 - 7:41有街道名、有路口名、
-
7:41 - 7:43行政區、地址、建築物、建築物地址等等。
-
7:43 - 7:47所以,即使有這個門戶網站的幫助,
-
7:47 - 7:49你還得花時間來標準化地址這塊的數據。
-
7:49 - 7:52這也不是有效利用市民時間的方法。
-
7:52 - 7:53我們的城市能做得更好。
-
7:53 - 7:55我們可以對地址進行標準化,
-
7:55 - 7:57如果做到了,
我們就能做出更多這樣的地圖。 -
7:57 - 8:00這是紐約市消防龍頭的地圖,
-
8:00 - 8:01但不僅於此。
-
8:01 - 8:06這些是前250個吃到最多違章停車罰單的
消防栓位置圖。 -
8:06 - 8:08(笑聲)
-
8:08 - 8:11我從圖中學到了幾件事,
我也真的喜歡這張圖。 -
8:11 - 8:14第一:別在上東區停車。
-
8:14 - 8:17千萬別停。因為不管停哪裡都會吃罰單。
-
8:17 - 8:21第二:我找出了全紐約市最最容易
吃到違章停車罰單的兩個消防栓的位置, -
8:21 - 8:23兩個都在下東區,
-
8:23 - 8:28每年能在罰單上創收五萬五千多美金。
-
8:28 - 8:31我注意到這點,覺得有些奇怪,
-
8:31 - 8:34於是深入挖掘了一下原因,
結果發現消防栓 -
8:34 - 8:36都有一個叫做控制擴展的區域,
-
8:36 - 8:38是約有七英呎的一塊地方,可以走路,
-
8:38 - 8:39然後是一個停車位。
-
8:39 - 8:42所以車開過來,司機發現消防栓,
-
8:42 - 8:44想“還有一段距離,這裡沒問題的”,
-
8:44 - 8:47何況地上還有一個畫得美美的停車位,
-
8:47 - 8:49司機停好車,但紐約警署不同意這種配置,
-
8:49 - 8:50開出了罰單。
-
8:50 - 8:53可不只是我本人吃了罰單,
-
8:53 - 8:55這是谷歌街景拍到的一輛過路車,
-
8:55 - 8:57也吃了同樣的一張罰單。
-
8:57 - 9:01於是我把這件事發到自己的部落格上
以及“I Quant NY”上, -
9:01 - 9:03結果交通部門回復如下:
-
9:03 - 9:06“交通部並未就此地點收到相關投訴,
-
9:06 - 9:11我們會重新檢視道路標誌,
並做出適當的改善措施。” -
9:11 - 9:14我暗自想:多麼官腔!
-
9:14 - 9:16好吧,我該幹嘛幹嘛去了。
-
9:16 - 9:20然而,幾週時間過去,
發生了意料之外的事情。 -
9:20 - 9:22停車位重新畫了,
-
9:22 - 9:25那一瞬間我覺得能看到公開數據的未來。
-
9:25 - 9:27大家想想這件事,
-
9:27 - 9:32過去五年,這個讓人困惑的停車位
一直讓人吃罰單, -
9:32 - 9:36但某一天,一位市民發現了問題
報告市政機關,又過了幾週時間, -
9:36 - 9:38問題車位被修正了。
-
9:38 - 9:41太不可思議了。很多人認為
公開數據讓市民變成政府的監視者, -
9:41 - 9:43並非如此,它實則讓人們成為了合作夥伴。
-
9:43 - 9:46市民能夠有底氣成為政府更好的合作夥伴,
-
9:46 - 9:48這並不難。
-
9:48 - 9:49我們只需要作出一些改變。
-
9:49 - 9:50如果我們在申請FOIL信息自由法案數據,
-
9:50 - 9:53如果你看到自己申請的數據已經被反覆申請,
-
9:53 - 9:57讓我們直接向公眾公開,
因為反覆申請就是需要公開的一种信號。 -
9:57 - 9:59如果某個政府機關正在發佈PDF數據,
-
9:59 - 10:03讓我們通過法案
要求他們發佈隱藏的數據, -
10:03 - 10:05因為這些數據必定有來源。
-
10:05 - 10:07我不知道從哪兒,但肯定有來源,
-
10:07 - 10:09可以發佈PDF之外的信息。
-
10:09 - 10:11讓我們運用并分享一些公開數據的標準。
-
10:11 - 10:14讓我們從紐約本市的地址開始,
-
10:14 - 10:16把地址標準化。
-
10:16 - 10:18因為紐約是公開數據的領導者。
-
10:18 - 10:21儘管如此,我們絕對是公開數據的領導者,
-
10:21 - 10:23如果我們開始做標準化的工作,
建立公開數據的標準, -
10:23 - 10:24其他人都會追隨的。州里會、聯邦政府也可能,
-
10:24 - 10:28我知道這或許聽上去有些瘋狂,
但別的國家也未嘗不會追隨。 -
10:28 - 10:30我們不久後也許能開發出
-
10:30 - 10:33可以涵蓋100個國家地圖信息的程式。
-
10:33 - 10:36這可不是科幻小說,
而是指日可待的事實。 -
10:36 - 10:38這能幫助誰?
-
10:38 - 10:42可不單單是約翰▪克勞斯和克里斯▪旺。
-
10:42 - 10:45紐約城現在正有幾百個聚會在進行,
-
10:45 - 10:46都是活躍的聚會。
-
10:46 - 10:48這些聚會讓幾千人參與其中。
-
10:48 - 10:51他們下班後或在週末會面,
-
10:51 - 10:53共同研究空開數據,
-
10:53 - 10:55幫助我們的城市變得更好,
-
10:55 - 10:59BetaNYC這樣的團體,上週剛剛發佈了
citygram.nyc -
10:59 - 11:02讓你能夠訂閱311個
-
11:02 - 11:04自己住家或辦公地周圍的投訴。
-
11:04 - 11:06你輸入地址,就能看到附近的投訴。
-
11:06 - 11:09而且,做這些事情的並不限於技術社團。
-
11:09 - 11:12我在Pratt學院教的城市規劃學生
也在做同樣的事。 -
11:12 - 11:14還有政策提倡者、以至每個人,
-
11:14 - 11:17是擁有不同領域背景的市民們。
-
11:17 - 11:19隨著一個個小的改變,
-
11:19 - 11:23我們能解開市民們激情和能力的封印,
-
11:23 - 11:26好好利用空開數據,建設更好的城市,
-
11:26 - 11:29就算每次只有一個數據庫,或只是一個停車位。
-
11:29 - 11:32謝謝。
-
11:32 - 11:35(掌聲)
- Title:
- 如何找到紐約市最差的停車位?——用大數據說話
- Speaker:
- 本▪威靈頓
- Description:
-
市政機關擁有反映城市生活方方面面的龐大統計數據。但是,正如數據分析師本▪威靈頓在他有趣的演講中提到的,政府經常不知道如何使用這些數據。他展示了如何結合出乎意料的問題和機智的數據處理,從而產生奇特而有用的洞見,并分享了如何分享大規模數據庫供民眾使用的相關資訊。
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 11:48