道路なら6千マイル
地下鉄なら600マイル
自転車専用道路なら400マイル
トラムウェイなら0.5マイル
ルーズベルト島に行ったらわかりますね
これはニューヨーク市(NYC)のインフラを表す数字です
インフラを統計的にまとめ
市の各部局が公表した報告書の数字です
例えば交通課では
保守管理した道路の距離を
報告するかもしれませんし
都市交通局は誇らしげに地下鉄の路線の距離を
示すでしょう
市の部局の大半が統計を使います
今年の報告書や
タクシー・リムジン委員会(TLC)によると
ここNYCには約13,500台のタクシーがいます
とても面白いでしょう?
でも これらの数字はどこから来たのでしょうか?
こういう数字が存在するためには
市の職員の誰かがふと
「これは誰かが知りたがっている数字だ」と
気づかなければなりません
これが市民が知りたがっている数字なのです
そのため 加工していないデータを
数えたり 足したり 計算して
報告書を発行するので
報告書には このような数字があるのです
問題は 私たちが聞きたい質問をどのように知るのか?
様々な質問があるのです
実際ある意味では 市民には文字通り
市に関する質問が無数にあり
各部局は対応しきれません
パラダイムは上手く機能しておらず
政治家もそれに気付いていると思います
2012年ブルームバーグ市長は
アメリカで最も熱望され
包括的なオープンデータ法案を
成立させたからです
多くの意味で市長は正しいのです
過去2年間NYCは
オープンデータポータルのデータセットを
1,000件公表しました
物凄いことですよね
だから タクシーの数を数えなくても
このようにデータを見られるので
違う質問もできるのです
そこで 私は質問しました
NYCのラッシュアワーはいつ?
厄介ですよね
正確なラッシュアワーの時間帯は?
私はタクシーがただの数字
ではないと考えたのです
市内の路上を走り回る
GPSレコーダーであり
乗客を乗せる度に記録しています
そこにデータがあるのです
私はそのデータを調べて
1日のNYCのタクシーの
平均スピードを策定しました
ご覧のとおり 真夜中から朝の5時18分まで
スピードは速くなり
そこからスピードが落ちていきます
だんだん遅くなり 朝の8時35分には
時速11.5マイルになります
路上を走る平均的なタクシーのスピードは
時速11.5マイルです
日中の時速は変わらないのです
日中の時速は変わらないのです
(笑)
私はNYCにラッシュアワーが
ないのだと思いました
ただラッシュデイがあるのです
なるほど
これは2つの理由で重要です
あなたが交通プランナーなら
とても知りたいかもしれませんよね
どこかに早く着きたければ
目覚まし時計を
朝の4時45分にセットすればいいのです
NYのことですよ
でも このデータには裏話があります
こんなデータは
入手できなかったのです
実際 出所は情報公開法による請求でした
実際 出所は情報公開法による請求でした
これはTLCのホームページにあるフォームです
データにアクセスするため
このフォームをダウンロードして
記入すると 情報が得られます
クリス・ウォンという男性が
それをしました
クリスが行くと
新品のハードディスクを
事務所に持って来るよう
職員から言われました
「5時間後にデータをコピーしてお返しします」
そうやってこのデータを取得したのです
さて クリスはデータを公表するタイプなので
ネット上で誰でも利用できるようにしました
そうやってこのグラフが作られました
存在自体が驚きですね
GPSレコーダーの記録 すごいです
ではデータを公表するために
役所にハードディスクを持って行き
データを受取る市民がいるという事実はどうでしょう
もともと公的データで
得られてしかるべきものでした
「公」のデータでしたが
非公開でした
市として もっと上手いやり方があります
市民がハードディスクを
持って歩かなくてもいいのです
情報公開で得られないデータセットもあります
これは自転車事故に基づいて作成した
NYCで最も危険な交差点の地図です
赤のエリアはより危険です
地図によると まずマンハッタンの東側
特にロワー・マンハッタン地域で
自転車事故が多発しています
多くのサイクリストが
そこで橋を渡ってくるので
納得できますよね
しかし他の危険地域も調査の価値ありです
ウィリアムズバーグと
クイーンズ州ルーズベルト・アベニューです
これこそが ビジョン・ゼロに求めるデータで
まさに 私たちが探し求めているものです
しかし このデータを入手するにも
工夫が必要だったのです
このロゴを知っている人は?
何人か手を上げていますね
PDFをコピー・ペーストして
文書を作成しようと
したことがありますか?
更に手が上がりました
ロゴを知らなくてもコピー・ペーストしてみる
いいですね
つまり お見せしたのは PDFだったのです
実際 物凄い数のPDFを
ニューヨーク市警は公開しました
実際 物凄い数のPDFを
ニューヨーク市警は公開しました
それにアクセスする方法は
物凄い時間をかけて
コピー・ペーストするか
ジョン・クラウスのようにするかです
ジョン・クラウスは
ニューヨーク市警クラッシュデータ・バンドエイド
というプログラムを書き
コピー・ペーストを不要にしました
ニューヨーク市警のホームページから
PDFをダウンロードします
データを収集するプログラムを実行し
PDFの保護を解除するプログラムを実行し
編集できるテキストに戻し
ネット上に上げるのです
だから誰でも地図も作れるのです
ここにデータがあり
それにアクセスできるのです
ところで この表では
事故毎に一列になっています
PDFの量はどのくらいだと思いますか
アクセスできることは素晴らしいのですが
PDF以外にして欲しいものです
市民がデータ読み取りプログラムを
書くはめになるからです
市民は時間の有効利用できませんし
市として もっと良くやれるのです
さて 良いニュースは
デブラシオの行政が数か月前に
このデータを公表したことで
私たちはアクセスできるようになりました
しかしまだ 多くのデータがPDFのままです
例えば 犯罪データはPDFしかありません
また犯罪データだけでなく
市の予算もです
市の予算はPDFでしか読めません
私たちがデータ分析を出来ないだけでなく
予算に賛成票を投じる議員も
PDFしか使えません
そのため 議員は賛成する
予算の分析できないのです
市の行政として
私たちはそれよりも少しましだと思うのです
さて PDFではないデータもたくさんあります
私の作った地図を例にとると
これはNYCで一番汚い河川です
どうやって汚さを測るのか?
ちょっと変なんですけど
糞便性大腸菌のレベルを
つまり 河川ごとの糞便物質の指標を調べました
円が大きいほど
水が汚れているのです
大きな円が汚水で
小さな円がきれいな水です
ご覧のものは 陸地の河川です
これは過去5年間に
市が採取した全データなのです
陸地の河川は一般的により汚いのです
納得ですか?
より大きな円は汚いのです
こんなことがわかります
その1: 河口で泳がないこと
その2: NYCに一番汚い河川があること
が測定から判明しました
コニー・アイランド・クリークです
コニーアイランドの海水浴場ではなく
対岸です
しかし 5年間に渡り
コニー・アイランド・クリークで採取した試料の94%では
糞便性大腸菌のレベルがとても高く
河川で泳ぐことは州法に触れます
市の報告書で強調されるような
成果とは言えませんね
nyc.govのトップ・ページに載ったりもしません
そうやって見せようとしていなくても
そういうデータに到達したことが凄いのです
でも データがオープン・データ・ポータルに
掲載されていなかったので
超簡単とは言えませんでした
オープン・データ・ポータルで探しても
部分的な数か月か1年分しか見つかりません
実際 環境保護課のホームページにありました
リンクは全てエクセルで
全て違う形式でした
見出しも全て違うので
コピー・ペーストして 編集します
それでようやく 地図が作れます
素晴らしいことですが ここでもまた
市としてはもっと上手なやり方があり
標準化できるのです
Socrata のオープンデータポータルNYC
というホームページで
目的を果たせそうです
ここにある1100個のデータセットは
今話したような問題がなく
ここにある1100個のデータセットは
今話したような問題がなく
その数が増えていくのは
素晴らしいことです
CSV、PDF、エクセルなどに
データをダウンロードできるのです
どんなデータであれ
ダウンロードできるのです
問題は ダウンロードする時
部署ごとに住所の切れ目がバラバラなことです
街路名、交差点の通り、通り、区
住所、建物、建物の住所などです
だから このポータルを使ってもまだ
時間がかかるのです
住所のフィールドを標準化するのに
時間をかけるので
市民の時間の
有効活用になりません
私たちは市として上手にできるのです
私たちは住所を標準化できます
そうすれば
こんな地図がもっと増えます
これはNYCの消火栓の地図ですが
ただの消火栓ではないのです
駐車違反切符に関して
トップ250の消火栓なのです
(笑)
この地図には学べることがあったので
私のお気に入りです
その1
アッパー・イースト・サイドに駐車しないこと
だめですよ どこに駐車しても
消火栓の違反切符をもらいますよ
その2
NYCの中で上位2位の消火栓を特定しました
ロワー・イースト・サイドにあり
駐車違反切符で年間55,000ドルを超える
収益を上げていました
そのことに気付いた時
私はちょっと変な感じがしました
ちょっと調べて分かったのですが
消火栓があって
脇に縁石に囲まれた路側帯があります
幅7フィートで歩ける場所です
駐車する場所はその隣です
だから 駐車する車が現れても
消火栓がずっと
向こうにあるので 大丈夫と思うのです
実際 駐車スペースはきれいに塗ってあります
そこに駐車すると
ニューヨーク市警はこれは困ると
違反切符を貼るのです
駐車違反切符を見つけたのは
私だけではありません
Googleストリート・ビューカーも
駐車違反切符を撮影していたのです
私が I Quant NYというブログに
このことを書くと 交通課が
回答を寄せました
「この場所について 交通課は
苦情を言われたことはありませんが
道路標示を検討し
適切なものに変更します」
定型的な行政の反応だと
私は内心思いました
半ば諦めてもいたのです
数週間後 信じられないようなことが
起こりました
交通課はその場所を塗り直しました
一瞬 私はオープンデータの
未来を見たと思いました
ここで起きたことを考えてみてください
5年間 この場所は
駐車違反切符でだらけでした
市民が何かを見つけ 市に話すと
数週間以内に
問題が解決したのです
素晴らしい
多くの人がオープンデータが番犬になると考えますが
むしろパートナーと見るべきなのです
市民に行政のより良いパートナーになる
力を与えます
そんなに難しいことではありません
必要なのは 少しの変化です
公開要請のデータがあり
何度となく公開を求められるなら
データを公開しましょう
それは公開すべきという合図なのです
そして PDFを公開する部局のみなさん
基礎資料をデータと一緒に掲載する
規則にしてください
そのデータは どこかから来ているからです
どこかは分かりませんが
どこかから来ているのです
それをPDFと共に公開できるのです
そしてオープンデータの基準を
採用し共有しましょう
ここNYCの住所から始めましょう
まず住所を標準化することから
始めるのです
NYはオープンデータのリーダーだからです
問題があっても オープンデータの
絶対的なリーダーです
標準化に着手し
オープンデータの基準を作るなら
自治体も州も おそらく連邦政府も倣うでしょう
他国も倣うかもしれません
プログラムや100か国の地図情報を
書いた時から
そんなに時間が経っていないのです
SFではありません
実際つい最近のことです
ところで これにより得するのは誰でしょう?
ジョン・クラウスや
クリス・ウォンだけではありません
NYCでは現在 何百もの
活発な会合があります
それらの会合に何千人が出席します
彼らは仕事の後や週末に集まります
オープンデータを調べ
都市をより住みやすくするために
会合に参加するのです
BetaNYCのような団体は先週
citygram.nycを公表し
自宅や職場に関する311への苦情の
定期購読を可能にしました
住所を入力し
地元の苦情を検索します
これらの情報を求めているのは
技術者コミュニティーだけではありません
私がプラットで教えている学生の
都市プランナーも
政策支持者も 皆もです
様々な背景の市民もです
小さな変化の積み重ねで
オープンデータを利用し
より良い都市を作るため
市民の情熱や能力を解き放つのです
変化は1つのデータセットや1か所の駐車場からです
ありがとう
(拍手)