道路なら6千マイル 地下鉄なら600マイル 自転車専用道路なら400マイル トラムウェイなら0.5マイル ルーズベルト島に行ったらわかりますね これはニューヨーク市(NYC)のインフラを表す数字です インフラを統計的にまとめ 市の各部局が公表した報告書の数字です 例えば交通課では 保守管理した道路の距離を 報告するかもしれませんし 都市交通局は誇らしげに地下鉄の路線の距離を 示すでしょう 市の部局の大半が統計を使います 今年の報告書や タクシー・リムジン委員会(TLC)によると ここNYCには約13,500台のタクシーがいます とても面白いでしょう? でも これらの数字はどこから来たのでしょうか? こういう数字が存在するためには 市の職員の誰かがふと 「これは誰かが知りたがっている数字だ」と 気づかなければなりません これが市民が知りたがっている数字なのです そのため 加工していないデータを 数えたり 足したり 計算して 報告書を発行するので 報告書には このような数字があるのです 問題は 私たちが聞きたい質問をどのように知るのか? 様々な質問があるのです 実際ある意味では 市民には文字通り 市に関する質問が無数にあり 各部局は対応しきれません パラダイムは上手く機能しておらず 政治家もそれに気付いていると思います 2012年ブルームバーグ市長は アメリカで最も熱望され 包括的なオープンデータ法案を 成立させたからです 多くの意味で市長は正しいのです 過去2年間NYCは オープンデータポータルのデータセットを 1,000件公表しました 物凄いことですよね だから タクシーの数を数えなくても このようにデータを見られるので 違う質問もできるのです そこで 私は質問しました NYCのラッシュアワーはいつ? 厄介ですよね 正確なラッシュアワーの時間帯は? 私はタクシーがただの数字 ではないと考えたのです 市内の路上を走り回る GPSレコーダーであり 乗客を乗せる度に記録しています そこにデータがあるのです 私はそのデータを調べて 1日のNYCのタクシーの 平均スピードを策定しました ご覧のとおり 真夜中から朝の5時18分まで スピードは速くなり そこからスピードが落ちていきます だんだん遅くなり 朝の8時35分には 時速11.5マイルになります 路上を走る平均的なタクシーのスピードは 時速11.5マイルです 日中の時速は変わらないのです 日中の時速は変わらないのです (笑) 私はNYCにラッシュアワーが ないのだと思いました ただラッシュデイがあるのです なるほど これは2つの理由で重要です あなたが交通プランナーなら とても知りたいかもしれませんよね どこかに早く着きたければ 目覚まし時計を 朝の4時45分にセットすればいいのです NYのことですよ でも このデータには裏話があります こんなデータは 入手できなかったのです 実際 出所は情報公開法による請求でした 実際 出所は情報公開法による請求でした これはTLCのホームページにあるフォームです データにアクセスするため このフォームをダウンロードして 記入すると 情報が得られます クリス・ウォンという男性が それをしました クリスが行くと 新品のハードディスクを 事務所に持って来るよう 職員から言われました 「5時間後にデータをコピーしてお返しします」 そうやってこのデータを取得したのです さて クリスはデータを公表するタイプなので ネット上で誰でも利用できるようにしました そうやってこのグラフが作られました 存在自体が驚きですね GPSレコーダーの記録 すごいです ではデータを公表するために 役所にハードディスクを持って行き データを受取る市民がいるという事実はどうでしょう もともと公的データで 得られてしかるべきものでした 「公」のデータでしたが 非公開でした 市として もっと上手いやり方があります 市民がハードディスクを 持って歩かなくてもいいのです 情報公開で得られないデータセットもあります これは自転車事故に基づいて作成した NYCで最も危険な交差点の地図です 赤のエリアはより危険です 地図によると まずマンハッタンの東側 特にロワー・マンハッタン地域で 自転車事故が多発しています 多くのサイクリストが そこで橋を渡ってくるので 納得できますよね しかし他の危険地域も調査の価値ありです ウィリアムズバーグと クイーンズ州ルーズベルト・アベニューです これこそが ビジョン・ゼロに求めるデータで まさに 私たちが探し求めているものです しかし このデータを入手するにも 工夫が必要だったのです このロゴを知っている人は? 何人か手を上げていますね PDFをコピー・ペーストして 文書を作成しようと したことがありますか? 更に手が上がりました ロゴを知らなくてもコピー・ペーストしてみる いいですね つまり お見せしたのは PDFだったのです 実際 物凄い数のPDFを ニューヨーク市警は公開しました 実際 物凄い数のPDFを ニューヨーク市警は公開しました それにアクセスする方法は 物凄い時間をかけて コピー・ペーストするか ジョン・クラウスのようにするかです ジョン・クラウスは ニューヨーク市警クラッシュデータ・バンドエイド というプログラムを書き コピー・ペーストを不要にしました ニューヨーク市警のホームページから PDFをダウンロードします データを収集するプログラムを実行し PDFの保護を解除するプログラムを実行し 編集できるテキストに戻し ネット上に上げるのです だから誰でも地図も作れるのです ここにデータがあり それにアクセスできるのです ところで この表では 事故毎に一列になっています PDFの量はどのくらいだと思いますか アクセスできることは素晴らしいのですが PDF以外にして欲しいものです 市民がデータ読み取りプログラムを 書くはめになるからです 市民は時間の有効利用できませんし 市として もっと良くやれるのです さて 良いニュースは デブラシオの行政が数か月前に このデータを公表したことで 私たちはアクセスできるようになりました しかしまだ 多くのデータがPDFのままです 例えば 犯罪データはPDFしかありません また犯罪データだけでなく 市の予算もです 市の予算はPDFでしか読めません 私たちがデータ分析を出来ないだけでなく 予算に賛成票を投じる議員も PDFしか使えません そのため 議員は賛成する 予算の分析できないのです 市の行政として 私たちはそれよりも少しましだと思うのです さて PDFではないデータもたくさんあります 私の作った地図を例にとると これはNYCで一番汚い河川です どうやって汚さを測るのか? ちょっと変なんですけど 糞便性大腸菌のレベルを つまり 河川ごとの糞便物質の指標を調べました 円が大きいほど 水が汚れているのです 大きな円が汚水で 小さな円がきれいな水です ご覧のものは 陸地の河川です これは過去5年間に 市が採取した全データなのです 陸地の河川は一般的により汚いのです 納得ですか? より大きな円は汚いのです こんなことがわかります その1: 河口で泳がないこと その2: NYCに一番汚い河川があること が測定から判明しました コニー・アイランド・クリークです コニーアイランドの海水浴場ではなく 対岸です しかし 5年間に渡り コニー・アイランド・クリークで採取した試料の94%では 糞便性大腸菌のレベルがとても高く 河川で泳ぐことは州法に触れます 市の報告書で強調されるような 成果とは言えませんね nyc.govのトップ・ページに載ったりもしません そうやって見せようとしていなくても そういうデータに到達したことが凄いのです でも データがオープン・データ・ポータルに 掲載されていなかったので 超簡単とは言えませんでした オープン・データ・ポータルで探しても 部分的な数か月か1年分しか見つかりません 実際 環境保護課のホームページにありました リンクは全てエクセルで 全て違う形式でした 見出しも全て違うので コピー・ペーストして 編集します それでようやく 地図が作れます 素晴らしいことですが ここでもまた 市としてはもっと上手なやり方があり 標準化できるのです Socrata のオープンデータポータルNYC というホームページで 目的を果たせそうです ここにある1100個のデータセットは 今話したような問題がなく ここにある1100個のデータセットは 今話したような問題がなく その数が増えていくのは 素晴らしいことです CSV、PDF、エクセルなどに データをダウンロードできるのです どんなデータであれ ダウンロードできるのです 問題は ダウンロードする時 部署ごとに住所の切れ目がバラバラなことです 街路名、交差点の通り、通り、区 住所、建物、建物の住所などです だから このポータルを使ってもまだ 時間がかかるのです 住所のフィールドを標準化するのに 時間をかけるので 市民の時間の 有効活用になりません 私たちは市として上手にできるのです 私たちは住所を標準化できます そうすれば こんな地図がもっと増えます これはNYCの消火栓の地図ですが ただの消火栓ではないのです 駐車違反切符に関して トップ250の消火栓なのです (笑) この地図には学べることがあったので 私のお気に入りです その1 アッパー・イースト・サイドに駐車しないこと だめですよ どこに駐車しても 消火栓の違反切符をもらいますよ その2 NYCの中で上位2位の消火栓を特定しました ロワー・イースト・サイドにあり 駐車違反切符で年間55,000ドルを超える 収益を上げていました そのことに気付いた時 私はちょっと変な感じがしました ちょっと調べて分かったのですが 消火栓があって 脇に縁石に囲まれた路側帯があります 幅7フィートで歩ける場所です 駐車する場所はその隣です だから 駐車する車が現れても 消火栓がずっと 向こうにあるので 大丈夫と思うのです 実際 駐車スペースはきれいに塗ってあります そこに駐車すると ニューヨーク市警はこれは困ると 違反切符を貼るのです 駐車違反切符を見つけたのは 私だけではありません Googleストリート・ビューカーも 駐車違反切符を撮影していたのです 私が I Quant NYというブログに このことを書くと 交通課が 回答を寄せました 「この場所について 交通課は 苦情を言われたことはありませんが 道路標示を検討し 適切なものに変更します」 定型的な行政の反応だと 私は内心思いました 半ば諦めてもいたのです 数週間後 信じられないようなことが 起こりました 交通課はその場所を塗り直しました 一瞬 私はオープンデータの 未来を見たと思いました ここで起きたことを考えてみてください 5年間 この場所は 駐車違反切符でだらけでした 市民が何かを見つけ 市に話すと 数週間以内に 問題が解決したのです 素晴らしい 多くの人がオープンデータが番犬になると考えますが むしろパートナーと見るべきなのです 市民に行政のより良いパートナーになる 力を与えます そんなに難しいことではありません 必要なのは 少しの変化です 公開要請のデータがあり 何度となく公開を求められるなら データを公開しましょう それは公開すべきという合図なのです そして PDFを公開する部局のみなさん 基礎資料をデータと一緒に掲載する 規則にしてください そのデータは どこかから来ているからです どこかは分かりませんが どこかから来ているのです それをPDFと共に公開できるのです そしてオープンデータの基準を 採用し共有しましょう ここNYCの住所から始めましょう まず住所を標準化することから 始めるのです NYはオープンデータのリーダーだからです 問題があっても オープンデータの 絶対的なリーダーです 標準化に着手し オープンデータの基準を作るなら 自治体も州も おそらく連邦政府も倣うでしょう 他国も倣うかもしれません プログラムや100か国の地図情報を 書いた時から そんなに時間が経っていないのです SFではありません 実際つい最近のことです ところで これにより得するのは誰でしょう? ジョン・クラウスや クリス・ウォンだけではありません NYCでは現在 何百もの 活発な会合があります それらの会合に何千人が出席します 彼らは仕事の後や週末に集まります オープンデータを調べ 都市をより住みやすくするために 会合に参加するのです BetaNYCのような団体は先週 citygram.nycを公表し 自宅や職場に関する311への苦情の 定期購読を可能にしました 住所を入力し 地元の苦情を検索します これらの情報を求めているのは 技術者コミュニティーだけではありません 私がプラットで教えている学生の 都市プランナーも 政策支持者も 皆もです 様々な背景の市民もです 小さな変化の積み重ねで オープンデータを利用し より良い都市を作るため 市民の情熱や能力を解き放つのです 変化は1つのデータセットや1か所の駐車場からです ありがとう (拍手)