0:00:00.711,0:00:03.531 道路なら6千マイル 0:00:03.531,0:00:05.734 地下鉄なら600マイル 0:00:05.734,0:00:07.378 自転車専用道路なら400マイル 0:00:07.378,0:00:09.199 トラムウェイなら0.5マイル 0:00:09.199,0:00:11.152 ルーズベルト島に行ったらわかりますね 0:00:11.152,0:00:14.486 これはニューヨーク市(NYC)のインフラを表す数字です 0:00:14.486,0:00:17.105 インフラを統計的にまとめ 0:00:17.105,0:00:20.811 市の各部局が公表した報告書の数字です 0:00:20.811,0:00:24.010 例えば交通課では[br]保守管理した道路の距離を 0:00:24.010,0:00:25.791 報告するかもしれませんし 0:00:25.791,0:00:28.612 都市交通局は誇らしげに地下鉄の路線の距離を[br]示すでしょう 0:00:28.612,0:00:30.419 市の部局の大半が統計を使います 0:00:30.419,0:00:31.902 今年の報告書や 0:00:31.902,0:00:33.794 タクシー・リムジン委員会(TLC)によると 0:00:33.794,0:00:37.070 ここNYCには約13,500台のタクシーがいます 0:00:37.070,0:00:38.360 とても面白いでしょう? 0:00:38.360,0:00:41.144 でも これらの数字はどこから来たのでしょうか? 0:00:41.144,0:00:44.047 こういう数字が存在するためには[br]市の職員の誰かがふと 0:00:44.047,0:00:47.927 「これは誰かが知りたがっている数字だ」と[br]気づかなければなりません 0:00:47.927,0:00:50.177 これが市民が知りたがっている数字なのです 0:00:50.177,0:00:52.007 そのため 加工していないデータを 0:00:52.007,0:00:53.804 数えたり 足したり 計算して 0:00:53.804,0:00:55.271 報告書を発行するので 0:00:55.271,0:00:57.448 報告書には このような数字があるのです 0:00:57.448,0:00:59.988 問題は 私たちが聞きたい質問をどのように知るのか? 0:00:59.988,0:01:01.231 様々な質問があるのです 0:01:01.231,0:01:04.571 実際ある意味では 市民には文字通り 0:01:04.571,0:01:06.220 市に関する質問が無数にあり 0:01:06.220,0:01:07.695 各部局は対応しきれません 0:01:07.695,0:01:11.751 パラダイムは上手く機能しておらず[br]政治家もそれに気付いていると思います 0:01:11.751,0:01:15.710 2012年ブルームバーグ市長は[br]アメリカで最も熱望され 0:01:15.710,0:01:19.547 包括的なオープンデータ法案を[br]成立させたからです 0:01:19.547,0:01:21.120 多くの意味で市長は正しいのです 0:01:21.120,0:01:23.981 過去2年間NYCは[br]オープンデータポータルのデータセットを 0:01:23.981,0:01:25.591 1,000件公表しました 0:01:25.591,0:01:27.355 物凄いことですよね 0:01:27.355,0:01:29.323 だから タクシーの数を数えなくても 0:01:29.323,0:01:31.612 このようにデータを見られるので 0:01:31.612,0:01:33.555 違う質問もできるのです 0:01:33.555,0:01:34.755 そこで 私は質問しました 0:01:34.755,0:01:36.456 NYCのラッシュアワーはいつ? 0:01:36.456,0:01:39.037 厄介ですよね[br]正確なラッシュアワーの時間帯は? 0:01:39.037,0:01:41.662 私はタクシーがただの数字[br]ではないと考えたのです 0:01:41.662,0:01:44.373 市内の路上を走り回る[br]GPSレコーダーであり 0:01:44.373,0:01:46.286 乗客を乗せる度に記録しています 0:01:46.286,0:01:48.608 そこにデータがあるのです[br]私はそのデータを調べて 0:01:48.608,0:01:52.569 1日のNYCのタクシーの[br]平均スピードを策定しました 0:01:52.569,0:01:55.981 ご覧のとおり 真夜中から朝の5時18分まで 0:01:55.981,0:01:59.544 スピードは速くなり[br]そこからスピードが落ちていきます 0:01:59.544,0:02:03.506 だんだん遅くなり 朝の8時35分には 0:02:03.506,0:02:06.199 時速11.5マイルになります 0:02:06.199,0:02:09.761 路上を走る平均的なタクシーのスピードは[br]時速11.5マイルです 0:02:09.761,0:02:11.748 日中の時速は変わらないのです 0:02:11.748,0:02:15.116 日中の時速は変わらないのです 0:02:15.116,0:02:16.489 (笑) 0:02:16.489,0:02:19.669 私はNYCにラッシュアワーが[br]ないのだと思いました 0:02:19.669,0:02:21.206 ただラッシュデイがあるのです 0:02:21.206,0:02:24.056 なるほど[br]これは2つの理由で重要です 0:02:24.056,0:02:27.693 あなたが交通プランナーなら[br]とても知りたいかもしれませんよね 0:02:27.693,0:02:29.668 どこかに早く着きたければ 0:02:29.668,0:02:33.136 目覚まし時計を[br]朝の4時45分にセットすればいいのです 0:02:33.136,0:02:34.180 NYのことですよ 0:02:34.180,0:02:35.942 でも このデータには裏話があります 0:02:35.942,0:02:38.127 こんなデータは[br]入手できなかったのです 0:02:38.127,0:02:41.746 実際 出所は情報公開法による請求でした 0:02:41.746,0:02:42.822 実際 出所は情報公開法による請求でした 0:02:42.822,0:02:46.288 これはTLCのホームページにあるフォームです 0:02:46.288,0:02:49.114 データにアクセスするため[br]このフォームをダウンロードして 0:02:49.114,0:02:50.960 記入すると 情報が得られます 0:02:50.960,0:02:53.090 クリス・ウォンという男性が[br]それをしました 0:02:53.090,0:02:54.980 クリスが行くと[br]新品のハードディスクを 0:02:54.980,0:02:57.807 事務所に持って来るよう[br]職員から言われました 0:02:57.807,0:03:01.231 「5時間後にデータをコピーしてお返しします」 0:03:01.231,0:03:03.263 そうやってこのデータを取得したのです 0:03:03.263,0:03:06.268 さて クリスはデータを公表するタイプなので 0:03:06.268,0:03:10.052 ネット上で誰でも利用できるようにしました[br]そうやってこのグラフが作られました 0:03:10.052,0:03:13.570 存在自体が驚きですね[br]GPSレコーダーの記録 すごいです 0:03:13.570,0:03:16.688 ではデータを公表するために[br]役所にハードディスクを持って行き 0:03:16.688,0:03:19.270 データを受取る市民がいるという事実はどうでしょう 0:03:19.270,0:03:21.660 もともと公的データで[br]得られてしかるべきものでした 0:03:21.660,0:03:23.472 「公」のデータでしたが[br]非公開でした 0:03:23.472,0:03:25.434 市として もっと上手いやり方があります 0:03:25.434,0:03:28.190 市民がハードディスクを[br]持って歩かなくてもいいのです 0:03:28.190,0:03:30.527 情報公開で得られないデータセットもあります 0:03:30.527,0:03:34.329 これは自転車事故に基づいて作成した 0:03:34.329,0:03:36.207 NYCで最も危険な交差点の地図です 0:03:36.207,0:03:38.146 赤のエリアはより危険です 0:03:38.146,0:03:40.699 地図によると まずマンハッタンの東側 0:03:40.699,0:03:44.310 特にロワー・マンハッタン地域で[br]自転車事故が多発しています 0:03:44.310,0:03:45.329 多くのサイクリストが 0:03:45.329,0:03:48.225 そこで橋を渡ってくるので[br]納得できますよね 0:03:48.225,0:03:50.239 しかし他の危険地域も調査の価値ありです 0:03:50.239,0:03:52.908 ウィリアムズバーグと[br]クイーンズ州ルーズベルト・アベニューです 0:03:52.908,0:03:55.760 これこそが ビジョン・ゼロに求めるデータで 0:03:55.760,0:03:57.750 まさに 私たちが探し求めているものです 0:03:57.750,0:03:59.885 しかし このデータを入手するにも 0:03:59.885,0:04:01.952 工夫が必要だったのです 0:04:01.952,0:04:04.343 このロゴを知っている人は? 0:04:04.343,0:04:05.695 何人か手を上げていますね 0:04:05.695,0:04:08.350 PDFをコピー・ペーストして[br]文書を作成しようと 0:04:08.350,0:04:09.707 したことがありますか? 0:04:09.707,0:04:10.767 更に手が上がりました 0:04:10.767,0:04:14.112 ロゴを知らなくてもコピー・ペーストしてみる[br]いいですね 0:04:14.112,0:04:17.622 つまり お見せしたのは PDFだったのです 0:04:17.622,0:04:20.726 実際 物凄い数のPDFを[br]ニューヨーク市警は公開しました 0:04:20.726,0:04:22.886 実際 物凄い数のPDFを[br]ニューヨーク市警は公開しました 0:04:22.886,0:04:26.038 それにアクセスする方法は[br]物凄い時間をかけて 0:04:26.038,0:04:27.764 コピー・ペーストするか 0:04:27.764,0:04:29.108 ジョン・クラウスのようにするかです[br] 0:04:29.108,0:04:30.151 ジョン・クラウスは 0:04:30.151,0:04:33.564 ニューヨーク市警クラッシュデータ・バンドエイド[br]というプログラムを書き 0:04:33.564,0:04:35.852 コピー・ペーストを不要にしました 0:04:35.852,0:04:38.884 ニューヨーク市警のホームページから[br]PDFをダウンロードします 0:04:38.884,0:04:42.010 データを収集するプログラムを実行し 0:04:42.010,0:04:44.260 PDFの保護を解除するプログラムを実行し 0:04:44.260,0:04:45.596 編集できるテキストに戻し 0:04:45.596,0:04:49.161 ネット上に上げるのです[br]だから誰でも地図も作れるのです 0:04:49.161,0:04:52.590 ここにデータがあり[br]それにアクセスできるのです 0:04:52.590,0:04:55.040 ところで この表では[br]事故毎に一列になっています 0:04:55.040,0:04:56.876 PDFの量はどのくらいだと思いますか 0:04:56.876,0:04:59.083 アクセスできることは素晴らしいのですが 0:04:59.083,0:05:01.193 PDF以外にして欲しいものです 0:05:01.193,0:05:03.932 市民がデータ読み取りプログラムを[br]書くはめになるからです 0:05:03.932,0:05:06.008 市民は時間の有効利用できませんし 0:05:06.008,0:05:08.012 市として もっと良くやれるのです 0:05:08.012,0:05:10.748 さて 良いニュースは[br]デブラシオの行政が数か月前に 0:05:10.748,0:05:13.280 このデータを公表したことで 0:05:13.280,0:05:15.438 私たちはアクセスできるようになりました 0:05:15.438,0:05:17.974 しかしまだ 多くのデータがPDFのままです 0:05:17.974,0:05:21.171 例えば 犯罪データはPDFしかありません 0:05:21.171,0:05:24.926 また犯罪データだけでなく[br]市の予算もです 0:05:24.926,0:05:28.655 市の予算はPDFでしか読めません 0:05:28.655,0:05:30.796 私たちがデータ分析を出来ないだけでなく 0:05:30.796,0:05:33.751 予算に賛成票を投じる議員も 0:05:33.751,0:05:35.694 PDFしか使えません 0:05:35.694,0:05:39.538 そのため 議員は賛成する[br]予算の分析できないのです 0:05:39.538,0:05:43.146 市の行政として[br]私たちはそれよりも少しましだと思うのです 0:05:43.146,0:05:45.634 さて PDFではないデータもたくさんあります 0:05:45.634,0:05:47.334 私の作った地図を例にとると 0:05:47.334,0:05:50.260 これはNYCで一番汚い河川です 0:05:50.260,0:05:51.769 どうやって汚さを測るのか? 0:05:51.769,0:05:53.626 ちょっと変なんですけど 0:05:53.626,0:05:55.739 糞便性大腸菌のレベルを 0:05:55.739,0:05:59.245 つまり 河川ごとの糞便物質の指標を調べました 0:05:59.245,0:06:02.519 円が大きいほど[br]水が汚れているのです 0:06:02.519,0:06:05.876 大きな円が汚水で[br]小さな円がきれいな水です 0:06:05.876,0:06:07.520 ご覧のものは 陸地の河川です 0:06:07.520,0:06:10.924 これは過去5年間に[br]市が採取した全データなのです 0:06:10.924,0:06:13.618 陸地の河川は一般的により汚いのです 0:06:13.618,0:06:14.836 納得ですか? 0:06:14.836,0:06:18.210 より大きな円は汚いのです[br]こんなことがわかります 0:06:18.210,0:06:21.374 その1: 河口で泳がないこと 0:06:21.374,0:06:25.692 その2: NYCに一番汚い河川があること 0:06:25.692,0:06:27.526 が測定から判明しました 0:06:27.526,0:06:31.174 コニー・アイランド・クリークです[br]コニーアイランドの海水浴場ではなく 0:06:31.174,0:06:32.332 対岸です 0:06:32.332,0:06:36.210 しかし 5年間に渡り[br]コニー・アイランド・クリークで採取した試料の94%では[br] 0:06:36.210,0:06:38.367 糞便性大腸菌のレベルがとても高く 0:06:38.367,0:06:41.460 河川で泳ぐことは州法に触れます 0:06:41.460,0:06:44.189 市の報告書で強調されるような 0:06:44.189,0:06:45.726 成果とは言えませんね 0:06:45.726,0:06:47.976 nyc.govのトップ・ページに載ったりもしません 0:06:47.976,0:06:49.556 そうやって見せようとしていなくても 0:06:49.556,0:06:52.074 そういうデータに到達したことが凄いのです 0:06:52.074,0:06:53.847 でも データがオープン・データ・ポータルに 0:06:53.847,0:06:56.205 掲載されていなかったので[br]超簡単とは言えませんでした 0:06:56.205,0:06:58.218 オープン・データ・ポータルで探しても 0:06:58.218,0:07:00.831 部分的な数か月か1年分しか見つかりません 0:07:00.831,0:07:04.221 実際 環境保護課のホームページにありました 0:07:04.221,0:07:08.099 リンクは全てエクセルで[br]全て違う形式でした 0:07:08.099,0:07:10.729 見出しも全て違うので[br]コピー・ペーストして 編集します 0:07:10.729,0:07:13.681 それでようやく 地図が作れます[br]素晴らしいことですが ここでもまた 0:07:13.681,0:07:16.650 市としてはもっと上手なやり方があり[br]標準化できるのです 0:07:16.650,0:07:20.034 Socrata のオープンデータポータルNYC[br]というホームページで 0:07:20.034,0:07:21.575 目的を果たせそうです 0:07:21.575,0:07:23.832 ここにある1100個のデータセットは[br]今話したような問題がなく 0:07:23.832,0:07:25.613 ここにある1100個のデータセットは[br]今話したような問題がなく 0:07:25.613,0:07:27.761 その数が増えていくのは[br]素晴らしいことです 0:07:27.761,0:07:31.173 CSV、PDF、エクセルなどに[br]データをダウンロードできるのです 0:07:31.173,0:07:33.720 どんなデータであれ[br]ダウンロードできるのです 0:07:33.720,0:07:35.072 問題は ダウンロードする時 0:07:35.072,0:07:38.758 部署ごとに住所の切れ目がバラバラなことです 0:07:38.758,0:07:40.899 街路名、交差点の通り、通り、区 0:07:40.899,0:07:43.390 住所、建物、建物の住所などです 0:07:43.390,0:07:46.570 だから このポータルを使ってもまだ[br]時間がかかるのです 0:07:46.570,0:07:49.176 住所のフィールドを標準化するのに[br]時間をかけるので 0:07:49.176,0:07:51.599 市民の時間の[br]有効活用になりません 0:07:51.599,0:07:53.395 私たちは市として上手にできるのです 0:07:53.395,0:07:55.040 私たちは住所を標準化できます 0:07:55.040,0:07:57.225 そうすれば[br]こんな地図がもっと増えます 0:07:57.225,0:07:59.510 これはNYCの消火栓の地図ですが 0:07:59.510,0:08:01.041 ただの消火栓ではないのです 0:08:01.041,0:08:05.767 駐車違反切符に関して[br]トップ250の消火栓なのです 0:08:05.767,0:08:07.753 (笑) 0:08:07.753,0:08:11.111 この地図には学べることがあったので[br]私のお気に入りです 0:08:11.111,0:08:13.513 その1[br]アッパー・イースト・サイドに駐車しないこと 0:08:13.513,0:08:17.100 だめですよ どこに駐車しても[br]消火栓の違反切符をもらいますよ 0:08:17.100,0:08:21.253 その2[br]NYCの中で上位2位の消火栓を特定しました 0:08:21.253,0:08:23.139 ロワー・イースト・サイドにあり 0:08:23.139,0:08:28.237 駐車違反切符で年間55,000ドルを超える[br]収益を上げていました 0:08:28.237,0:08:30.975 そのことに気付いた時[br]私はちょっと変な感じがしました 0:08:30.975,0:08:34.244 ちょっと調べて分かったのですが[br]消火栓があって 0:08:34.244,0:08:36.240 脇に縁石に囲まれた路側帯があります 0:08:36.240,0:08:38.299 幅7フィートで歩ける場所です 0:08:38.299,0:08:39.455 駐車する場所はその隣です 0:08:39.455,0:08:41.708 だから 駐車する車が現れても[br]消火栓がずっと 0:08:41.708,0:08:43.620 向こうにあるので 大丈夫と思うのです 0:08:43.620,0:08:47.094 実際 駐車スペースはきれいに塗ってあります 0:08:47.094,0:08:50.249 そこに駐車すると[br]ニューヨーク市警はこれは困ると 0:08:50.249,0:08:51.307 違反切符を貼るのです 0:08:51.307,0:08:53.651 駐車違反切符を見つけたのは[br]私だけではありません 0:08:53.651,0:08:55.797 Googleストリート・ビューカーも 0:08:55.797,0:08:57.414 駐車違反切符を撮影していたのです 0:08:57.414,0:09:01.918 私が I Quant NYというブログに[br]このことを書くと 交通課が 0:09:01.918,0:09:02.938 回答を寄せました 0:09:02.938,0:09:06.348 「この場所について 交通課は[br]苦情を言われたことはありませんが 0:09:06.348,0:09:10.890 道路標示を検討し[br]適切なものに変更します」 0:09:10.890,0:09:13.849 定型的な行政の反応だと[br]私は内心思いました 0:09:13.849,0:09:15.730 半ば諦めてもいたのです 0:09:15.730,0:09:19.700 数週間後 信じられないようなことが[br]起こりました 0:09:19.700,0:09:22.220 交通課はその場所を塗り直しました 0:09:22.220,0:09:24.910 一瞬 私はオープンデータの[br]未来を見たと思いました 0:09:24.910,0:09:26.910 ここで起きたことを考えてみてください 0:09:26.910,0:09:32.010 5年間 この場所は[br]駐車違反切符でだらけでした 0:09:32.010,0:09:36.316 市民が何かを見つけ 市に話すと[br]数週間以内に 0:09:36.316,0:09:37.610 問題が解決したのです 0:09:37.610,0:09:40.810 素晴らしい[br]多くの人がオープンデータが番犬になると考えますが 0:09:40.810,0:09:42.582 むしろパートナーと見るべきなのです 0:09:42.582,0:09:45.720 市民に行政のより良いパートナーになる[br]力を与えます 0:09:45.720,0:09:47.601 そんなに難しいことではありません 0:09:47.601,0:09:49.060 必要なのは 少しの変化です 0:09:49.060,0:09:50.167 公開要請のデータがあり 0:09:50.167,0:09:53.034 何度となく公開を求められるなら 0:09:53.034,0:09:56.608 データを公開しましょう[br]それは公開すべきという合図なのです 0:09:56.608,0:09:59.090 そして PDFを公開する部局のみなさん 0:09:59.090,0:10:02.739 基礎資料をデータと一緒に掲載する[br]規則にしてください 0:10:02.739,0:10:04.767 そのデータは どこかから来ているからです 0:10:04.767,0:10:07.249 どこかは分かりませんが[br]どこかから来ているのです 0:10:07.249,0:10:08.974 それをPDFと共に公開できるのです 0:10:08.974,0:10:11.385 そしてオープンデータの基準を[br]採用し共有しましょう 0:10:11.385,0:10:13.866 ここNYCの住所から始めましょう 0:10:13.866,0:10:15.940 まず住所を標準化することから[br]始めるのです 0:10:15.940,0:10:18.002 NYはオープンデータのリーダーだからです 0:10:18.002,0:10:20.791 問題があっても オープンデータの[br]絶対的なリーダーです 0:10:20.791,0:10:23.912 標準化に着手し[br]オープンデータの基準を作るなら 0:10:23.912,0:10:27.546 自治体も州も おそらく連邦政府も倣うでしょう 0:10:27.546,0:10:28.991 他国も倣うかもしれません 0:10:28.991,0:10:32.402 プログラムや100か国の地図情報を[br]書いた時から 0:10:32.402,0:10:34.292 そんなに時間が経っていないのです 0:10:34.292,0:10:36.779 SFではありません[br]実際つい最近のことです 0:10:36.779,0:10:39.019 ところで これにより得するのは誰でしょう? 0:10:39.019,0:10:42.024 ジョン・クラウスや[br]クリス・ウォンだけではありません 0:10:42.024,0:10:45.119 NYCでは現在 何百もの 0:10:45.119,0:10:46.144 活発な会合があります 0:10:46.144,0:10:48.716 それらの会合に何千人が出席します 0:10:48.716,0:10:51.084 彼らは仕事の後や週末に集まります 0:10:51.084,0:10:53.720 オープンデータを調べ[br]都市をより住みやすくするために 0:10:53.720,0:10:55.360 会合に参加するのです 0:10:55.360,0:10:59.433 BetaNYCのような団体は先週[br]citygram.nycを公表し 0:10:59.433,0:11:01.580 自宅や職場に関する311への苦情の 0:11:01.580,0:11:03.648 定期購読を可能にしました 0:11:03.648,0:11:06.075 住所を入力し[br]地元の苦情を検索します 0:11:06.075,0:11:09.449 これらの情報を求めているのは[br]技術者コミュニティーだけではありません 0:11:09.449,0:11:12.071 私がプラットで教えている学生の[br]都市プランナーも 0:11:12.071,0:11:13.990 政策支持者も 皆もです 0:11:13.990,0:11:16.553 様々な背景の市民もです 0:11:16.553,0:11:19.339 小さな変化の積み重ねで 0:11:19.339,0:11:22.564 オープンデータを利用し[br]より良い都市を作るため 0:11:22.564,0:11:25.720 市民の情熱や能力を解き放つのです 0:11:25.720,0:11:29.346 変化は1つのデータセットや1か所の駐車場からです 0:11:29.346,0:11:31.668 ありがとう 0:11:31.668,0:11:34.973 (拍手)