6,000 마일의 도로와 600 마일의 지하철 노선, 400 마일의 자전거 도로, 그리고 0.5마일의 트램노선. 루즈벨트 아일랜드에 가보셨는지요. 저 숫자는 뉴욕시의 기간시설을 구성하는 숫자들입니다. 우리 사회기반시설의 통계치인 것이죠. 시당국이 발간하는 보고서에서 찾아볼 수 있는 숫자들입니다. 예를 들어, 교통국에서는 그들이 얼마나 긴 길이의 도로를 유지 관리하는지를 발표하죠. MTA는 지하철 노선이 얼마나 긴지를 과시합니다. 대부분의 시정 기관들은 여러 통계자료를 제공하죠. 이건 택시 리무진 위원회가 올해 발표한 보고서의 자료입니다. 이곳 뉴욕시에는 약 13,500대의 택시가 있다는군요. 꽤 흥미롭죠? 그런데 이 숫자들이 어떻게 나왔는지 생각해 보셨나요? 이런 숫자들을 만들면서, 어떤 공무원이 '흠. 이 수치를 궁금해 하겠군' 이렇게 말했겠죠. 시민들이 알고 싶어하는 어떤 수치가 있다 치죠. 그러면 공무원들은 기초 자료를 찾아서 숫자를 세고, 더하고, 계산을 하죠. 그리곤 보고서를 내놓습니다. 그 보고서에 이런 숫자들이 있겠죠. 문제는, 우리의 질문을 어떻게 다 아냐는 거죠. 우린 궁금한 게 많습니다. 사실, 우리 도시에 관한 질문들이 말 그대로 무궁무진 할겁니다. 기관들이 감당하지 못할 정도로요. 기본 개념이 잘못 되었다는 걸 정책가들도 알고 있을 겁니다. 왜냐하면 2012년 블룸버그 시장은 미국에서 가장 야심차고 광범위한 개방형 데이터 법률안에 서명을 하였습니다. 여러 측면에서, 옳은 결정을 했죠. 지난 2년 동안, 뉴욕시는 1000개의 정보 자료를 개방형 자료 포털사이트에 공개했습니다. 꽤 잘한 일이죠. 이런 데이터를 찾아 보다 보면 단순히 택시 숫자만 세어 보는 대신에 다른 질문들을 하기 시작할 겁니다. 저도 묻고 싶은 게 있어요. 뉴욕에서 가장 붐비는 시간대는 언제죠? 좀 귀찮은 질문일 수 있겠지만, 정확히 언제입니까? 생각해 봤는데, 이 택시들은 단순한 숫자가 아니에요. 뉴욕시 도로를 다니는 차들의 GPS 기록들입니다. 택시를 타고 내리는 모든 이력이 기록되죠. 그런 데이터가 있었습니다. 제가 찾아 봤어요. 그래서 제가 뉴욕시 택시들의 일일 평균속도를 그려 봤습니다. 자정에서 아침 5:18까지는 속도가 증가하는 게 보이시죠. 속도가 증가하다가, 그 시점부터는 양상이 바뀝니다. 아침 8시 35분까지는 계속 점점 느려지다가 시속 11.5 마일까지 내려갑니다. 평균적으로 택시들이 시내에서 시속 11.5마일로 다니고, 하루 종일 그 정도로 다닌다는 걸 알았죠. (웃음) 제 생각에, 뉴욕에는 러시 아워는 없는 거 같아요. 그냥 러시 데이인거죠. 맞는 말이죠. 이게 중요한 몇가지 이유가 있습니다. 여러분이 교통 계획자라면 꽤 흥미를 가졌을 거에요. 어떤 장소에 빨리 도착하고 싶다면, 새벽 4시 45분에 알람을 맞춰 놓기만 하면 됩니다. 뉴욕에서는요. 그렇죠? 이 데이터에는 다른 이야기가 숨어 있습니다. 알고 보면, 이 데이터는 그냥 얻을 수 없어요. 사실 이 자료는 정보공개 요청을 통해서 얻었습니다. FOIL 요청서라고도 하는데요. 이것은 택시리무진 위원회 웹사이트에 있는 신청서 양식입니다. 이 자료를 얻으려면 이런 신청서를 받아서 작성을 하면 알려줄 겁니다. 크리스 왕이라는 사람이 실제로 그렇게 했죠. 크리스가 갔을 때, 거기서 말하길 "새 하드 디스크를 가지고 사무실로 오세요" "5시간 동안 맡겨 두시면 데이터를 복사해 둘테니, 찾아가세요" 그렇게 해서 이 데이터가 나온 겁니다. 크리스는 데이터를 공개하고 싶었습니다. 그래서 모두가 사용할 수 있게 인터넷에 올렸고, 결국 이 그래프가 만들어졌죠. 이런 게 존재한다는 사실이 놀랍습니다. 이런 GPS기록이요. 정말 대단하죠. 하지만 실상은, 시민들이 하드디스크를 들고 다니며 시 당국에서 데이터를 얻어 와야만 대중에 공개된다는 거죠. 데이터는 이미 공공재입니다. 여러분도 얻을 수 있어요. 하지만 공개되지 않은 "공공재"였던 거죠. 더 잘할 수 있습니다. 시민들이 하드 드라이브를 들고 다닐 필요가 없죠. 정보공개 요청으로 모든 데이터를 얻을 수는 없습니다. 이건 제가 만든 뉴욕시에서 가장 위험한 교차로 지도입니다. 자전거 사고를 기초로 만든거죠. 붉은 지역이 더 위험한 곳입니다. 맨하탄 동쪽이 먼저 눈에 띄는데요. 특히 맨하탄 하부 지역에서 자전거 사고가 더 많이 일어나죠. 이해가 되는 것이 저 다리 쪽에서 오는 자전거들이 더 많기 때문이죠. 다른 장소도 연구해 볼 만합니다. 윌리엄스버그 거리와 퀸즈에 루즈벨트 거리입니다. 이것이 "무사고 정책"을 위해 필요한 데이터들입니다. 바로 우리가 찾던 것이죠. 하지만 이 데이터도 뒷이야기가 있어요. 이 데이터가 그냥 생긴 게 아닙니다. 이 로고를 아시나요? 몇 분이 고개를 끄덕이시네요. PDF 데이터를 복사해서 붙여넣기 해본 적이 있나요? 이해가 되십니까? 더 많은 분이 고개를 끄덕거리는군요. 붙여넣기를 해보신 분이 더 많으시군요. 지금 막 보신 저 데이터는 사실 PDF 형태입니다. 사실, 수백, 수백, 수백 쪽의 PDF 형태의 보고서를 우리 뉴욕시 경찰청이 발간하고 있습니다. 그 자료를 다루려면 엄청난 시간들을 들여서 복사해서 붙이기를 해야 하죠. 아니면 존 크로스처럼 하면 됩니다. 존 크로스는 데이터를 복사해서 붙이지 않고 프로그램을 만들었습니다. 'NYPD 사고 데이터 반창고'라는 이름을 붙였습니다. 이 프로그램이 뉴욕경찰청 홈페이지에 접속해서 PDF를 내려받습니다. 매일 검색하고 있다가, PDF를 찾으면 다운로드하죠. 그리고는 스크랩 프로그램을 실행합니다. 그러면 텍스트를 뽑아 내고, 인터넷에 업로드하면, 누구나 저런 지도를 만들 수 있죠. 데이터가 여기 존재하고, 우리는 그 데이터를 찾아내고, 이런 식으로 모든 사고자료가 표 안의 행에 표시됩니다. PDF가 얼마나 많은지 상상이 되나요? 그것에 접근할 수 있다는 사실이야말로 대단한거죠. 하지만 그걸 PDF로 공개하지는 않았으면 합니다. 시민들이 PDF를 스크랩해야 하잖아요. 우리 시민들의 시간을 낭비하는 겁니다. 더 잘할 수 있는 방법이 있는데도 말이죠. 희소식은 디 블라지오 행정부가 사실 몇 달 전에 데이터들을 공개했습니다. 이제 그 자료에 접근할 수 있죠. 하지만 아직도 많은 데이터들이 PDF로 만들어집니다. 예를 들어, 범죄 데이터는 여전히 PDF로만 공개됩니다. 범죄 데이터뿐 아니라 시예산 자료도 마찬가지죠. 시예산 자료는 지금 현재로서는 PDF로만 볼 수 있습니다. 우리만 그걸 분석할 수 없는 게 아니라 시예산을 승인한 시의원들도 역시 PDF로만 자료를 받고 있죠. 그래서 시의원들도 자신들이 의결한 시예산을 살펴 보지 못합니다. 그 보다 더 나은 방법을 생각했어요. PDF 속에는 많은 자료들이 드러나 있습니다. 그 예로 이 지도를 만들었습니다. 이건 뉴욕시 수로의 오염도를 나타낸 것입니다. 어떻게 측정했냐구요? 좀 특이하지만, 분변계 대장균 수치를 알아봤어요. 각 수로에서 측정된 분변을 의미하죠. 원이 클수록 물이 더 더럽습니다. 큰 원일수록 더러운 물이고 작은 원일수록 깨끗합니다. 이것은 내륙 수로입니다. 이것은 뉴욕시가 지난 5년간 측정한 모든 데이터들입니다. 내륙 수로들은 보통 더 더럽죠. 이해가 되시죠? 원이 크면 더러운거죠. 이걸로 알게 된 것이 있어요. 하나. 개천이나 운하가 끝나는 곳에서는 절대 수영을 하지 마세요. 둘. 뉴욕시에서 가장 더러운 수로가 어딘 지를 제가 알아냈습니다. 이 측정값으로 말이죠, 이것만 가지고요. 코니 아일랜드는 다행히도 사람들이 수영하는 곳은 아니에요. 그 반대 쪽이죠. 하지만 지난 5년 동안 거기에서 얻은 94%의 견본들에서 분변 수치가 매우 높았습니다. 그런 물에서 수영을 하는 건 법에 어긋날 겁니다. 이런 사실을 시정 보고서에 자랑으로 내세우진 않겠죠? 홈페이지에 이런 걸 올리지는 않을 겁니다. 거기에는 없어요. 하지만, 자료를 얻을 수 있다는 건 대단합니다. 완전히 쉽지는 않아요. 이런 건 데이터 포털에는 없어요. 공개 데이터 포털에 들어가 보면 아마 1년 전이나 몇 달 전에 나온 단편적 자료는 보실 수 있을겁니다. 실제로 환경보호국 웹사이트에는 나와 있어요. 이 각각의 링크가 엑셀로 연결되고, 각 엑셀시트 내용도 다릅니다. 각 머릿글도 달라요. 복사하고 붙이고 재정리해서 이런 훌륭한 지도를 만들 수 있습니다. 다시 말씀드리지만, 뉴욕시보다 더 잘 할 수 있고, 표준화할 수 있어요. 소크라타가 만든 웹사이트를 보면 그걸 잘 이해할 수 있어요. '공개 자료 포털 뉴욕시'라는 웹사이트인데요. 이곳의 1,100개의 자료는 귀찮지 않아요 방금 설명한 방법으로 만들었죠. 자료수는 계속 늘어나고 있어요. 어떤 형식으로든 받을 수 있습니다. CSV, PDF, 엑셀로도요. 여러분이 원하는 자료를 받아볼 수 있습니다. 문제는, 자료를 보다보면 각 기관들이 주소를 다르게 규정하는 걸 알게될 겁니다. 어떤 건 도로명이고, 교차로, 거리, 군, 주소, 건물, 건물 주소를 쓰고 있죠. 역시나, 이 포탈이 있어도 시간을 들여야 할 겁니다. 시간을 들여서 주소를 정리해야 하죠. 이건 시민들의 시간을 낭비하는 거에요. 우리는 더 잘 할 수 있습니다. 주소 체계를 표준화하면 이런 지도를 쉽게 만들 수 있습니다. 이것은 뉴욕의 소화전 지도입니다. 일반적인 소화전이 아니고 주차위반 딱지로 흥행을 거둔 상위 250개의 소화전 입니다. (웃음) 이 지도에서도 몇가지를 배웠고 전 정말 이 지도를 좋아해요. 첫째, 맨하탄 북동쪽에는 절대로 주차하지 마세요. 어디에 주차를 하든 주차 딱지를 떼일거니까요. 둘째, 뉴욕시에서 두번째로 소화전이 많은 곳을 찾았는데요. 맨하탄 하부 동쪽입니다. 주차딱지로 1년에 5만 5천달러가 넘는 세금을 벌어들입니다. 그걸 알아냈을 때 뭔가 이상했어요. 좀 더 알아내서 나온 게 소화전이었고 경계석 확장 영역이 있다는 것을 알았습니다. 보행자를 위한 2m 정도의 공간이죠. 그리고 주차 공간도 있어요. 이 차들이 늘어서 있고 소화전도 있어요. "소화전은 저기 있으니까, 주차해도 괜찮을거야." 사실 저기에 예쁘게 표시된 주차공간이 있어요. 거기에 주차를 하면, 뉴욕경찰은 이 곳은 지정된 공간이 아니라고 하면서 주차위반 딱지를 끊겠죠. 저만 주차위반 딱지를 본 게 아니구요. 이건 구글 스트릿뷰에 찍힌 자동차 모습인데 역시 주차위반 딱지를 받았습니다. 이걸 제 블로그에 올렸더니 아이콴트 뉴욕과 교통부에서 답을 했죠. 그들이 말하기를, "교통부는 이 지역에 관한 어떤 항의도 받지 않았지만, 길 표지를 다시 확인하고 적당한 교체를 할 것입니다. " 전 속으로 저건 틀에 박힌 대답이라고 생각했어요. 그래요, 무시하기로 했어요. 하지만, 몇주일 후, 정말 놀라운 일이 일어났습니다. 그 공간에 다시 페인트칠을 한겁니다. 잠깐이지만 오픈 데이터의 미래를 봤다는 생각을 했어요. 여기에서 일어난 일을 생각해보세요. 5년 동안 그 곳은 유명한 단속장소였는데, 시민 한명이 무언가를 찾았고, 시 당국에 알리고, 몇 주 후에 문제가 해결된 거에요. 그리고 다들 오픈 데이터를 감시견으로 생각하는데 이건 파트너에 가깝습니다. 우리 시민은 정부의 훌륭한 파트너가 될 수 있어요. 어려운 일이 아닙니다. 필요한 건 작은 변화입니다. 자료 공개를 요청하고, 구한 자료를 계속 살펴 보고, 대중에게 알리는 겁니다. 공개하라는 신호를 보내는거죠. 정부기관의 PDF 발행을 담당하는 분이 계시다면 기초 데이터 배포에 필요한 법안을 통과시켜 주세요. 왜냐하면 그런 데이터가 어디선가 나오잖아요. 저는 모르지만, 어디선가 나오니까 PDF로 배포하는 거겠죠. 그리고 이 데이터의 표준을 만들고 공유해 주세요. 이곳 뉴욕시에서 우리의 주소체계를 시작해 주세요. 우리의 주소체계를 표준화해 주세요. 뉴욕시는 오픈 데이터의 선두주자니까요. 이 모든 것에도 불구하고, 우리는 오픈 데이터 영역의 선구자입니다. 그리고 만약 우리가 표준화 작업을 시작하면, 다른 지역, 다른 주, 연방정부도 따라 할 겁니다. 다른 나라들도 따라 하겠죠. 프로그램 하나로 100개 국가의 정보를 지도로 만들 날이 그리 머지 않았습니다. 이건 공상과학 소설이 아니며 실제로 가능합니다. 그런데, 그럴 자격은 누구에게 있죠? 존 크로스도 아니고 크리스 왕도 아닙니다. 뉴욕시에만도 수 백개의 소모임이 있습니다. 왕성하게 활동중이죠. 수 천 명의 사람들이 이 모임에 참여합니다. 퇴근 후나 주말이 되면 모임에 참여해서 공개된 자료를 분석합니다. 더 나은 도시를 만들자는 생각으로요. 베타NYC 단체는 지난 주에 citygram.nyc 라는 사이트를 열었습니다. 여러분 집이나 사무실 주변의 311 불편신고 내용을 구독할 수 있죠. 집주소를 입력하면, 지역 민원 내용을 알려줍니다. 이건 기술 동호회만의 몫이 아닙니다. 제가 가르치는 학생들같은 도시계획가. 정책입안자, 그리고 우리 모두. 다양한 배경을 가진 시민들의 몫입니다. 이런 작고, 점진적인 변화를 통해서 시민으로서의 열정과 능력을 드러내고 오픈 데이터를 이용해 더 나은 도시를 만들 수 있습니다. 하나의 데이터든, 작은 주차공간이든, 뭐든지 말이죠. 감사합니다. (박수)