छह हजार मील की सड़क,
६०० मील का भूमिगत मार्ग,
४०० मील लंबे मार्ग बाइकों के लिए
और आधा मील लम्बा ट्रैम का मार्ग,
अगर आप कभी रूजवेल्ट आइलैंड गए हों।
ये वो संख्याएँ हैं जो न्यूयाॅर्क सिटी के
बुनियादी ढांचे को बनातीं हैं।
ये हमारे बुनियादी ढांचे के आंकड़े हैं।
ये वो संख्याएँ हैं जो आप शहरी एजेंसियों
द्वारा जारी रिपोर्टों में पा सकते हैं।
उदाहरण के तौर पर, परिवहन विभाग
शायद आपको बता देगा
कि वो कितनी मील सड़क की देखभाल करते हैं।
एमटीए भूमिगत मार्ग की लंबाई
की डींग हाँकेगा।
अधिकतर शहरी एजेंसियाँं आँकड़े देते हैं।
ये इस साल की रिपोर्ट में है,
टैक्सी और लिमोजीन कमीशन की,
कि यहाँ न्यूयाॅर्क सिटी में 13,500
टैक्सियाँ हैं,
बहुत दिलचस्प है, है ना?
पर कभी आपने सोचा कि ये संख्याएँ
आईं कहाँ से?
क्योंकि इन संख्याओं के लिए,
शहरी एजेंसी में किसी को
रुक कर कहना पड़ता, हाँ, ये संख्या शायद
कोई जानना चाहता हो।
ये एक संख्या है जो हमारे नागरिक
जानना चाहते हों।
वो अपने कच्चे आंकड़ों पर वापस आते हैं,
गिनते, जोड़ते, हिसाब लगाते हैं,
और फिर रिपोर्ट जारी करते हैं,
और उन रिपोर्टों में ऐसी संख्याएँ होंगी।
समस्या ये है कि उन्हें हमारे सारे सवाल
पता कैसे हैं?
हमारे बहुत सारे सवाल हैं।
वास्तव में, कुछ मायनों में सवालों
की एक अनंत संख्या है जिन्हें
हम अपने शहर के बारे में पूछ सकते हैं।
एजेंसियाँ सभी जवाब नहीं दे सकतीं।
तो प्रतिमान बिल्कुल काम नहीं कर रहा है,
और शायद नीति निर्धारकों को ये एहसास है,
क्योंकि 2012 में महापौर ब्लूमबर्ग ने एक
कानून पर हस्ताक्षर किए, जिसे उन्होंने
देश का सबसे महत्वाकांक्षी और व्यापक खुला
डेटा विधान बताया।
कई मायनों में वो सही हैं।
पिछले दो वर्षों में शहर ने १,००० डेटा सेट
जारी किए हैं
हमारे खुले डेटा पोर्टल पर,
और ये बहुत विष्मयकारी है।
तो आप डेटा कुछ इस तरह देखते हैं,
और टैक्सियों की गिनती की जगह,
हम अलग सवाल पूछना शुरु कर सकते हैं।
तो मेरा एक सवाल था,
न्यूयाॅर्क सिटी में व्यस्त समय कब होता है?
ये झंझटपूर्ण भी हो सकता है,
व्यस्त समय असल में है क्या?
और मैंने सोचा, टैक्सियाँ केवल
संख्याएँ नहीं है,
हमारे शहर की सड़कों पर चलते हुए
जीपीएस रिकाॅर्डर हैं,
जो अपनी हर सवारी दर्ज करते हैं।
वहाँ डेटा है, और मैंने उस डेटा
की तरफ देखा,
और मैंने न्यूयाॅर्क सिटी में दिन भर चलती
टैक्सियों की औसत गति की रूपरेखा बनाई।
आप देख सकते हैं कि आधी रात से सुबह
लगभग ०५:१८ तक
गति बढ़ जाती है, उस बिंदु पर कायापलट
हो जाता है,
और वो सुबह लगभग ०८:३५ तक बहुत धीमी
हो जाती हैं,
और लगभग ११.५ मील प्रति घंटे पर
इनका सफर खत्म होता है।
औसत टैक्सी ११.५ मील प्रति घंटे की गति
से हमारी सड़कों पर दौड़ती है,
और ये पता चला है कि ये पूरे दिन
ऐसा ही रहता है।
(हँसी)
तो मैंने खुद से कहा, शायद न्यूयॅार्क सिटी
में वयस्त समय नहीं है।
शायद केवल एक वयस्त दिन है।
सही भी है। और ये दो कारणों से
महत्वपूर्ण भी है।
अगर आप परिवहन योजनाकार हैं, तो आपके
लिए ये बहुत दिलचस्प हो सकता है।
पर अगर आप कहीं जल्द पहुँचना चाहते हैं,
अब आप जानते हैं कि सुबह ०४:४५ का अलार्म
लगाना है और आप तैयार हैं।
न्यूयॉर्क, है ना?
पर इस डेटा के पीछे एक कहानी है।
ये डेटा ऐसे ही उपलब्ध नहीं था,
ऐसा पता चलता है।
ये सूचना कानून अनुरोध की स्वतंत्रता नामक
वस्तु से आया,
या "फोयल" अनुरोध।
इस प्रपत्र को आप टैक्सी और लीमोजीन निगम
की वेबसाइट पर पा सकते हैं।
इस डेटा तक पहुँचने के लिए आपको
ये प्रपत्र चाहिए,
इसे भर दीजिए, और वे आपको सूचित करेंगे,
और क्रिस व्होंग नामक एक वयक्ति
ने यही किया।
क्रिस वहाँ गया और उन्होंने उससे कहा,
"एक बिल्कुल नई हार्ड ड्राइव हमारे
कार्यालय ले कर आईए,
उसे यहाँ पाँच घंटे के लिए छोड़ दीजिए
हम डेटा काॅपी कर देंगे
और आप उसे वापस ले जाईए।"
और ये डेटा यहाँ से आया।
अब क्रिस ऐसा व्यक्ति है जो डेटा
सार्वजनिक करना चाहता है,
तो ये सभी के उपयोग के लिए ऑनलाइन हो गया,
और ये ग्राफ भी यहीं से आया।
इसका अस्तित्व सच में अदभुत है।
ये जीपीएस रिकाॅर्डर--सच में अच्छे हैं।
पर ये सच की हमारे नागरिक हार्ड ड्राइव
लिए चारों ओर घूम रहे हैं,
शहर एजेंसियों से डेटा लेकर सार्वजनिक
करते हुए
ये पहलेसे ही एक तरह से सार्वजनिक था
आप इस तक पहुँच सकते थे
पर ये "सार्वजनिक" था,
ये सार्वजनिक नहीं था।
हम इससे बेहतर कर सकते हैं।
हमारे नागरिकों को हार्ड ड्राइव ले कर
घूमने की जरुरत नहीं है।
हर डेटा सेट "फोयल" अनुरोध
के पीछे नहीं है।
मैंने न्यूयॉर्क सिटी के सबसे खतरनाक
चौराहों का एक नक्शा तैयार किया है,
साइकिल चालक दुर्घटनाओं के आधार पर।
तो ये लाल क्षेत्र अधिक खतरनाक हैं।
ये पहले मैनहैटन का पूर्वी क्षेत्र
दिखाता है,
मैनहैटन के निचले हिस्सों में विशेष रुप
से साइकिल चालक दुर्घटनाएं होती हैं,
ये शायद समझ में आता है
क्योंकि वहाँ और साइकिल चालक पुल
से नीचे आ रहे हैं।
पर और भी अध्ययन करने लायक जगहें हैं।
विलियम्सबर्ग है।
क्वींस में रूजवेल्ट एवेन्यू है।
ये उसी तरह का डेटा है जैसा हमें
विजन जीरो के लिए चाहिए।
ये वास्तव में वही है जैसा हमें चाहिए।
पर इस डेटा के पीछे भी एक कहानी है।
ये डेटा कहीं से यूं ही प्रकट नहीं हो गया।
आप में से कितने लोग ये लोगो पहचानते हैं?
मैं कुछ हिलना-डुलना देख रहा हूँ।
क्या कभी आपने पीडीएफ से डेटा
काॅपी और पेस्ट कर
उसे समझने की कोशिश की है?
मैं और सिर हिलते देख रहा हूँ।
लोगो जानने वालों से ज़्यादा ने काॅपी
पेस्ट किया है। मुझे ये पसंद है
तो हुआ ये है कि जो डेटा आपने अभी देखा
वो वास्तव में पीडीएफ पर था।
वास्तव में, पीडीएफ के सैकड़ों पन्ने
हमारे अपने एनवायपीडी के निकाले हुए,
और उस तक पहुँचने कि लिए या तो आपको
काॅपी पेस्ट करना होगा,
सैकड़ों और सैकड़ों घंटों के लिए,
या आप जाॅन क्रॉस हो सकते हैं।
जाॅन क्रॉस ऐसा था,
मैं ये डेटा काॅपी पेस्ट नहीं करुँगा।
मैं एक प्रोग्राम लिखुंगा।
इसे एनवायपीडी क्रैश डेटा बैंड-एड कहा
जाता है,
ये एनवायपीडी की वेबसाईट पर जाता है,
पीडीएफ डाउनलोड करने के लिए।
ये हर दिन खोजे;
और अगर एक पीडीएफ मिले
तो उसे डाउनलोड कर ले और फिर कुछ
पीडीएफ स्क्रैपिंग प्रोग्राम चलाए,
और लिखा हुआ बाहर आ जाएगा,
और ये इंटरनेट पर चला जाएगा,
और फिर लोग उस तरह नक्शे तैयार करेंगे।
और ये सच की डेटा यहाँ है,
ये सच की हमारी उस तक पहुँच है--
वैसे हर दुर्घटना इस तालिका में
एक पंक्ति है।
आप सोच सकते हैं कि ये कितने पीडीएफ हैं।
हमारी उस तक पहुँच सच में बड़ी बात है,
पर हम इसे पीडीएफ के रुप में जारी न करें,
क्योंकि तब हम हमारे नागरिक पीडीएफ स्क्रैपर
लिखते हैं।
ये हमारे नागरिकों के समय का बेहतरीन
उपयोग नहीं है,
हम एक शहर के तौर पर इससे
बेहतर कर सकते हैं।
अबअच्छी खबर ये है कि डी ब्लासियो प्रशासन
ने ये डेटा कुछ महीने पहले जारी किया,
इसलिए अब हम उस तक पहुँच सकते हैं,
पर अभी भी बहुत सा डेटा पीडीएफ में
दफन है।
उदाहरण के लिए, हमारा अपराध डेटा
अभी पीडीएफ में ही उपलब्ध है।
केवल हमारा अपराध डेटा ही नहीं,
हमारे शहर का बजट भी।
हमारे शहर का बजट अभी केवल पीडीएफ
के रुप में ही पढ़ा जा सकता है।
और न केवल हम ही इसकी समीक्षा
नहीं कर सकते--
हमारे अपने विधायक जो बजट पर अपना
मत देते हैं,
उन्हें भी ये पीडीएफ में ही मिलता है।
तो हमारे विधायक उस बजट की समीक्षा नहीं
कर सकते जिस पर वो अपना मत देते हैं।
और मैं समझता हूँ कि एक शहर के तौर पर हम
इससे कुछ बेहतर कर सकते हैं।
अब बहुत सा डेटा है जो पीडीएफ के भीतर
नहीं छुपा है।
ये मेरे द्वारा बने एक नक्शे का नमूना है,
और ये न्यूयॉर्क सिटी के सबसे मलिन
जलमार्ग हैं।
अब मैं गंदगी का आकलन कैसे करुँ।
खैर, ये थोड़ा अजीब है,
पर मैंने मल कोलिफॉर्म के स्तर को देखा,
जो हमारे हर जलमार्ग में मल पदार्थ
का माप है।
जितना बड़ा वृत्त,
उतना गंदा पानी,
तो बड़े वृत्त का अर्थ है गंदा पानी,
छोटे वृत्त अपेक्षाकृत साफ हैं।
आप अंतर्देशीय जलमार्ग देख रहे हैं।
ये वो डेटा है जिसका शहर ने पिछले पाँच
वर्षों में नमूना लिया था।
और अंतर्देशीय जलमार्ग, सामान्यत:
अधिक गंदे होते हैं।
ये समझ में आता है, ठीक?
और बड़े वृत्त गंदे हैं।
और मुझे इससे कुछ बातें पता चलीं।
पहली: कभी उसमें न तैरैं जो "छोटी नदी"
या "नहर" में खत्म होती है।
पर दूसरी: मैंने न्यूयॉर्क सिटी का सबसे
मलिन जलमार्ग भी ढूंढ़ निकाला,
इस आकलन से, एक आकलन से।
कौने आइलैंड क्रीक में, ये वो कौने आइलैंड
नहीं है जिसमें आप तैरते हैं, भाग्यवश।
ये दूसरी तरफ है।
पर कौने आइलैंड क्रीक में पिछले पाँच सालों
में 94 % नमूनों में
मल स्तर इतने अधिक थे
कि पानी में तैरना राज्य के कानून
के खिलाफ होता।
और इस तरह के तथ्य आप शहरी रिपोर्ट में शेखी
बघारते हुए नहीं पाएँगे, ठीक?
ये nyc.gov. के पहले पन्ने पर नहीं होगा।
आप इसे वहाँ नहीं देख पाएँगे,
पर ये अच्छी बात है कि हम उस डेटा
तक पहुँच सकते हैं।
पर एक बार फिर, ये बहुत आसान नहीं था
क्योंकि ये डेटा खुले डेटा पोर्टल
पर नहीं था।
अगर आप खुले डेटा पोर्टल पर जाते,
तो आप एक टुकड़ा ही देखते,
एक साल या कुछ महीनों का।
ये असल में पर्यावरण संरक्षण विभाग
की वेबसाइट पर था।
और इसमें से हर लिंक एक एक्सेल शीट है,
और हर एक्सेल शीट अलग है।
हर शीर्षक अलग है:
आप काॅपी, पेस्ट और फिर ठीक करते हैं।
जब आप करते हैं तो नक्शे बना सकते हैं
और ये अच्छा है, पर
हम बेहतर कर सकते हैं,
चीजें सामान्य कर सकते हैं।
और हम वहाँ पहुँच रहे हैं क्योंकि यहाँ
ये वेबसाइट है जो सोक्रेटा बनाता है
जिसे ओपन डेटा पोर्टल एनवाईसी कहते हैं।
यहाँ १,१०० डेटा सेट उनसे ग्रस्त नहीं है
जिनके बारे में मैंने अभी आपको बताया
और ये संख्या बढ़ रही है, और ये
काफी अच्छा है।
आप किसी भी प्रारूप में डेटा डाउनलोड कर
सकते हैं, सीएसवी, पीडीएफ या एक्सेल।
जिस तरह चाहें आप डाउनलोड कर सकते हैं।
समस्या ये है कि जब आप ने कर लिया,
आप पाएँगे कि हर एजेंसी अपना पता
अलग तरह से संकेत करती है।
तो एक सड़का का नाम है, चौराहा,
सड़क, नगर, पता, इमारत,
इमारत का पता।
तो एक बार फिर आप समय व्यय कर रहे हैं,
जबकि हमारे पास ये पोर्टल है,
आप पते की जगहों को सामान्य बनाने में
समय व्यय कर रहे हैं।
और ये हमारे नागरिकों के समय का बेहतरीन
उपयोग नहीं है।
हम एक शहर के तौर पर बेहतर कर सकते है।
हम अपने पते मानकीकृत कर सकते है,
और अगर हम करे,
तो हमें ऐसे और नक्शे मिल सकते है।
ये न्यूयाॅर्क सिटी के अग्नि हाईड्रेंट
का एक नक्शा है,
पर किसी भी अग्नि हाईड्रेंट का नहीं।
ये २५० सबसे ज्यादा कमाई करने वाले अग्नि
हाईड्रेंट हैं, पार्किंग टिकट के मामले में।
(हँसी)
तो मैंने इस नक्शे से कई चीज़ें सीखीं,
और मुझे ये नक्शा सचमुच पसंद है।
पहली, अपर ईस्ट साईड में पार्क न करें।
बिल्कुल भी नहीं, जहाँ भी पार्क करेंगे,
आपको हाईड्रेंट टिकट मिल जाएगा।
दूसरी, मुझे पूरी न्यूयाॅर्क सिटी में सबसे
ज्यादा कमाई करने वाले दो हाईड्रेंट मिले,
और वो लोअर ईस्ट साईड में मिले,
और वो हर साल पार्किंग टिकट के रुप में
५५,००० डाॅलर ला रहे हैं।
और मुझे ये थोड़ा अजीब लगा जब मैंने
इसकी ओर ध्यान दिया,
तो मैंने थोड़ी खोजबीन की और पता चला
कि ये तो हाईड्रेंट है।
और फिर ऐसा जिसे कर्ब एक्सटेंशन
कहा जाता है,
जो चलने के लिए एक सात फुट की
जगह की तरह है
और फिर पार्किंग की एक जगह।
और इसलिए ये कारें साथ आईं,
और हाईड्रेन्ट --
"ये पूरा वहाँ तक है, मै ठीक हूँ,"
और वहाँ सच में उनके लिए खूबसूरती से रंगा
एक पार्किंग स्थल था।
वो वहाँ पार्क करते, और एनवायपीडी इस
प्रयोजन से सहमत नहीं था
और उन्हें टिकट थमा देता।
और सिर्फ मुझे ही पार्किंग टिकट नहीं मिला,
ये गूगल स्ट्रीट व्यू कार चल रही है
जिसे वही पार्किंग टिकट मिला है।
तो मैंने इस बारे में अपने ब्लॉग पर लिखा,
आई क्वांट एनवाय पर, और डीओटी ने जवाब दिया,
और उन्होंने कहा,
"हालांकि डीओटी को इस स्थान के बारे में कोई
शिकायत नहीं मिली है,
हम सड़क चिह्नों की समीक्षा करेंगे
और उचित परिवर्तन करेंगे।"
और मैंने सोचा, ठेठ सरकारी प्रतिक्रिया,
ठीक है, मैं आगे बढ़ा।
पर फिर, कुछ सप्ताह बाद,
कुछ अविश्वसनीय हुआ।
उन्होंने उस स्थान को फिर रंग दिया,
और मैंने सोचा कि मैंने खुले डेटा
का भविष्य देखा है,
क्योंकि जरा सोचिए कि यहाँ क्या हुआ है।
पाँच साल से यहाँ टिकट जारी किए जा रहे थे,
और ये भ्रामक था,
और फिर एक नागरिक को कुछ मिला, उसने शहर
को बता दिया, और कुछ ही सप्ताह में
समस्या सुलझा ली गई।
ये आश्चर्यजनक है। और बहुत लोग खुले
डेटा को एक प्रहरी की तरह देखते हैं।
ऐसा नहीं है, ये सहभागी होने की बात है।
हम अपने नागरिकों को सरकार का बेहतर
भागीदार बनाने के लिए सशक्त
कर सकते हैं, ये उतना मुश्किल नहीं है।
हमें कुछ चाहिए तो बस बदलाव।
अगर आप डेटा "फोयल" कर रहे हैं,
अगर आप अपना डेटा बार-बार "फोयल"
होता देख रहे है,
इसे लोगों के लिए जारी कर दें, ये संकेत है
कि इसे सार्वजनिक कर दिया जाए।
अगर आप पीडीएफ जारी करती एक
सरकारी एजेंसी हैं,
तो ऐसा कानून पारित करें जिससे आप इसे
अंतर्निहित डेटा के साथ जारी कर सकें,
क्योंकि ये डेटा कहीं से आ रहा है।
मैं नहीं जानता कहाँ से, पर कहीं से
आ रहा है
आप इसे पीडीएफ में जारी कर सकते हैं।
और चलो कुछ खुले डेटा मानकों को अपनाएँ
और साझा करें।
यहाँ न्यूयाॅर्क सिटी के पतों से शुरु
करें।
अपने पतों को सामान्य बनाना शुरु करें।
क्योंकि न्यूयाॅर्क खुले डेटा
में अग्रणी है।
इस सब के बावजूद, हम खुले डेटा में पूर्ण
रुप से अग्रणी हैं,
और यदि हम चीजें सामान्य करना
शुरु करें, और खुला डेटा
मानक निर्धारित करें,
दूसरे पीछे आएँगे। राज्य और शायद संघीय
सरकार भी,
दूसरे देश अनुसरण कर सकते हैं,
और वो समय दूर नहीं जब हम एक प्रोग्राम और
नक्शे की जानकारी
१०० देशों से लिख सकें।
ये काल्पनिक विज्ञान नहीं है। हम असल
में बहुत करीब है।
और हाँ, इससे हम किसे सशक्त बना रहे हैें?
क्योंकि ये सिर्फ जाॅन क्रोस
या क्रिस व्होंग नहीं है।
न्यूयाॅर्क सि़टी में इस वक्त सैकड़ों
समागम चल रहे हैं,
सक्रिय समागम।
हजारों लोग इन समागमों में भाग ले रहे हैं।
ये लोग काम के बाद और सप्ताहांत
में जाते हैं,
ये इन समागमों में खुले डेटा को समझने
के लिए भाग लेते हैं
ताकि हमारा शहर एक बेहतर स्थान बने।
बीटा एनवायसी जैसे समूह, जिसने पिछले हफ्ते
citygram.nyc जारी किया
जो आपको ३११ शिकायतों का अनुमोदन
करने देता है,
आपके घर या कार्यालय के आसपास।
आप अपना पता लिखते है, आपको स्थानीय
शिकायतें मिलतीं है।
और सिर्फ तकनीकी समुदाय ही इन सब
चीजों के पीछे नहीं है।
शहरी योजनाकार भी हैं जिन्हें मैं प्रैट
में पढ़ाता हूँ।
नीति अधिवक्ता भी हैं, सभी हैं,
अलग-अलग पृष्ठभूमि के नागरिक हैं।
और कुछ छोटे, वृद्धिशील परिवर्तनों के साथ
हम अपने नागरिकों के उत्साह और क्षमता
का ताला खोल सकते हैं
खुले डेटा के उपयोग के लिए जिससे हमारा
शहर और बेहतर हो सके,
चाहे वो एक बार में एक डेटा सेट
या एक पार्किंग स्थल हो।
धन्यवाद।
(तालियाँ)