অ্যালগরিদম সব জায়গায় উপস্থিত|
তারা পরাজিতদের বিজয়ীদের থেকে আলাদা করে|
বিজয়ীরা একটি ভালো চাকরি
বা ক্রেডিট কার্ড অফার পায়|
ক্ষতিগ্রস্তরা একটা সাক্ষাৎকারও পায়না বা
তাদের বীমার জন্য বেশি টাকা দিতে হয়|
আমাদের গোপন সূত্র দিয়ে মাপা হচ্ছে
যা আমরা বুঝতে পারিনা
এবং যার বিরুদ্ধে আবেদন করার ব্যবস্থা নেই |
তাই এই প্রশ্নটা ওঠে:
যদি অ্যালগরিদম গুলো ভুল হয়ে তাহলে কি হবে?
অ্যালগরিদম নির্মাণের জন্য দুটি জিনিসের
প্রয়োজন: আপনার দরকার তথ্য,অতীতে কি ঘটেছে,
এবং সাফল্যের একটি সংজ্ঞা,
আপনি কি খুঁজছেন এবং কিসের জন্য প্রত্যাশী |
আপনি দেখে এবং বিবেচনা করে একটি
অ্যালগরিদম কে শেখান |
অ্যালগরিদমটি সাফল্যের সাথে কি
যুক্ত তা প্রকাশ করে।
কোন পরিস্থিতি সফলতার দিকে
এগিয়ে নিয়ে যায়?
বাস্তবে সবাই অ্যালগরিদম ব্যবহার করে।
তারা লিখিত কোডে তা প্রকাশ করেনা |
একটি উদাহরণ নিন |
আমি প্রতিদিন এক অ্যালগরিদম ব্যবহার
করে আমার পরিবারের জন্য খাবার বানাই|
আমার জন্য তথ্য হল
রান্নাঘরের সকল উপাদানগুলি,
আমার সময়,
আমার উচ্চাকাঙ্খা,
এবং আমি সেই তথ্যগুলি সংগঠিত করি |
আমি খাবার হিসাবে রামেন নুডলস এর
প্যাকেজগুলো গণনা করিনা |
(হাসি )
আমার কাছে সাফল্যের বর্ণনা হল:
আমার বাচ্চারা সবজি খেলে একটি আহার সফল হয় |
এটা আলাদা হত যদি আমার ছোট ছেলে
এই কাজের কর্মকর্তা হত |
সে বলত আহার সফল তখনি হবে যখন
সে অনেক নিউটেলা খেতে পারবে |
কিন্তু এ ক্ষেত্রে আমি সফলতার বর্ণনা ঠিক করে দিচ্ছি|
আমি কর্মকর্তা | আমার মতামত গুরুত্বপূর্ণ |
এটা অ্যালগরিদমের প্রথম নিয়ম।
অ্যালগরিদম কিছু মতামত যা কোডের
মধ্যে উদ্ভিত করা থাকে|
এটি অধিকাংশ মানুষ যা ভাবে এর
সম্পর্কে তার চেয়ে ভিন্ন|
তারা মনে করেন অ্যালগরিদমগুলি উদ্ধেষপূর্ণ
এবং সত্য এবং বৈজ্ঞানিক।
এটি একটি বিজ্ঞাপনের কৌশল|
একটি বিজ্ঞাপনের কৌশলের মতন
অ্যালগরিদমের দ্বারা আপনাদের ভীতি বাড়ানো হয়,
যাতে আপনারা অ্যালগরিদমকে বিশ্বাস করেন
এবং ভয় পান
কারণ আপনারা অঙ্ককে বিশ্বাস করেন
এবং ভয় পান|
বিগ ডাটা এ অন্ধ বিশ্বাস করলে অনেক
ভুল হতে পারে|
ইনি কিরি সোয়ার্স|তিনি ব্রুক্লিনের এক
উচ্চ বিদ্যালয়ের প্রধান|
২0১১ সালে, তিনি আমাকে বলেছিলেন
যে তার শিক্ষকদের
একটি জটিল, গোপন অ্যালগরিদম
দিয়ে অবহিত করা হচ্ছে
জাকে বলা হয় "মূল্য-সংযোজন মডেল।"
আমি তাকে বলেছিলাম, "আচ্ছা, সূত্রটা কী,
তা আমাকে দেখিয়ে দাও।
আমি আপনাকে এটা ব্যাখ্যা করব|"
তিনি বলেন, "আমি সূত্রটি পেতে
চেষ্টা করেছি,
কিন্তু আমাদের শিক্ষা বিভাগ আমাকে বলল এটি
গণিত এবং আমি তা বুঝতে পারবনা|"
আরো খারাপ হতে পারে|
নিউইয়র্ক পোস্ট তথ্য অধিকারের স্বাধীনতা
আইন অনুযায়ী আবেদন করে সমস্ত শিক্ষকের নাম
এবং নম্বরের ও সেগুলি শিক্ষক-শিষ্টাচারের
রূপে প্রকাশ করে।
যখন আমি সূত্রগুলো পাওয়ার চেষ্টা করি,
সোর্স কোড গুলো, একই পথে,
আমায় বলা হয়ে যে আমায় তা দেওয়া হবেনা|
আমায় বাধা দেওয়া হয়|
আমি পরে জানতে পারলাম
নিউ ইয়র্কে কারোই সেই কোড জানা নেই|
কেউ তা বুঝতোনা |
তারপর একদিন এক শিক্ষিত মানুষ জড়িয়ে পড়লেন,
গ্যারি রুবিনস্টাইন|
তিনি লক্ষ্য করলেন নিউ ইয়র্ক পোস্টের
তথ্যে
৬৬৫ শিক্ষকের দুটি নম্বর ছিল|
এটা তখনই সম্ভব যদি তারা সপ্তম
এবং অষ্টম দুই শ্রেণীতেই অঙ্ক পড়ান|
তিনি এগুলি চিত্র লেখন করেন।
একটি দাগ একটি শিক্ষককে বোঝায়|
(হাসি )
এটা কি?
(হাসি)
এরকম ব্যক্তিগতভাবে মূল্যায়ন করা সঠিক না।
এটি প্রায় একটি এলোমেলো সংখ্যা উৎপাদক।
(তালি)
কিন্তু তাই ছিল|
ইনি সারা ওয়াসকি |
তাকে ওয়াশিংটনে,ডিসি স্কুল জেলার ২০৫ জন
অন্যান্য শিক্ষকের সাথে বহিষ্কার করা হয়,
যদিও তার স্কুলের প্রধান ও বাচ্চাদের
পিতামাতাদের
থেকে ভালো সুপারিশ ছিল।
আমি জানি আপনারা এখানে কি ভাবছেন, বিশেষত
যারা তথ্য বৈজ্ঞানিক এবং এ.আই বিশেষজ্ঞ|
আপনারা ভাবছেন,"আমরা কখনো এরকম অসঙ্গত
অ্যালগরিদম তৈরী করবোনা|"
কিন্তু অ্যালগরিদমে ভুল হতে পারে,
এমনকি ভাল উদ্দেশ্যর সঙ্গে গভীরভাবে
ধ্বংসাত্মক প্রভাব থাকতে পারে।
ঠিক যেভাবে খারাপ ভাবে নকশা করা
একটি বিমান যেমন মাটিতে ভেঙে পড়তে পারে,
একটি খারাপ ভাবে পরিকল্পিত অ্যালগরিদমও
দীর্ঘ সময় ধরে চলে, ক্ষয় করতে পারে|
ইনি রজার আইলেস |
(হাসি )
তিনি ১৯৯৬ সালে ফক্স নিউজ প্রতিষ্ঠা করেন।
২0 জনের বেশি মহিলা যৌন হয়রানি
সম্পর্কে অভিযোগ করেছে।
তারা জানিয়েছে যে তাদের ফক্স নাউসে
সফলতা হাসিল করতে দেওয়া হয়নি|
গত বছর তিনি ক্ষমতাচ্যুত হন
কিন্তু আমরা দেখছি সমস্যাগুলি অব্যাহত।
তাই প্রশ্নটি ওঠে:
পাল্টানোর জন্য ফক্স নিউজের কি করণীয়?
কি হবে তারা যদি নিয়োগের
প্রক্রিয়াটি একটি মেশিন-লার্নিং
অ্যালগরিদম দিয়ে প্রতিস্থাপন করে?
তা শুনতে ভালো লাগে তাইনা?
এ বিষয় ভাবুন।
তথ্যটি কি হবে?
একটি যুক্তিসঙ্গত পছন্দ হল ফক্স নিউজের
সর্বশেষ ২১ বছরের অ্যাপ্লিকেশন।
যৌক্তিক।
এবং সাফল্যের বর্ণনাটি কি হবে?
একটি যৌক্তিক উত্তর হল,
ফক্স নিউজে কারা সফলতা লাভ করেছে?
ধরুন যে চার বছর কাজ করেছে এবং
অন্তত যার একবার পদোন্নতি হযেছে।
যৌক্তিক শোনাচ্ছে।
এবং তারপর অ্যালগরিদমটিকে শেখানো হবে।
এটা কীভাবে সাফল্যের দিকে পরিচালিত হবে
তা জানতে লোকেদের সন্ধান করতে
প্রশিক্ষণ করা হবে, ঐতিহ্যগত ভাবে
কোন অ্যাপ্লিকেশন সাফল্যলাভ
করেছে সেই বর্ণনার দ্বারা।
এবার ভাবুন কি হবে
আমরা যদি এটা বর্তমানে একদল আবেদনকারীদের
উপর প্রয়োগ করি। তাহলে তা
নারীদের বাদ দিয়ে দেবে কারণ নারীরা
এক সময় সফল ছিলনা।
অন্ধের মতন অ্যালগরিদম প্রয়োগ
করলে তা যৌক্তিক হয়না
তা ন্যায্য হয়না।
তা আমাদের অতীতের ব্যবহারগুলো,
পুনরায় অনুসরণ করে।
তারা স্থিতাবস্তায় স্বয়ংক্রিয় পদ্ধতি
প্রয়োগ করে। যদি পৃথিবীতে সবাই নিখুঁত
হত তাহলে তা
ঠিক ছিল,কিন্তু তা নয়।
এবং বেশিরভাগ সংস্থায় লজ্জাজনক
কোন মামলা হয় না,
তবে সেখানকার তথ্য বিজ্ঞানীদের
তথ্যগুলি অনুসরণ
করতে বলা হয়,
সঠিকতায় গুরুত্ব দিতে বলা হয়।
ভাবুন তার মানে কি।
যেহেতু আমাদের সকলের মধ্যে পক্ষপাতিত্ব
রয়েছে,এর মানে তা কোন রকমের প্রাধান্য
বা ধর্মানুশাসনকে শ্রেণীবদ্ধ করে।
চিন্তাশীল পরীক্ষা নিরীক্ষা,
কারণ আমার তা ভাল লাগে:
একটি সম্পূর্ণ পৃথকীকৃত সমাজ --
জাতিগতভাবে পৃথকিত, সমস্ত শহর, সমস্ত এলাকা
এবং যেখানে আমরা পুলিশকে সংখ্যালঘু
প্রতিবেশীদের
অপরাধের খোঁজে পাঠাই।
গ্রেপ্তারের তথ্য খুব পক্ষপাতদুষ্ট হবে।
তা ছাড়া,আমরা যদি তথ্য বৈজ্ঞানিদের
খুঁজে বার করে
তাদের টাকা দিয়ে ভবিষ্যতে কোন জায়গায়
অপরাধ ঘটবে তা জানার জন্য তাহলে কি হবে?
সংখ্যালঘুদের পরিবেশে।
বা এটা জানতে পরের অপরাধীটি কে হবে?
একজন সংখ্যালঘু ব্যাক্তি।
তথ্য বিজ্ঞানীরা তাদের মডেলের সঠিকতার
সম্পর্কে প্রশংসা করবে,
এবং তারা সঠিক।
কিন্তু,বাস্তবতটা অতটা তীব্র নয় কিন্তু,
অনেক শহরে পৃথকীকরণ বিরাজমান
এবং আমাদের কাছে প্রমান আছে সেই
পক্ষপাতমূলক বিষয় এবং
আমরা সে সব হটস্পটগুলির উপস্থিতি আন্দাজ করি
যেখানে পরের অপরাধটি ঘটবে।
এবং আমরা পূর্বাভাস করি এক একটি অপরাধ,
ব্যক্তিদের অপরাধ।
সংবাদ সংস্থা প্রোপাবলিকা সম্প্রতি একটি
"অপরাধপ্রবণতা ঝুঁকি" অ্যালগোরিদমের দিকে
তাকিয়ে দেখেছে, যা
ফ্লোরিডায় ব্যাবহার করা হয় বিচারকদের দ্বারা
শাস্তি প্রদানের সময়।
বার্নার্ড,বাঁদিকের কালো মানুষটিকে ১০
এ ১০ নম্বর দেওয়া হয়।
ডাইলান, ডান দিকে,পায় ১০ এ ৩।
১০ এ ১০,অর্থাৎ উচ্চ ঝুঁকি।
১০ এ ৩,অর্থাৎ নিম্ন ঝুঁকি।
তাদের দুজনের কাছেই নেশার পদার্থ
পাওয়া যায়। দুজনেরই
অপরাধের তালিকায় নাম,
ডাইলান আগে এক গুরুতর অপরাধে জড়িত ছিল
কিন্তু বার্নার্ড তা নয়।
এটি গুরুত্বপূর্ণ, কারণ আপনার যত
উচ্চতর নম্বর,
আপনার লম্বা শাস্তি পাওয়ার
সম্ভবনাটাও অতটা বেশি।
কি হচ্ছে এটা?
তথ্য পাচার।
এই প্রক্রিয়ার দ্বারা প্রযুক্তিবিজ্ঞানীরা
কালো বক্স অ্যালগোরিদমগুলির
মধ্যে কুশ্রী সত্য লুকিয়ে রাখে
এবং তাদের উদ্দেশ্য বলে;
কল্যাণকামী বলে।
যখন তারা গুপ্ত, গুরুত্বপূর্ণ এবং
ধ্বংসাত্মক হয়,
আমি এই অ্যালগোরিদমগুলির এক নামকরণ করেছি:
"গণিতের দ্বারা ধ্বংসের অস্ত্র।"
(হাসি )
(হাততালি)
তারা সব জায়গায় উপস্থিত,
এবং এটা কোন ভুল নয়।
এগুলি কিছু বেসরকারি সংস্থা যা তাদের
ব্যক্তিগত প্রয়োজনে কিছু ব্যক্তিগত
অ্যালগোরিদম বানাচ্ছে।
এমনকি যেগুলোর বিষয় আমি আলোচনা করলাম
শিক্ষক ও সরকারি পুলিশের বিষয়ে,
সেগুলো কিছু বেসরকারি সংস্থা তৈরী করে
তা সরকারি সংস্থাদের কাছে বিক্রি করেছে।
তারা এটাকে তাদের "গোপন সস" বলে--
তাই আমাদের সেই বিষয়ে জানতে দিতে চায়না।
এটি বেসরকারি ক্ষমতা।
তারা অবর্ণনীয় কিছু ব্যক্তিদের হাতে ক্ষমতা
তুলে দিয়ে লাভ করছে।
আপনারা হয়তো ভাবছেন, যেহুতু
এইগুলো বেসরকারি বিষয়ে
এবং প্রতিযোগিতা রয়েছে,
তাহলে হয়তো স্বাধীন বাজার এই
সমস্যার সমাধান করবে।
তা হবেনা।
অসৎ পথে অনেক টাকা আয় হয়।
এছাড়া,আমরা অর্থনৈতিক যুক্তিসঙ্গত
প্রতিনিধি নই।
আমরা সকলে পক্ষপাতদুষ্ট।
আমরা সবাই বর্ণবাদী সে সকল রূপে যা হয়তো
আমরা চাইনা,
বা হয়তো জানিনা,
কিন্তু আমরা জানি, সামগ্রিকভাবে,
কারণ সমাজতাত্ত্বিকরা বারবার
তাদের পরীক্ষার
দ্বারা তা উল্লেখ করেছেন,
যেখানে তারা একগুচ্ছ চাকরির
আবেদনপত্র পাঠায়,
সকলের সমান যোগ্যতা থাকে
কিন্তু তার মধ্যে কারো
নাম ভাল শোনায় কারো শোনায় না,
এবং এটা সবসময় হতাশাজনক,
ফলাফলটা - সবসময়।
কাজেই আমরাই পক্ষপাতদুষ্ট,
এবং আমরা সেই দোষটা অ্যালগোরিদম
মধ্যে প্রদান করি
কোন তথ্য সংগ্রহ করা হবে তা বলে দিয়ে,
ঠিক যেমন আমি রামেন নুডলস সম্পর্কে
ভাবতে পছন্দ করিনা--
আমি মনে করি এটি অপ্রাসঙ্গিক।
কিন্তু অতীতের প্রথাগুলির উপর নির্ভর থেকে
এবং সফলতার সংজ্ঞা বেছে নিয়ে,আমরা
অ্যালগোরিদমগুলিকে ত্রুটিহীন মেনে নিতে
পারি কি?
আমরা পারিনা। আমাদের উচিত তা যাচাই করা ।
আমাদের ন্যায্যতা যাচাই করতে হবে।
ভাল খবর হল,আমরা তাদের ন্যায্যতা
পরীক্ষা করতে পারি।
অ্যালগরিদমগুলিকে জেরা করা যেতে পারে,
এবং তারা প্রত্যেকবার সত্যিটাই বলবে।
আমরা তা ঠিক করতে পারি।আমরা
তাদের ভাল করে তুলতে পারি।
আমি এটাকে বলি অ্যালগরিদমিক নিরীক্ষা,
এবং আমি এ বিষয়টি আপনাদের বোঝাবো।
প্রথম, তথ্য অখণ্ডতা পরীক্ষা।
যে অপরাধপ্রবণতা ঝুঁকি অ্যালগরিদমগুলির
সম্পর্কে বললাম,
একটি তথ্য অখণ্ডতা পরীক্ষার অর্থ
হবে আমরা এটা শিকার করি যে
মার্কিন যুক্তরাষ্ট্রে, সাদা এবং কালো
দুজনরাই একই পরিমানে নেশা করে
অথচ একটি কালো মানুষের গ্রেফতার হওয়ার
সম্ভবনা বেশি--
এলাকার উপর নির্ভর করে সম্ভবত চার বা
পাঁচ গুণ বেশি।
অন্য ধরণের অপরাধের মধ্যে এই
পক্ষপাতিত্ব কিরকম রয়েছে,
এবং কীভাবে আমরা এর জন্য দায়ী?
দ্বিতীয়ত, আমাদের সাফল্যের সংজ্ঞা
সম্পর্কে ভাবা উচিত,
তা নিরীক্ষা করা দরকার।
মনে আছে-সেই নিয়োগের অ্যালগরিদমের
কথা যা আমি আলোচনা করলাম।
কাউর চার বছর পর যদি একবার
পদোন্নতি হয়?
সে এক সফল কর্মী, কিন্তু এটি একটি
এমন কর্মী যে তার সংস্কৃতির
দ্বারা সমর্থন পায়।
এটিও খুব পক্ষপাতদুষ্ট হতে পারে।
আমাদের সেই দুটি জিনিস আলাদা করা উচিত।
আমরা উদাহরণ হিসাবে একটি অন্ধ
অর্কেস্ট্রা শ্রুতি
কল্পনা করতে পারি।
যারা নিজেদের শিল্প পেশ করছে
তারা একটি চাদরের পিছনে।
আমি ভাবতে চাই
এক দল মানুষ যারা তা শুনছে তারা নির্ণয় নিয়ে
নিয়েছে যে তারা কি শুনতে চায়
এবং কোনটা প্রয়োজনী এবং কোনটা অপ্রয়োজনী,
এবং তারা এর দ্বারা
বিভ্রান্ত হচ্ছেনা।
যখন এরূপ অন্ধ অর্কেস্ট্রা অডিশন শুরু হয়,
অর্কেস্ট্রায় মহিলাদের সংখ্যা পাঁচগুন্ বেড়ে
উঠতে দেখা যায়।
আমাদের পরবর্তী কাজ, সঠিকতা বিবেচনা করা।
এই জায়গায় শিক্ষকদের জন্য তৈরী মূল্য-যুক্ত
মডেলটি অবিলম্বে নিষ্ফল হবে।
কোন এলগোরিদমই সম্পূর্ণ নিখুঁত নয় অবশ্য,
তাই আমাদের উচিত প্রতিটি আলগোরিদমের
ত্রুটি বিবেচনা করা।
এতে ভুল কতটা সাধারণ,
এবং কাদের বিষয় এই মডেল ব্যর্থ হয়?
এই ব্যর্থতার খরচ কি?
এবং অবশেষে, আমাদের অ্যালগরিদমের
দীর্ঘমেয়াদী প্রভাব বিবেচনা করতে হবে,
প্রতিক্রিয়ার বৃত্তমান পথগুলি প্ররোচিত করে।
এটি বিমূর্ত শোনায় ,
ভাবুন যদি ফেইসবুকের প্রকৌশলীরা এটি
ভেবে থাকতেন
আমাদের বন্ধুদের পোস্ট গুলো আমাদের
দেখানোর আগে।
আমার আরও দুটি বার্তা আছে, এক
তথ্য বিজ্ঞানীদের জন্য।
তথ্য বিজ্ঞানীরা: আমাদের সত্যের
সালিশ হতে হবেনা।
আমাদের এই বৃহত্তর সমাজে নৈতিক আলোচনাগুলির
অনুবাদক হওয়া উচিত।
(হাততালি)
এবং বাকিদের জন্য, যারা
তথ্য বৈজ্ঞানিক নন:
এটি অংকের পরীক্ষা নয়।
এটি একটি রাজনৈতিক যুদ্ধ।
আমাদের অ্যালগরিদমের জমিদারির বিরুদ্ধে
দায়বদ্ধতা দাবি করতে হবে।
(হাততালি)
'বিগ ডাটা' এ অন্ধবিশ্বাসের যুগ
শেষ করতে হবে|
ধন্যবাদ |
(হাততালি)