Machine Learning কিভাবে কাজ করে

মেশিন লার্নিং কীভাবে কাজ করে তা শুনতে আপনার কাছে এটি খুব আকর্ষণীয় মনে হতে পারে। তাহলে চলুন জেনে নেওয়া যাক। আপনারাদের মধ্যে সবাই নিশ্চয়ই অনলাইন শপিং করেছেন, যেখানে লক্ষ লক্ষ মানুষ প্রতিদিন ই-কমার্স ওয়েবসাইট ভিজিট করে এবং তাদের পছন্দের জিনিস কেনে। কারণ এখানে আপনি ব্র্যান্ড, রঙ, দামের সীমা এবং আরও অনেক কিছুর সীমাহীন পরিসর দেখতে পাচ্ছেন। কিন্তু আমাদেরও একটা ভালো অভ্যাস আছে যে আমরা আমাদের জিনিসগুলো এভাবে কিনি না, বরং অনেক জিনিস আগে দেখে সঠিকটা বেছে নিই। এটি দেখতে, আমাদের অনেক item খুলতে হবে।

ধরুন, একজনকে ফলো করছেন অনেকদিন ধরে। অফিসের কাজেই। কমপ্লায়েন্সের নিয়ম ধরে। ধারণা করছেন – উনি একটা কাজ করেছেন, তবে প্রমান করতে পারছেন না। বসে আছেন – উনি কবে ওই কাজটা করবেন আবার। অনেক সময় অল্প সময়ের ব্যবধানে ব্যাপারটা না ধরা গেলেও – জিনিসটা ‘স্কেল-আপ’ করলে ঠিক ঠিক পাওয়া যাবে আরো কিছু প্যাটার্ন। আসল কথা হচ্ছে, আমরা হয়তোবা জানি না তার রিদমটা কোথায়। মনে পড়ছে নাকি ডেক্সটারের কথা?
পৃথিবীর প্রতিটা জিনিসের একটা প্যাটার্ন আছে। হয়তোবা কোন কোনটা চোখে পড়ে আমাদের জীবদ্দশায়। আবার, অনেকগুলোর লাগে অনেক অনেক সময়। কয়েক হাজার বছর। তবে, বিশ্বাস করতে হবে – প্রতিটা জিনিসের আছে প্যাটার্ন। থাকতে হবে। দেখুন আমাদের গ্যালাক্সিকে। প্রতিটা গ্রহ, উপগ্রহ ছুটছে তাদের নিজ গতিতে। জোয়ার ভাঁটা। আমাদের শরীরের অথবা এই পৃথিবীর প্রতিটা অনু পরমাণুর ইলেক্ট্রন চলছে নিজের গতিতে। তাদের প্যাটার্নে। একটা হিসেবের মধ্যে।
অনেক ইন্স্যুরেন্স কোম্পানি প্রেডিক্ট করেন তাদের বীমা গ্রহণকারীদের। করতে হয় ব্যবসার খাতিরে। কারণ, আমরা সবাই কারো না কারো প্রোডাক্ট। তারা প্রেডিক্ট করতে চান মানুষটা প্রিমিয়াম দিতে পারবেন কতোদিন। নিরীহ একটা প্রেডিকশন। ট্র্যাক করেন তার প্রতিটা অসুখের খবর, সেটার ট্রিটমেন্ট প্রসিডিউর। কি ঔষুধ নিয়েছেন। কি করেন – চাকরি না অবসর। দেয়া হয় প্রতিটা জিনিসের একটা ওয়েটেজ। বুঝতে পারছেন কি বলতে চাইছি আমি। একটা মানুষের স্বাভাবিক মৃত্যুর হিসেব করতেই পারে তারা। কারণ, তার অসুখ বিসুখের খরচ যোগান তারাই। read more

মেশিন লার্নিং কি এবং কেন

আপনারা অনেকেই মেশিন লার্নিং সম্পর্কে শুনে থাকবেন এবং আপনি যদি জেনে না থাকেন যে মেশিন লার্নিং কি, তাহলে এই আর্টিকেলের মাধ্যমে মেশিন লার্নিং সম্পর্কে আপনি জানতে পারবেন এটি কী এবং কীভাবে কাজ করে। সুতরাং এই নিবন্ধটি সম্পূর্ণ পড়ুন যাতে আপনি মেশিন লার্নিং সম্পর্কে ভালভাবে জানতে পারেন।

মেশিন লার্নিংয়ের এমন অনেক সুবিধা রয়েছে যা আমরা আমাদের দৈনন্দিন কাজে ব্যবহার করি। তাই আজ আমি ভাবলাম মেশিন লার্নিং কী এবং এটি কীভাবে কাজ করে সে সম্পর্কে আপনাকে তথ্য সরবরাহ করব , যা আপনার পক্ষে এটিকে আরও ভালভাবে বুঝতে সাহায্য করবে। তাহলে চলুন দেরি না করে শুরু করা যাক এবং জেনে নেওয়া যাক মেশিন লার্নিং কি?
মেশিন লার্নিং হল কম্পিউটার প্রোগ্রামিংয়ের এমন একটি কৌশল যাতে একটি কম্পিউটার প্রোগ্রাম এমনভাবে ডিজাইন করা হয় যাতে সেই প্রোগ্রামটি নিজের থেকে নতুন জিনিস শিখতে পারে এবং প্রয়োজনের সময় নিজেই সিদ্ধান্ত নিতে পারে। কম্পিউটার ক্ষেত্রের এই কৌশলটিকে মেশিন লার্নিং বলা হয়। যেহেতু মেশিন লার্নিং নিজেই মেশিন লার্নিং করে থাকে। তাই এতে যেকোন অ্যাপ্লিকেশন বা সফটওয়্যার এমনভাবে তৈরি করা হয় যে এটি তার প্রোগ্রামে কোনো ধরনের হস্তক্ষেপ ছাড়াই নতুন জিনিস শিখতে পারে এবং সময় পেলে সেই ডেটা সম্পর্কিত তথ্যের পূর্বাভাস দিতে পারে বা আউটপুট দিতে পারে। এই শিক্ষায় ডেটার পর্যবেক্ষণ থেকে শুরু হয়, উদাহরণস্বরূপ সরাসরি অভিজ্ঞতা, বা নির্দেশনা, ডেটাতে প্যাটার্নগুলি খুঁজে পেতে এবং ভবিষ্যতে আরও ভাল সিদ্ধান্ত নেওয়া সহজ করে তোলে।
Supervised machine learning
এই ধরণের অ্যালগরিদমে, মেশিনটি তার অতীতে যা শিখেছে তা নতুন ডেটাতে প্রয়োগ করে, যাতে তারা লেবেলযুক্ত উদাহরণ ব্যবহার করে যাতে তারা ভবিষ্যতের ঘটনাগুলির পূর্বাভাস দিতে পারে। একটি পরিচিত প্রশিক্ষণ ডেটাসেট বিশ্লেষণ করে, এই শেখার অ্যালগরিদম এক ধরনের অনুমানকৃত ফাংশন তৈরি করে যা সহজেই আউটপুট মান সম্পর্কে ভবিষ্যদ্বাণী করতে পারে। সিস্টেম তাদের পর্যাপ্ত প্রশিক্ষণ দেওয়ার জন্য যে কোনও নতুন ইনপুটের লক্ষ্য সরবরাহ করতে পারে। এই লার্নিং অ্যালগরিদম ফলিত আউটপুটকে সঠিক, উদ্দেশ্যপ্রণোদিত আউটপুটের সাথে তুলনা করে এবং ত্রুটি খুঁজে বের করে যাতে তারা সেই অনুযায়ী মডেলটিকে পরিবর্তন করতে পারে। read more

বিগ ডাটা কি এবং কেন

প্রযুক্তির উন্নয়নের সাথে সাথে আমাদের তথ্যের আদান-প্রদানের পরিধিও দিনদিন বৃদ্ধি পাচ্ছে। আমরা সারাক্ষণ একে অন্যের কাছে বিভিন্ন তথ্য দিচ্ছি বা অন্যের কাছ থেকে তথ্য নিচ্ছি। ইন্টারনেটের বিস্তৃতির পর এই তথ্যের আদান-প্রদানের মাত্রা অবিশ্বাস্য হারে বৃদ্ধি পাচ্ছে।

মানবজাতির সকল সংগ্রহীত তথ্যকে এক করলে ঠিক কি পরিমাণ ডাটা/তথ্য হবে তা কি জানা সম্ভব? নিখুঁতভাবে জানা না গেলেও কিছুটা আন্দাজ করা যায়। আদিকাল থেকে ২০০৩ সাল পর্যন্ত আমাদের জমাকৃত ডাটার পরিমাণ প্রায় ৫ বিলিয়ন গিগাবাইট। একটা সময় ছিলো যখন আমরা আমাদের সবকিছুই কাগজে লিখে রাখতাম। কখন খেতে যাবো, কবে মিটিং, কখন শপিং এ যাবো এসব টু ডু লিস্টগুলো কাগজে কিংবা ডায়েরীতে লিখে রাখতাম। এমনকি স্যারের কাছে পড়ার লেকচার থেকে শুরু করে দুধওয়ালা কিংবা পত্রিকার হকারের পেপার দেয়ার হিসেব ও!
প্রযুক্তির অভাবনীয় উন্নয়ন আমাদের জীবন করেছে সহজ এবং স্বাচ্ছন্দ্যময়। তথ্য-আদান প্রদানের পরিধি দিনের পর দিন বৃদ্ধি পাচ্ছে। সারাক্ষণ একে অন্যের কাছে বিভিন্ন তথ্য দিচ্ছি বা অন্যের কাছ থেকে তথ্য নিচ্ছি। যেদিন থেকেই ইন্টারনেট নামক ধারনাটি আমাদের মধ্যে বিকশিত হলো, সেদিন থেকেই এই তথ্য আদান-প্রদানের মাত্রা অবিশ্বাস্য হারে বৃদ্ধি পাচ্ছে। আচ্ছা আমরা যদি জানার চেষ্টা করি মানবজাতির সকল সংগ্রহীত ডাটার পরিমাণ কেমন! হুবহু বলতে না পারলেও আন্দাজ করা যায় ২০০৩ সাল পর্যন্ত আমাদের জমাকৃত ডাটার পরিমাণ প্রায় ৫ বিলিয়ন গিগাবাইট। বর্তমানে ইন্টারনেট এবং বিভিন্ন সোশ্যাল মিডিয়ার বদৌলতে প্রতিদিন ডাটার পরিমাণ কয়েকগুণ করে বৃদ্ধি পাচ্ছে। বর্তমানে ইন্টারনেট, বিভিন্ন সোশ্যাল মিডিয়াসহ প্রযুক্তির সহযোগিতায় বিভিন্ন মাধ্যমে আমাদের তথ্য বা ডাটার পরিমাণ খুব দ্রুত বৃদ্ধি পেতে থাকে।
২০১১ সালে প্রতি দুই দিনেই ৫ বিলিয়ন গিগাবাইট পরিমাণ ডাটা তৈরি করেছি আমরা। ২০১৩ সালে এই পরিমাণ ডাটা তৈরি হয়েছে প্রতি দশ মিনিটে! এত বিপুল পরিমাণ ডাটা আমরা গত কয়েক বছরেই তৈরি করেছি যে তা কাজে লাগিয়ে আমরা আমাদের জীবনযাপনের মান উন্নত করতে পারব। কিন্তু এই ডাটা কাজে লাগানো খুব সহজ নয়।
এই বিপুল পরিমাণ ডাটাকে একত্রে বলা হয় বিগ ডাটা। বিগ ডাটা দ্বারা প্রচুর পরিমাণ ডাটার সমষ্টিকে বোঝায়, এত বেশি ডাটা যে সেগুলোকে আমাদের পরিচিত কম্পিউটার দ্বারা বিশ্লেষণ করা সম্ভব নয়। ডাটা অ্যানালিস্টদের জন্য এটি স্বর্ণখনির চেয়ে কম কিছু নয়।
চলুন একটু পেছনে ফিরে যাই এবং দেখে নেই, টেকনোলজি ওয়ার্ল্ড কিভাবে গত শতক থেকে রাতারাতি চেঞ্জ হয়ে হয়ে গেছে :
১. বর্তমান বিশ্বের শতকরা ৮০ ভাগ ইনফরমেশন এখন আনস্ট্রাকচার্ড(Unstructured).
২. আনস্ট্রাকচার্ড ডাটা স্ট্রাকচার্ড(Structured) ডাটা থেকে প্রায় ১৫ গুণ হারে বাড়ছে।
৩. ইনফরমেশনগুলো এক্সেস পাওয়া যেন সবারগণতান্ত্রিক অধিকার হয়ে দাঁড়িয়েছে , মানে সবার জন্য ইনফরমেশন গুলো এভেইল্যাবল।
৪. ২০২০ সালের মধ্যে ডাটা ক্রিয়েটিং রেট হবে ৪৪ট্রিলিয়ন গিগাবাইটস। [ফোর্বস ]
আর এই বিভিন্ন ওয়েবে, সেন্সরের মাধ্যমে, পরিবেশগত এবং আমাদের দ্বারা সৃষ্ট সব ডাটার সমষ্টিকে বলা হয় বিগ ডাটা। এই ডাটার পরিমাণ এত বেশি যে সেগুলোকে গুটিকয়েক সাধারণ কম্পিউটার দ্বারা বিশ্লেষণ করা অসম্ভব (আংশিকভাবে সম্ভব হলেও তা বেশ কষ্টসাধ্য)। এসব বিষয় নিয়ে কাজ করে থাকেন ডাটা সায়েন্টিষ্টরা, নানান রিসার্চার, যারা এসব ডাটাকে অ্যানালাইসিস করেন।
প্রশ্ন হতে পারে যে, কোন ধরনের তথ্য বা ডাটাকে বিগ ডাটার আওতায় ফেলা হবে? বিগ ডাটার মাঝে থাকতে পারে- read more