মেশিন লার্নিং কি এবং কেন

আপনারা অনেকেই মেশিন লার্নিং সম্পর্কে শুনে থাকবেন এবং আপনি যদি জেনে না থাকেন যে মেশিন লার্নিং কি, তাহলে এই আর্টিকেলের মাধ্যমে মেশিন লার্নিং সম্পর্কে আপনি জানতে পারবেন এটি কী এবং কীভাবে কাজ করে। সুতরাং এই নিবন্ধটি সম্পূর্ণ পড়ুন যাতে আপনি মেশিন লার্নিং সম্পর্কে ভালভাবে জানতে পারেন।

মেশিন লার্নিংয়ের এমন অনেক সুবিধা রয়েছে যা আমরা আমাদের দৈনন্দিন কাজে ব্যবহার করি। তাই আজ আমি ভাবলাম মেশিন লার্নিং কী এবং এটি কীভাবে কাজ করে সে সম্পর্কে আপনাকে তথ্য সরবরাহ করব , যা আপনার পক্ষে এটিকে আরও ভালভাবে বুঝতে সাহায্য করবে। তাহলে চলুন দেরি না করে শুরু করা যাক এবং জেনে নেওয়া যাক মেশিন লার্নিং কি?
মেশিন লার্নিং হল কম্পিউটার প্রোগ্রামিংয়ের এমন একটি কৌশল যাতে একটি কম্পিউটার প্রোগ্রাম এমনভাবে ডিজাইন করা হয় যাতে সেই প্রোগ্রামটি নিজের থেকে নতুন জিনিস শিখতে পারে এবং প্রয়োজনের সময় নিজেই সিদ্ধান্ত নিতে পারে। কম্পিউটার ক্ষেত্রের এই কৌশলটিকে মেশিন লার্নিং বলা হয়। যেহেতু মেশিন লার্নিং নিজেই মেশিন লার্নিং করে থাকে। তাই এতে যেকোন অ্যাপ্লিকেশন বা সফটওয়্যার এমনভাবে তৈরি করা হয় যে এটি তার প্রোগ্রামে কোনো ধরনের হস্তক্ষেপ ছাড়াই নতুন জিনিস শিখতে পারে এবং সময় পেলে সেই ডেটা সম্পর্কিত তথ্যের পূর্বাভাস দিতে পারে বা আউটপুট দিতে পারে। এই শিক্ষায় ডেটার পর্যবেক্ষণ থেকে শুরু হয়, উদাহরণস্বরূপ সরাসরি অভিজ্ঞতা, বা নির্দেশনা, ডেটাতে প্যাটার্নগুলি খুঁজে পেতে এবং ভবিষ্যতে আরও ভাল সিদ্ধান্ত নেওয়া সহজ করে তোলে।
Supervised machine learning
এই ধরণের অ্যালগরিদমে, মেশিনটি তার অতীতে যা শিখেছে তা নতুন ডেটাতে প্রয়োগ করে, যাতে তারা লেবেলযুক্ত উদাহরণ ব্যবহার করে যাতে তারা ভবিষ্যতের ঘটনাগুলির পূর্বাভাস দিতে পারে। একটি পরিচিত প্রশিক্ষণ ডেটাসেট বিশ্লেষণ করে, এই শেখার অ্যালগরিদম এক ধরনের অনুমানকৃত ফাংশন তৈরি করে যা সহজেই আউটপুট মান সম্পর্কে ভবিষ্যদ্বাণী করতে পারে। সিস্টেম তাদের পর্যাপ্ত প্রশিক্ষণ দেওয়ার জন্য যে কোনও নতুন ইনপুটের লক্ষ্য সরবরাহ করতে পারে। এই লার্নিং অ্যালগরিদম ফলিত আউটপুটকে সঠিক, উদ্দেশ্যপ্রণোদিত আউটপুটের সাথে তুলনা করে এবং ত্রুটি খুঁজে বের করে যাতে তারা সেই অনুযায়ী মডেলটিকে পরিবর্তন করতে পারে। read more

বিগ ডাটা কি এবং কেন

প্রযুক্তির উন্নয়নের সাথে সাথে আমাদের তথ্যের আদান-প্রদানের পরিধিও দিনদিন বৃদ্ধি পাচ্ছে। আমরা সারাক্ষণ একে অন্যের কাছে বিভিন্ন তথ্য দিচ্ছি বা অন্যের কাছ থেকে তথ্য নিচ্ছি। ইন্টারনেটের বিস্তৃতির পর এই তথ্যের আদান-প্রদানের মাত্রা অবিশ্বাস্য হারে বৃদ্ধি পাচ্ছে।

মানবজাতির সকল সংগ্রহীত তথ্যকে এক করলে ঠিক কি পরিমাণ ডাটা/তথ্য হবে তা কি জানা সম্ভব? নিখুঁতভাবে জানা না গেলেও কিছুটা আন্দাজ করা যায়। আদিকাল থেকে ২০০৩ সাল পর্যন্ত আমাদের জমাকৃত ডাটার পরিমাণ প্রায় ৫ বিলিয়ন গিগাবাইট। একটা সময় ছিলো যখন আমরা আমাদের সবকিছুই কাগজে লিখে রাখতাম। কখন খেতে যাবো, কবে মিটিং, কখন শপিং এ যাবো এসব টু ডু লিস্টগুলো কাগজে কিংবা ডায়েরীতে লিখে রাখতাম। এমনকি স্যারের কাছে পড়ার লেকচার থেকে শুরু করে দুধওয়ালা কিংবা পত্রিকার হকারের পেপার দেয়ার হিসেব ও!
প্রযুক্তির অভাবনীয় উন্নয়ন আমাদের জীবন করেছে সহজ এবং স্বাচ্ছন্দ্যময়। তথ্য-আদান প্রদানের পরিধি দিনের পর দিন বৃদ্ধি পাচ্ছে। সারাক্ষণ একে অন্যের কাছে বিভিন্ন তথ্য দিচ্ছি বা অন্যের কাছ থেকে তথ্য নিচ্ছি। যেদিন থেকেই ইন্টারনেট নামক ধারনাটি আমাদের মধ্যে বিকশিত হলো, সেদিন থেকেই এই তথ্য আদান-প্রদানের মাত্রা অবিশ্বাস্য হারে বৃদ্ধি পাচ্ছে। আচ্ছা আমরা যদি জানার চেষ্টা করি মানবজাতির সকল সংগ্রহীত ডাটার পরিমাণ কেমন! হুবহু বলতে না পারলেও আন্দাজ করা যায় ২০০৩ সাল পর্যন্ত আমাদের জমাকৃত ডাটার পরিমাণ প্রায় ৫ বিলিয়ন গিগাবাইট। বর্তমানে ইন্টারনেট এবং বিভিন্ন সোশ্যাল মিডিয়ার বদৌলতে প্রতিদিন ডাটার পরিমাণ কয়েকগুণ করে বৃদ্ধি পাচ্ছে। বর্তমানে ইন্টারনেট, বিভিন্ন সোশ্যাল মিডিয়াসহ প্রযুক্তির সহযোগিতায় বিভিন্ন মাধ্যমে আমাদের তথ্য বা ডাটার পরিমাণ খুব দ্রুত বৃদ্ধি পেতে থাকে।
২০১১ সালে প্রতি দুই দিনেই ৫ বিলিয়ন গিগাবাইট পরিমাণ ডাটা তৈরি করেছি আমরা। ২০১৩ সালে এই পরিমাণ ডাটা তৈরি হয়েছে প্রতি দশ মিনিটে! এত বিপুল পরিমাণ ডাটা আমরা গত কয়েক বছরেই তৈরি করেছি যে তা কাজে লাগিয়ে আমরা আমাদের জীবনযাপনের মান উন্নত করতে পারব। কিন্তু এই ডাটা কাজে লাগানো খুব সহজ নয়।
এই বিপুল পরিমাণ ডাটাকে একত্রে বলা হয় বিগ ডাটা। বিগ ডাটা দ্বারা প্রচুর পরিমাণ ডাটার সমষ্টিকে বোঝায়, এত বেশি ডাটা যে সেগুলোকে আমাদের পরিচিত কম্পিউটার দ্বারা বিশ্লেষণ করা সম্ভব নয়। ডাটা অ্যানালিস্টদের জন্য এটি স্বর্ণখনির চেয়ে কম কিছু নয়।
চলুন একটু পেছনে ফিরে যাই এবং দেখে নেই, টেকনোলজি ওয়ার্ল্ড কিভাবে গত শতক থেকে রাতারাতি চেঞ্জ হয়ে হয়ে গেছে :
১. বর্তমান বিশ্বের শতকরা ৮০ ভাগ ইনফরমেশন এখন আনস্ট্রাকচার্ড(Unstructured).
২. আনস্ট্রাকচার্ড ডাটা স্ট্রাকচার্ড(Structured) ডাটা থেকে প্রায় ১৫ গুণ হারে বাড়ছে।
৩. ইনফরমেশনগুলো এক্সেস পাওয়া যেন সবারগণতান্ত্রিক অধিকার হয়ে দাঁড়িয়েছে , মানে সবার জন্য ইনফরমেশন গুলো এভেইল্যাবল।
৪. ২০২০ সালের মধ্যে ডাটা ক্রিয়েটিং রেট হবে ৪৪ট্রিলিয়ন গিগাবাইটস। [ফোর্বস ]
আর এই বিভিন্ন ওয়েবে, সেন্সরের মাধ্যমে, পরিবেশগত এবং আমাদের দ্বারা সৃষ্ট সব ডাটার সমষ্টিকে বলা হয় বিগ ডাটা। এই ডাটার পরিমাণ এত বেশি যে সেগুলোকে গুটিকয়েক সাধারণ কম্পিউটার দ্বারা বিশ্লেষণ করা অসম্ভব (আংশিকভাবে সম্ভব হলেও তা বেশ কষ্টসাধ্য)। এসব বিষয় নিয়ে কাজ করে থাকেন ডাটা সায়েন্টিষ্টরা, নানান রিসার্চার, যারা এসব ডাটাকে অ্যানালাইসিস করেন।
প্রশ্ন হতে পারে যে, কোন ধরনের তথ্য বা ডাটাকে বিগ ডাটার আওতায় ফেলা হবে? বিগ ডাটার মাঝে থাকতে পারে- read more

সাইবার সিকিউরিটি কি ? Cyber security কেন জরুরি

ইন্টারনেটে হ্যাকিং বা ম্যালওয়ার অ্যাটাক থেকে বাচতে যেসব ব্যাবস্থা গ্রহণ করা হয় সেগুলোই সাইবার সিকিউরিটির মধ্যে পরে। ওয়েবসাইট বা সিস্টেমে অবৈধ অনুপ্রবেশ বন্ধ করতে সাইবার সিকিউরিটি সম্পর্কে জানা প্রয়োজন। যখন কেউ আপনার কম্পিউটার বা স্মার্টফোনকে বাইরে থেকে অ্যাক্সেস নেয়ার চেষ্টা করবে তবে তা হ্যাকিং এর আওতায় পরে। আর এধরনের জিনিস প্রতিহত করতে সাইবার সিকিউরিটি সম্পর্কে আপনাকে অভিজ্ঞ হতে হবে। সাইবার সিকিউরিটি সম্পর্কে বুঝতে হলে আপনাকে আগে বুঝতে হবে আপনি আসলে কোন ধরনের সমস্যার মুখোমুখি হতে পারেন। অর্থাৎ কি থেকে আপনাকে সুরক্ষিত থাকতে হবে। বিভিন্ন electronic device এবং ইন্টারনেট এর মাধ্যমে আমরা প্রত্যেকেই প্রায় প্রত্যেক দিন বিভিন্ন রকমের ডাটা গুলোর আদান-প্রদান বা শেয়ার করে থাকি। এক্ষেত্রে, প্রচুর ধরণের সাইবার অপরাধ (সাইবার ক্রাইম) হওয়ার কথা আপনারা হয়তো অবশই শুনেছেন যেখানে একটি network বা internet এবং একটি electronic device এর মাধ্যমে বিভিন্ন ধরণের অপরাধ গুলোকে করা হয়।

কিছু সাধারণ সাইবার অপরাধ গুলো যেমন, read more