হ্যালো টেকটিউনসবাসি, কেমন আছেন সবাই? আশাকরি, প্রযুক্তির এই দ্রুতগতির দুনিয়ায় আপনারা সবাই ভালো আছেন এবং নতুন কিছু জানার জন্য সবসময় প্রস্তুত। টেকনোলজির জগতে প্রতিদিনই নতুন কিছু না কিছু ঘটছে, আর আমরা যারা টেক-প্রেমী, তাদের জন্য এটা যেন এক দারুণ একটা সময়।
গতকাল এমন একটি ঘটনা ঘটেছে, যা Artificial Intelligence (AI)-এর ইতিহাসে একটি নতুন দিগন্ত উন্মোচন করেছে। চীন এমন একটি AI Model Release করেছে, যা কিনা Open AI-এর মতো প্রভাবশালী কোম্পানিকেও চ্যালেঞ্জ জানাচ্ছে! ভাবছেন, এটা আবার কী? তাহলে আর দেরি না করে, চলুন, এর বিস্তারিত জেনে নিই।
গতকাল, China Deepseek R1 নামে একটি অত্যাধুনিক (State-Of-The-Art), সম্পূর্ণ বিনামূল্যে (Free) এবং Open Source Chain Of Thought Reasoning Model প্রকাশ করেছে।
এখন, Open Source মানে কী? Open Source মানে হলো, এই Model-টির Source Code যে কেউ দেখতে পারবে, ব্যবহার করতে পারবে এবং নিজের প্রয়োজন অনুযায়ী পরিবর্তনও করতে পারবে। এটি Software Development-এর একটি গুরুত্বপূর্ণ দিক, যেখানে Collaboration-এর মাধ্যমে Innovation-কে আরও Fast করা যায়। আর সবচেয়ে মজার বিষয় হলো, এর Performance নাকি Open AI-এর O1 Model-এর সাথে তুলনীয়। যারা AI নিয়ে কাজ করেন, তারা হয়তো জানেন, Open AI-এর O1 Model ব্যবহার করতে গেলে প্রতি মাসে $200 ডলারের মতো খরচ করতে হয়। যেখানে Deepseek R1 একদম Free! ভাবুন একবার, কতটা পার্থক্য! এটা যেন প্রযুক্তির Democratisation-এর একটি দারুণ উদাহরণ।
এখন, টেক-ওয়ার্ল্ডে (Tech World) আপনারা দুই ধরনের People-কে দেখতে পাবেন। একদিকে Pessimists বা হতাশাবাদীরা, যাদের ধারণা AI নিয়ে অনেক বেশি Hype করা হচ্ছে, এবং এটি Gpt 3.5-এর পর আর বেশি এগোবে না। তাদের মতে, AI এখন একটি Plateau-তে পৌঁছে গেছে, যেখানে Innovation-এর গতি কমে গেছে।
অন্যদিকে, Optimists-রা বা আশাবাদী মনে করেন, আমরা এমন এক Artificial Super Intelligence-এর খুব কাছে চলে এসেছি, যা Humanity-কে Ray K-এর Technological Singularity-এর দিকে নিয়ে যাবে।
Technological Singularity মানে হলো, এমন একটি Hypothetical Scenario, যেখানে Technology এতটাই উন্নত হয়ে যাবে, যা Human Intelligence-কেও ছাড়িয়ে যাবে, এবং এর ফলে Society-তে Radical Changes আসবে।
সত্যি বলতে, এই মুহূর্তে ভবিষ্যৎ কোন দিকে যাচ্ছে, তা বলা খুবই কঠিন। তবে, একটা কথা মনে রাখতে হবে, Pessimists-দের কথা শুনতে Smart মনে হলেও, Optimists-রাই কিন্তু শেষ পর্যন্ত Money কামায়। তাই, আমাদের Optimists-দের দলে থাকাই ভালো, কী বলেন?
তবে হ্যাঁ, মাঝে মাঝে AI Optimist হওয়াটা কঠিন। কারণ, তখন Sam Altman-এর মতো Hype Jedi (হাইপ জেডি) এবং Open AI-এর মতো Closed AI Companies-গুলোর উপর ভরসা করতে হয়। আমরা সবাই জানি, এই Company-গুলো সবসময় নতুন নতুন চমক নিয়ে আসে, কিন্তু তাদের Technology-র ভেতরের খবর সবসময় আমাদের কাছে অজানা থেকে যায়।
China এক্ষেত্রে যেন একটা দারুণ Gift নিয়ে এসেছে। Tiktok-এর Ban তুলে নেওয়ার সাথে সাথেই, তারা Deepseek R1 Release করে সারা World-কে তাক লাগিয়ে দিয়েছে। এটা যেন এক ঢিলে দুই পাখি মারার মতো!
একদিকে যেমন তারা Tiktok-এর Ban তুলে নেওয়ার জন্য সমালোচিত হচ্ছিল, তেমনি অন্যদিকে Deepseek R1 Release করে তারা প্রযুক্তির জগতে নিজেদের Dominance প্রমাণ করলো।
অফিসিয়াল ওয়েবসাইট @ Deepseek
যে কোন AI মডেল চালতে হলে জানতে হবে কিভাবে একজন Senior Prompt Engineer-এর মতো Deepseek R1 ব্যবহার করতে হয়।
আপনারা হয়তো ভাবছেন, “Prompt Engineer” আবার কী? Prompt Engineer হলেন তারা, যারা AI Model-গুলোকে ঠিকভাবে কাজ করানোর জন্য সঠিক Prompt (অর্থাৎ, প্রশ্ন বা নির্দেশ) লিখতে পারেন। Deepseek R1 একটি MIT-Like Licensed Chain of Thought Model। এর মানে হলো, এটি MIT-এর মতো একটি বিখ্যাত Institution-এর License-এর অধীনে তৈরি করা হয়েছে। MIT মানে হলো Massachusetts Institute Of Technology, যা Technology-র Research-এর জন্য সারা বিশ্বে পরিচিত। এবং এটি আপনারা Commercially ব্যবহার করতে পারবেন। অর্থাৎ, আপনারা এটি ব্যবহার করে Business-ও করতে পারবেন, নতুন Application তৈরি করতে পারবেন।
এই Model-টি এমন এক সময়ে Release হয়েছে, যখন Sam Altman Trump-এর Inauguration-এ ব্যস্ত ছিলেন। Inauguration-এর মতো একটি গুরুত্বপূর্ণ Event-এ Sam Altman-এর উপস্থিতি বুঝিয়ে দেয়, AI Industry-তে কতটা Power Play চলছে।
একটি Meme Template খুব Popular হয়েছে, যেখানে Zuckerberg-কে Jeff Bezos-এর Artificial Binary Code-এ Rack Overflow Detect করতে দেখা যাচ্ছে। এটা আসলে টেক দুনিয়ার ভেতরের রসিকতা, যা আমরা যারা টেক-প্রেমী, তারাই বুঝি। Rack Overflow মানে হলো, যখন কোনো Computer System-এ Data রাখার জায়গা শেষ হয়ে যায়। যাই হোক, এই Meme-টি আসলে বোঝাতে চাইছে, Technology-র দুনিয়ায় কে কার থেকে এগিয়ে, সেই প্রতিযোগিতা চলছে।
আর এসবের মাঝে, Sam Altman সম্প্রতি AI Optimists-দের হতাশ করে বলেছেন যে, AI Hype এখন নিয়ন্ত্রণের বাইরে চলে গেছে, এবং তারা Internal ভাবে AGI (Artificial General Intelligence) Achieve করতে পারেনি। AGI মানে হলো, এমন এক AI, যা মানুষের মতো যেকোনো কাজ করতে পারে, মানুষের মতো Reasoning Ability এবং Problem-Solving Skills থাকে।
আর Chatgpt-এর Buggy Behavior দেখলেই বোঝা যায়, এখনো AGI Achieve করতে অনেক দেরি। যেমন, সম্প্রতি একজন Security Researcher দেখিয়েছেন, কিভাবে Chatgpt ব্যবহার করে Websites-এ Dos Attack করা যায়। Dos Attack মানে হলো, একটি Website-এ একসাথে অনেক Request পাঠিয়ে দেওয়া, যার ফলে Website-টি কাজ করা বন্ধ করে দেয়, Service Disrupt করে।
কয়েক মাস আগে, Open AI O1 Model Release করার মাধ্যমে AI Race-এ এক ধাপ এগিয়ে গিয়েছিল। কিন্তু, Open Source Community খুব তাড়াতাড়ি Catch Up করেছে। Open Source মানে হলো, Technology-র Development-এ সবাই একসাথে কাজ করে, Code Share করে এবং একে অপরের উন্নতিতে সাহায্য করে। Deepseek R1 তার সবচেয়ে বড় উদাহরণ। এর Benchmarks দেখলে বোঝা যায়, এটি Open AI O1-এর সাথে সমানে পাল্লা দিচ্ছে, এমনকি কিছু ক্ষেত্রে যেমন Math এবং Software Engineering-এ এর Performance আরও ভালো। Benchmarks হলো, বিভিন্ন Test-এর মাধ্যমে Ai Model-এর Performance Measure করার একটি উপায়, যা Ai Model-গুলোর Effectiveness যাচাই করতে সাহায্য করে।
তবে হ্যাঁ, Benchmarks-এর উপর সবসময় ভরসা করা উচিত না। কারণ, অনেক সময় Benchmarks-গুলো Biased হতে পারে, মানে তাদের Results Manipulate করা যেতে পারে। সম্প্রতি Epic AI নামে একটি Company, যারা Math Benchmark Provide করে, তারা জানিয়েছে যে, তারা Open AI দ্বারা Funded। যা কিনা Conflict Of Interest-এর মতো মনে হয়। Conflict Of Interest মানে হলো, যখন কোনো Company বা ব্যক্তি এমন কোনো কাজ করে, যেখানে তাদের ব্যক্তিগত স্বার্থ জড়িত থাকে, এবং তার ফলে নিরপেক্ষতা বজায় রাখা সম্ভব হয় না, এবং Unbiased Results আশা করা যায় না।
তবে Benchmarks নিয়ে বেশি ভাবার কিছু নেই, আমি Vibes-এর উপর নির্ভর করি। Vibes মানে হলো, কোনো Technology ব্যবহার করার সময় কেমন লাগে, সেটার উপর নির্ভর করা। অর্থাৎ, Practical Use-এর উপর বেশি জোর দেওয়া।
তাহলে চলুন, Deepseek R1 Try করা যাক! এদের একটি Web-Based Ui (User Interface) আছে, যেখানে আপনারা সরাসরি Model-টি ব্যবহার করতে পারবেন। তবে আপনারা চাইলে Hugging Face-এর মতো Platform-এও ব্যবহার করতে পারেন। Hugging Face হলো এমন একটি Platform, যেখানে AI Model-গুলো Share করা হয়, এবং Developer-রা একে অপরের সাথে Collaborate করতে পারে।
অথবা আপনারা Olama-এর মতো Tool ব্যবহার করে Locally Download করতে পারেন। Olama হলো, একটি Tool, যার মাধ্যমে আপনারা Locally AI Model Run করতে পারবেন, কোনো Cloud Server-এর উপর নির্ভর না করে।
আমি এটির 7 Billion Parameter Model Download করেছি, যার সাইজ প্রায় 4.7 Gb। এখন, Parameter মানে কী? Parameter হলো, Model-এর Internal Configuration, যা Model-এর Behaviour-কে Control করে। যত বেশি Parameter, Model তত বেশি Complex এবং Intelligent হবে। তবে, এর Full Glory ব্যবহার করতে হলে, মানে সবচেয়ে ভালো Performance পেতে হলে, 400 Gb-এর বেশি Space এবং High-End Hardware লাগবে। কারণ, এটির 671 Billion Parameter Model রয়েছে। তবে, O1 Mini-এর মতো Performance চাইলে, আপনারা 32 Billion Parameter Model ব্যবহার করতে পারেন।
Deepseek R1-এর একটা Special Feature হলো, এটি Supervised Fine Tuning ব্যবহার না করে Direct Reinforcement Learning ব্যবহার করে। Supervised Fine Tuning-এ, Model-টিকে অনেক Data এবং Correct Answer দেওয়া হয়, যার মাধ্যমে Model-টি শেখে। কিন্তু Direct Reinforcement Learning-এ, Model-টিকে শুধু Problem দেওয়া হয়, এবং Model-টি নিজে থেকেই চেষ্টা করে Solution বের করে। অনেকটা মানুষের Learning Process-এর মতো। Deepseek একটি Paper Release করেছে, যেখানে Reinforcement Learning Algorithm নিয়ে বিস্তারিত বলা হয়েছে। Algorithm মানে হলো, কোনো Problem Solve করার জন্য Step-By-Step Procedure, যা Computer-কে Follow করতে হয়।
Algorithm-টি দেখতে একটু জটিল হলেও, মূল Concept হলো – AI প্রতিটি Problem-এর জন্য Multipleবার Output Generate করার চেষ্টা করে। Output মানে হলো, Model-এর দেওয়া Answer। এরপর Output-গুলোকে Reward Score দেওয়া হয়। Model সেই Score-এর উপর ভিত্তি করে নিজের Approach Adjust করে। অর্থাৎ, যে Answer-এর Score বেশি, Model সেই Approach-টি মনে রাখে এবং ভবিষ্যতে সেই Approach-টি ব্যবহার করে। এটা যেন Trial And Error-এর মাধ্যমে শেখার মতো, যেখানে Model নিজে থেকেই শিখতে পারে।
Chain Of Thought Model ব্যবহার করার সময় Prompt যতটা সম্ভব Concise এবং Direct রাখা উচিত। Prompt মানে হলো, Model-কে দেওয়া Instruction। R1 বা O1-এর মতো Model-গুলো নিজেরাই চিন্তা করে Solution বের করে। যেমন, যদি আমি Model-টিকে Math Problem Solve করতে বলি, তাহলে এটি প্রথমে Thinking Stepগুলো দেখাবে, তারপর Actual Solution দেবে। Thinking Step মানে হলো, Model-টি কিভাবে Problem-টি Solve করছে, সেই Process-টি Step-By-Step দেখানো। এর ফলে User-রা বুঝতে পারে, Model-টি কিভাবে একটি Solution-এ পৌঁছাচ্ছে।
আপনারা হয়তো ভাবছেন, কখন Chain Of Thought Model ব্যবহার করবেন? মূলত, এই Model-গুলো Complex Problem Solving, Advanced Math Problems, Puzzles বা Coding Problems-এর মতো ক্ষেত্রগুলোতে ভালো কাজ করে। যেখানে Detailed Planning-এর প্রয়োজন। যেখানে অনেকগুলো Step-এর মাধ্যমে কোনো Problem Solve করতে হয়, সেখানে এই Model-গুলো খুব Useful।
আজ এই পর্যন্তই। ততক্ষনের জন্য, AI নিয়ে Explore করতে থাকুন এবং নতুন কিছু শিখতে থাকুন!
আমি রায়হান ফেরদৌস। বিশ্বের সর্ববৃহৎ বিজ্ঞান ও প্রযুক্তির সৌশল নেটওয়ার্ক - টেকটিউনস এ আমি 11 বছর 5 মাস যাবৎ যুক্ত আছি। টেকটিউনস আমি এ পর্যন্ত 203 টি টিউন ও 131 টি টিউমেন্ট করেছি। টেকটিউনসে আমার 73 ফলোয়ার আছে এবং আমি টেকটিউনসে 1 টিউনারকে ফলো করি।