সাম্প্রতিক সময়ের সবচেয়ে জনপ্রিয় এবং শক্তিশালী এআই টুল ChatGPT ২০২২ সালের ৩০ নভেম্বর প্রকাশিত হয়। এটি রিলিজ হওয়ার পর থেকে প্রযুক্তি বিশ্বে অনেক বেশি আলোচনার জন্ম দেয়। আর এর কারণ হলো, এটি মানুষের বিভিন্ন Text Prompt থেকে যথাযথ ও আকর্ষণীয় রেসপন্স দিতে পারে।
OpenAI এর চ্যাটজিপিটি সত্যিকার অর্থেই এআই এর জগতে একটি নতুন বিপ্লব নিয়ে এসেছে। অন্যান্যদের মতো আপনিও হয়তোবা ইতিমধ্যেই ChatGPT ব্যবহার করে থাকতে পারেন। বর্তমান সময়ের এটি একটি জনপ্রিয় এবং বহুল ব্যবহৃত এআই টুল। কিন্তু এর মধ্যেই আমাদের সামনে আরো একটি শক্তিশালী এআই টুল আসতে চলেছে, আর তা হল Sora AI।
Sora AI হল একটি টেক্সট-টু-ভিডিও জেনারেটিভ AI মডেল, যা মূলত OpenAI দ্বারা তৈরি করা হয়েছে। ওপেনএআই হলো একটি আর্টিফিশিয়াল ইন্টেলিজেন্স নিয়ে কাজ করা প্রযুক্তি প্রতিষ্ঠান, যার এখনো পর্যন্ত বেশ কয়েকটি সার্ভিস উন্মুক্ত করা হয়েছে। এগুলোর মধ্যে অন্যতম হলো, ChatGPT ও DALL·E। যেখানে, এই প্ল্যাটফর্ম গুলোতে Text Prompts ব্যবহার করে বিভিন্ন সমস্যার সমাধান করা এবং ইমেজ তৈরি করে নেওয়া যায়।
OpenAI এর Sora AI ব্যবহার করার মাধ্যমে একজন ব্যবহারকারী Text Prompts দিয়ে একইভাবে ভিডিও তৈরি করে নিতে পারেন। এটি ব্যবহারকারীদেরকে সর্বোচ্চ এক মিনিট পর্যন্ত ভিডিও তৈরি করতে দেয়।
সোরা এআই ব্যবহারকারীদের বর্ণনার উপর ভিত্তি করে জটিল সব দৃশ্য, চরিত্র এবং নির্দিষ্ট স্থানের বিবরণসহ ভিডিও তৈরি করতে পারে। Sora AI একটি ইমেজ থেকে আইডিয়া নিয়ে ভিডিও তৈরি করতে পারে এবং সেই সাথে এটি এনিমেটেড কনটেন্ট ও তৈরি করতে সক্ষম।
যাইহোক, ওপেনএআই এর তৈরি এই Sora AI এখনো পর্যন্ত ডেভলপমেন্ট পর্যায়ে রয়েছে এবং এটি এখনো সবার জন্য উন্মুক্ত করে দেওয়া হয়নি। বরং, এটি শুধুমাত্র নির্দিষ্ট কিছু পেশাদার লোকদেরকে এবং গবেষকদের পরীক্ষামূলক ভাবে ব্যবহার করার জন্য অনুমতি দেওয়া হয়েছে। তবে আশা করা যায় যে, খুব শীঘ্রই এটি হয়তোবা জনসাধারণের ব্যবহারের জন্য উন্মুক্ত করে দেওয়া হতে পারে।
সংক্ষেপে বলতে গেলে, Sora AI ঠিক একটি AI Image Generator এর মত কাজ করে, যা আপনারা ইতিমধ্যেই ব্যবহার করছেন। AI Image Generators গুলো Diffusion Models নামে পরিচিত একটি পদ্ধতি ব্যবহার করে। Sora AI কে কাজ করানোর জন্য প্রথমে বিভিন্ন ভিডিওতে প্রশিক্ষিত করা হয়েছে। কোন একটি অবজেক্ট চেনার জন্য এটিকে ব্যাপক প্রশিক্ষণ দেওয়া হয়েছে এবং এরকম কোন বিষয়ে প্রশিক্ষিত করার জন্য সোরা এআই কে ভিডিওতে কী ঘটছে, তা Alt Text দিয়ে Explaining করা হয়।
সোরা এআই টেক্সট প্রম্পট থেকে ডিফিউশন মডেল এর মাধ্যমে স্থির ছবি তৈরি করে এবং তারপর ধীরে ধীরে ছবিগুলোকে ভিডিওতে রূপান্তর করে। গত বছর থেকে আমরা যেসব এআই ইমেজ দেখছি, তার চাইতে এটি অনেক বড় চ্যালেঞ্জ। যেখানে এই মডেলটিকে প্রত্যেকটি ভিডিওর জন্য Movement, Reflections, Shadows এবং আরো অনেক দীর্ঘ তালিকা সম্পর্কে বুঝতে হবে।
যাইহোক, OpenAI তাদের এই বিষয়টিকে আরো স্বচ্ছতার অংশ হিসেবে, Sora AI মডেলটি কীভাবে কাজ করে, তার সম্পর্কে তাদের ওয়েবসাইটে বিস্তারিত বর্ণনা রয়েছে। আপনারা চাইলে সেটি দেখে নিতে পারেন। এবং এখানে Sora AI দ্বারা তৈরি করা অনেক ভিডিও রয়েছে।
অফিসিয়াল ওয়েবসাইট @ Sora AI
আপাতত, Sora AI সাধারণ মানুষের জন্য Available নয়। অতীতের মত ওপেনএআই তাদের এই টুল সব লোকদের জন্য এক্সেস করার অনুমতি দেয়নি। প্রথম ধাপে তারা শুধুমাত্র নির্দিষ্ট কিছু ব্যক্তি, প্রফেশনাল এবং গবেষকদের জন্য এক্সেস দিয়েছে, যারা 'রেড টিমার্স' নামে পরিচিত।
ওপেনএআই এই এআই টুলটির আরো ব্যাপক উন্নতির জন্য বা এই টুলটি ক্রিয়েটিভ লোকেরা কীভাবে ব্যবহার করে কাজ করবে, তার গবেষণার জন্য অল্প কিছু সংখ্যক Visual Artists, Designers এবং Filmmakers দেরকে অ্যাক্সেস দেওয়া হয়েছে। আর সম্ভবত সোরা এআই ও খুব শীঘ্রই জনসাধারণের জন্য Available হবে। কিন্তু, টেক্সট-টু-ভিডিও জেনারেটর এর শক্তিশালী টুল হিসেবে এটি তাদের পেইড সার্ভিসের অন্তর্ভুক্ত হতে পারে।
এখনো পর্যন্ত OpenAI তাদের Sora AI মডেল দ্বারা তৈরি করা এবং প্রকাশিত ভিডিওগুলো থেকে আমরা এমনটি ধারণা করছি যে, সোরা এআই অনেকে এগিয়ে রয়েছে। এখনো পর্যন্ত বিভিন্ন এআই দ্বারা তৈরি করা ভিডিও গুলো বিশ্লেষণ করলে দেখা যায় যে, Sora AI এর তৈরি করা ভিডিও অনেক বেশি উন্নত মানের।
বেশ কয়েক বছর আগে এআই দ্বারা তৈরি করা একটি টিভি ভিডিও বিজ্ঞাপণ ভাইরাল হয়েছিল। যে বিজ্ঞাপনটির ভিডিওর নাম ছিল ‘Pepporoni Hug Spot’, যা ব্যাপক হাস্যরস সৃষ্টি করে। কেননা, সেটি একেবারেই বিকৃত মানুষের ছবি ও অঙ্গভঙ্গি তৈরি করেছিল।
সে দিক থেকে দেখা যায় যে, এখনো পর্যন্ত Sora AI দিয়ে তৈরি করা ভিডিওগুলোতে সঠিক লাইটিং, রিফ্লেকশন এবং মানুষের চরিত্রগুলো রয়েছে। এটি আশ্চর্যজনকভাবে এমন সব কঠিন সমস্যার ভিডিও তৈরি করেছে, যেগুলো আসলে বাহিরের লোকের দ্বারা করা সম্ভব নয়।
যাইহোক, এর মানে এই নয় যে, এটি ভিডিও তৈরি করার ক্ষেত্রে একেবারে নিখুঁতভাবে কাজ করতে পারে। বর্তমানে আমরা শুধুমাত্র তাদের ওয়েবসাইটে বাছাই করা ভিডিও গুলোই দেখতে পাচ্ছি। যখন এটি জনসাধারণের জন্য উন্মুক্ত করে দেওয়া হবে, তখন আমরা এই মডেলটির দুর্বলতা এবং ত্রুটিপূর্ণ ভিডিও গুলো নিয়ে বিশ্লেষণ করতে পারব। তবে, OpenAI এর অন্যান্য সফল এআই প্রজেক্টগুলো থেকে এমনটি ধারণা করা যাচ্ছে যে, তাদের সোরা এআই টুলটি ও যথেষ্ট শক্তিশালী হবে।
২০২২ সালের শেষের দিকে ওপেনএআই তাদের এআই চ্যাটবট হিসেবে ChatGPT সামনে আনার পর অনেক বেশি জনপ্রিয়তা অর্জন করে। আর এরই ধারাবাহিকতায়, তাদের টেক্সট-টু-ইমেজ জেনারেটর সার্ভিস আসে, যেটিও Text Prompts থেকে অসাধারণ সব ইমেজ তৈরি করে দিতে সক্ষম।
আর, এআই বিশ্বে নতুন চমক হিসেবে Sora AI নামে নতুন আরো একটি টুল এসেছে, যা বর্তমানে ভিডিও তৈরির ধারণাকে সম্পূর্ণভাবে পাল্টে দিতে পারে। যদিও এখনো পর্যন্ত সোরা এআই জনসাধারণের ব্যবহারের জন্য উন্মুক্ত করে দেয়া হয়নি। তবে আশা করা যায়, খুব শীঘ্রই এটি সকলের ব্যবহারের জন্য অ্যাক্সেস দেওয়া হবে।
আমি মো আতিকুর ইসলাম। কন্টেন্ট রাইটার, টেল টেক আইটি, গাইবান্ধা। বিশ্বের সর্ববৃহৎ বিজ্ঞান ও প্রযুক্তির সৌশল নেটওয়ার্ক - টেকটিউনস এ আমি 4 বছর 1 মাস যাবৎ যুক্ত আছি। টেকটিউনস আমি এ পর্যন্ত 421 টি টিউন ও 93 টি টিউমেন্ট করেছি। টেকটিউনসে আমার 62 ফলোয়ার আছে এবং আমি টেকটিউনসে 3 টিউনারকে ফলো করি।
“আল্লাহর ভয়ে তুমি যা কিছু ছেড়ে দিবে, আল্লাহ্ তোমাকে তার চেয়ে উত্তম কিছু অবশ্যই দান করবেন।” —হযরত মোহাম্মদ (সঃ)