যারা বিশ্ববিদ্যালয় পর্যায়ে পড়াশোনা করছে, অথবা যারা গবেষণার কাজে জড়িত, কিংবা ডাটা এনালিস্ট যারা, তাদের জন্য গুরুত্বপূর্ণ তিন ধরনের এনালাইসিস হলো regression analysis, correlation এবং Chi Square Test। জটিল ধারণাগুলো খুব সহজ করে বললে, রিগ্রেশন প্রয়োজন হয় একটি উপাত্তের প্রেক্ষিতে আরেকটি উপাত্তের পরিবর্তন নির্ণয় করতে, কোরিলেশন করতে হয় দু'টো উপাত্তের মধ্যে সম্পর্কের প্রকৃতি নির্ধারণ করতে এবং সম্পর্ক আদৌ আছে কিনা সেটা নির্ধারণ করা হয় কাই স্কয়ার টেস্ট থেকে।
এই তিনটে এনালাইসিস করতে আমরা বিভিন্ন ধরনের সফটওয়্যার ব্যবহার করি। সবচেয়ে জনপ্রিয় হলো SPSS সফটওয়্যার। মাইক্রোসফট এক্সেল দিয়েও করা যায় কাজগুলো (সময় সাপেক্ষ)। STATA, MATLAB এবং অন্যান্য এনালিটিক্যাল সফটওয়্যার দিয়েও করা যায়। তবে R প্রোগ্রামিং ল্যাঙ্গুয়েজ দিয়ে করাটা সম্ভবত সবচেয়ে সহজ এবং ফলপ্রসু; আমার ব্যক্তিগত অভিজ্ঞতা যা বলে।
যাদের R নেই, তারা R cran থেকে এটা ডাউনলোড করে নিতে পারেন। এটি ফ্রি, ওপেন সোর্স। তারপর নিচের কোডগুলো ব্যবহার করলেই হবে।
Regression Analysis:
নিচের কোডগুলো ফলো করুন।
lattice package প্রয়োজন xyplot function এর জন্য। library(lattice) লিখে এটা চালু করে নিন। না থাকলে install.packages("lattice") লিখে ডাউনলোড করে তারপর library(lattice) লিখুন। এখানে উল্লেখ্য, a এবং b ভেক্টরকে ডিফাইন করে নিতে হবে আপনার ডাটা সেট অনুযায়ী। আর ডাটাফ্রেম তৈরি করতে হবে data.frame() কমান্ডের মতো।
Correlation Analysis:
নিচের কোডগুলো ফলো করুন।
Chi Square Test:
নিচের কোড ফলো করুন।
এখানে correct=FALSE লেখাটা গুরুত্বপূর্ণ। এছাড়া আপনার ডাটাসেট অনুযায়ী ভ্যারিয়েবলগুলো ইচ্ছেমতো ডলার সাইন দিয়ে পরিবর্তন করতে পারবেন।
পুরো কোডিং টা আমি R এ সেভ করে রেখেছি। সেটা ডাউনলোড করে শুধু ctrl+Enter দিয়ে দিয়ে, আপনার প্রয়োজন মতো কমান্ড এডিট করে কাজ করে নিতে পারেন।
আর ফাইল ডাউনলোড লিংকঃ http://www.mediafire.com/file/fcest7f7z8ggbj5/R+script+by+Bappy.R
আমি মোহাইমিনুল ইসলাম বাপ্পী। বিশ্বের সর্ববৃহৎ বিজ্ঞান ও প্রযুক্তির সৌশল নেটওয়ার্ক - টেকটিউনস এ আমি 6 বছর 11 মাস যাবৎ যুক্ত আছি। টেকটিউনস আমি এ পর্যন্ত 1 টি টিউন ও 0 টি টিউমেন্ট করেছি। টেকটিউনসে আমার 1 ফলোয়ার আছে এবং আমি টেকটিউনসে 0 টিউনারকে ফলো করি।