Regression, Correlation এবং Chi Square Test করুন R প্রোগ্রামিং এর মাধ্যমে

যারা বিশ্ববিদ্যালয় পর্যায়ে পড়াশোনা করছে, অথবা যারা গবেষণার কাজে জড়িত, কিংবা ডাটা এনালিস্ট যারা, তাদের জন্য গুরুত্বপূর্ণ তিন ধরনের এনালাইসিস হলো regression analysis, correlation এবং Chi Square Test। জটিল ধারণাগুলো খুব সহজ করে বললে, রিগ্রেশন প্রয়োজন হয় একটি উপাত্তের প্রেক্ষিতে আরেকটি উপাত্তের পরিবর্তন নির্ণয় করতে, কোরিলেশন করতে হয় দু'টো উপাত্তের মধ্যে সম্পর্কের প্রকৃতি নির্ধারণ করতে এবং সম্পর্ক আদৌ আছে কিনা সেটা নির্ধারণ করা হয় কাই স্কয়ার টেস্ট থেকে।

এই তিনটে এনালাইসিস করতে আমরা বিভিন্ন ধরনের সফটওয়্যার ব্যবহার করি। সবচেয়ে জনপ্রিয় হলো SPSS সফটওয়্যার। মাইক্রোসফট এক্সেল দিয়েও করা যায় কাজগুলো (সময় সাপেক্ষ)। STATA, MATLAB এবং অন্যান্য এনালিটিক্যাল সফটওয়্যার দিয়েও করা যায়। তবে R প্রোগ্রামিং ল্যাঙ্গুয়েজ দিয়ে করাটা সম্ভবত সবচেয়ে সহজ এবং ফলপ্রসু; আমার ব্যক্তিগত অভিজ্ঞতা যা বলে।

যাদের R নেই, তারা R cran থেকে এটা ডাউনলোড করে নিতে পারেন। এটি ফ্রি, ওপেন সোর্স। তারপর নিচের কোডগুলো ব্যবহার করলেই হবে।

 

Regression Analysis:

নিচের কোডগুলো ফলো করুন।

  • For Regression Result (a=dependent, b=independent): Regression=lm(a~b,data=df)
  • For Regression Plot: xyplot(a~b,data=df,xlab="Weight",ylab="height",main="Relation between height and Weight")
  • For Details: summary(Regression)
  • For linear graph: qqmath(a~b,data=df,xlab="Wieght",ylab="height",main="relation")

lattice package প্রয়োজন xyplot function এর জন্য। library(lattice) লিখে এটা চালু করে নিন। না থাকলে install.packages("lattice") লিখে ডাউনলোড করে তারপর library(lattice) লিখুন। এখানে উল্লেখ্য, a এবং b ভেক্টরকে ডিফাইন করে নিতে হবে আপনার ডাটা সেট অনুযায়ী। আর ডাটাফ্রেম তৈরি করতে হবে data.frame() কমান্ডের মতো।

 

Correlation Analysis:

নিচের কোডগুলো ফলো করুন।

  • library(ggpubr)
  • library(devtools)
  • For simplified correlation: after defining a and b: cor(a,b)
  • For details correlation with significance value: cor.test(a,b)
  • For Pearson correlation: cor.test(a,b,method="pearson")
  • For Kendall correlation: cor.test(a,b,method="kendall")
  • For Spearman Correlation: cor.test(a,b,method="spearman")
  • For correlation graph: ggscatter(df, x="Weight", y="Height",add = "reg.line",conf.int = TRUE,cor.coef = TRUE, cor.method = "spearman",xlab = "Height", ylab = "Weight", main="Correlation")

 

Chi Square Test:

নিচের কোড ফলো করুন।

  • chisq.test(my_data$Week_Weekend,my_data$Gender,correct = FALSE)

এখানে correct=FALSE লেখাটা গুরুত্বপূর্ণ।  এছাড়া আপনার ডাটাসেট অনুযায়ী ভ্যারিয়েবলগুলো ইচ্ছেমতো ডলার সাইন দিয়ে পরিবর্তন করতে পারবেন।

 

পুরো কোডিং টা আমি R এ সেভ করে রেখেছি। সেটা ডাউনলোড করে শুধু ctrl+Enter দিয়ে দিয়ে, আপনার প্রয়োজন মতো কমান্ড এডিট করে কাজ করে নিতে পারেন।

আর ফাইল ডাউনলোড লিংকঃ http://www.mediafire.com/file/fcest7f7z8ggbj5/R+script+by+Bappy.R

Level 0

আমি মোহাইমিনুল ইসলাম বাপ্পী। বিশ্বের সর্ববৃহৎ বিজ্ঞান ও প্রযুক্তির সৌশল নেটওয়ার্ক - টেকটিউনস এ আমি 6 বছর 11 মাস যাবৎ যুক্ত আছি। টেকটিউনস আমি এ পর্যন্ত 1 টি টিউন ও 0 টি টিউমেন্ট করেছি। টেকটিউনসে আমার 1 ফলোয়ার আছে এবং আমি টেকটিউনসে 0 টিউনারকে ফলো করি।


টিউনস


আরও টিউনস


টিউনারের আরও টিউনস


টিউমেন্টস