Computational and Statistical Methods for Data Analytics

DS03
Semester: 1st,
ECTS Credits: 7.5

Kyriaki Tsilika

(Course Coordinator)

Syllabus

  • Introduction and management of data files.
  • Descriptive statistics. Measures of central tendency and variability. Graphs for presenting discrete and continuous data.
  • Tests for normality and detection of outliers.
  • Inferential statistics. General principles for constructing Confidence Intervals (CIs) for parameters in one or more populations.
  • Statistical hypothesis testing for mean(s) and proportion(s).
  • Test of independence. Degree and nature of the relationship between two variables.
  • Correlation analysis.
  • Regression analysis. Simple and multiple linear models. Diagnostic checks for simple and multiple regression models.
  • Application of data analysis techniques to real data. Case studies in R and KNIME.

Recommended Bibliography

  • James G., Witten D., Hastie T. & Tibshirani R. An Introduction to Statistical Learning with Applications in R. Springer, 2021.
  • Μαλεφάκη, Σ., Μπατσίδης, Α., & Οικονόμου, Π. Στατιστική Ανάλυση Δεδομένων. Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις. https://dx.doi.org/10.57713/kallipos-321, (2023). 
  • Καραγρηγορίου, Α., & Καλλιγέρης, Ε. Γραμμικά Μοντέλα και Σχεδιασμός & Ανάλυση Πειραμάτων με εφαρμογές σε R και Minitab. Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις. https://dx.doi.org/10.57713/kallipos-70, (2023).
  • Βερύκιος, Β., Καγκλής, Β., & Σταυρόπουλος, Η. (2015). Η επιστήμη των δεδομένων μέσα από τη γλώσσα R. Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις. https://dx.doi.org/10.57713/kallipos-734
  • Skiena S. S. The Data Science Design Manual (Texts in Computer Science) 2017th Edition, Springer, 2017.
  • Silipo R. (Ed.) Practicing Data Science – The Data Science Case Study Collection, KNIME Press, 2019.