MYE012/ΠΛΕ059 – Εξόρυξη Δεδομένων

Χειμερινό Εξάμηνο 2025

 

Αρχική

Υλικό

Διαλέξεις


Φροντιστήρια


Ασκήσεις

Διαλέξεις

Οι διαφάνειες του μαθήματος χρησιμοποιούν διαφάνειες και υλικό από άλλα μαθήματα και βιβλία. Πολλές ευχαριστίες στους: Tan, Steinbach, Kumar, Anand Rajaraman, Jeff Ullman, Jure Leskovec, Evimaria Terzi, Mark Crovella, Aris Anagnostopoulos για το υλικό από τις διαφάνειες τους που χρησιμοποιήθηκε σε αυτό το μάθημα.

Εισαγωγή: Διαδικαστικές λεπτομέρειες για το μάθημα (pptx, pdf)

Διάλεξη 1: Εισαγωγή σην Εξόρυξη Δεδομένων (pptx, pdf)

Διάλεξη 2: Τι είναι δεδομένα; To data mining pipeline. Προεπεξεργασία και μετεπεξεργασία. Δειγματοληψία και κανονικοποίηση. (pptx, pdf)

Διάλεξη 3: Εξερεύνηση δεδομένων και βασική στατιστική ανάλυση (pptx, pdf)

  • Κεφάλαιο 1 από το βιβλίο Mining Massive Datasets των Anand Rajaraman and Jeff Ullman, Jure Leskovec.
  • Κεφάλαια 7-8 (confidence interval, standard error), 11 (hypothesis testing), 16 (independence and correlation tests) από το βιβλίο All of Statistics του Larry A. Wasserman (τα νούμερα των κεφαλαίων ειναι για το pdf, στο πραγματικό βιβλίο τα νουμερα ειναι -1 απο τα παραπάνω νούμερα).
  • Κεφάλαια 5,6 από το βιβλίο The Data Science Design Manual του Steven S. Skiena
  • Error bars in experimental biology.