MYE012/ΠΛΕ059 Εξόρυξη Δεδομένων

Εαρινό Εξάμηνο, 2017

 

Αρχική

Υλικό

Διαφάνειες

Ασκήσεις

Διαφάνειες

Οι διαφάνειες του μαθήματος χρησιμοποιούν διαφάνειες και υλικό από άλλα μαθήματα και βιβλία. Ευχαριστούμε τους: Tan, Steinbach, Kumar, Anand Rajaraman, Jeff Ullman, Jure Leskovec, Evimaria Terzi, Mark Crovella, Aris Anagnostopoulos για το υλικό από τις διαφάνειες τους που χρησιμοποιήθηκε σε αυτό το μάθημα.

Εισαγωγή: Διαδικαστικές λεπτομέρειες για το μάθημα (pptx, pdf)

Διάλεξη 1: Εισαγωγή σην Εξόρυξη Δεδομένων (pptx, pdf)

Διάλεξη 2: Τι είναι δεδομένα; To data mining pipeline. Προεπεξεργασία και μετεπεξεργασία. Δειγματοληψία και κανονικοποίηση. (pptx, pdf)

Φροντιστήριο 1: Εισαγωγή στις διακριτές πιθανότητες. (pdf)

  • Ευχαριστίες στον Άρη Αναγνωστόπουλο για τις διαφάνειες.

Διάλεξη 3: Συχνά Στοιχειοσύνολα και Κανόνες Συσχέτισης. (pptx, pdf)

Φροντιστήριο 2: Εισαγωγή στην Python (pptx, pdf), (ipynb, html) και στα Pandas (pptx, pdf) (ipynb, html)

Διάλεξη 4: Ομοιότητα και απόσταση. Συστήματα συστάσεων. (pptx, pdf) 

Διάλεξη 5: Εύρεση όμοιων ζευγών. Min-hash signatures. Locality Sensitive Hashing. (pptx, pdf)

  • Κεφάλαιο 3 από το βιβλίο Mining Massive Datasets των Anand Rajaraman and Jeff Ullman, Jure Leskovec.