ΠΛΕ059 – Εξόρυξη Δεδομένων

Χειμερινό Εξάμηνο, 2013

 

Αρχική

Υλικό

Διαφάνειες

Ασκήσεις

 



Διαφάνειες


Οι διαφάνειες του μαθήματος χρησιμοποιούν διαφάνειες και υλικό από άλλα μαθήματα και βιβλία. Ευχαριστούμε τους: Tan, Steinbach, Kumar, Anand Rajaraman, Jeff Ullman, and Jure Leskovec, Evimaria Terzi, Aris Anagnostopoulos για το υλικό από τις διαφάνειες τους που χρησιμοποιούμε σε αυτό το μάθημα.

Διάλεξη 1: Εισαγωγή στην Εξόρυξη Δεδομένων (ppt, pdf).

Διάλεξη 2: Δεδομένα, προ-επεξεργασία και μετεπεξεργασία (ppt, pdf)

Διάλεξη 3: Συχνά στοιχειοσύνολα, κανόνες συσχέτισης, Αλγόριθμος Apriori (ppt, pdf)


Διάλεξη 4: Κανόνες συσχέτισης. Αξιολόγηση κανόνων. Εναλλακτικοί αλγόριθμοι για συχνά στοιχειοσύνολα. (ppt, pdf)

 

Διάλεξη 5: Ομοιότητα και απόσταση. Μετρικές. Συστήματα Συστάσεων, Document Shingling. (ppt,pdf)


Διάλεξη 6: Document Shingling. Min-Hashing, Sketching. Locality Sensitive Hashing (LSH) (ppt,pdf)
  • Κεφάλαιο 3 από το βιβλίο Mining Massive Datasets των Anand Rajaraman and Jeff Ullman, Jure Leskovec.

Διάλεξη 7: Clustering: k-means, hierarchical clustering, dbscan (ppt,pdf)


Διάλεξη 8: Clustering: ΕΜ Αλγόριθμος, Αξιολόγηση Clustering, Κατάτμηση ακολουθιακών δεδομένων (ppt,pdf)


Διάλεξη 9: Minimum Description Length (MDL). Εισαγωγή στην Θεωρία Πληροφορίας. Co-Clustering. (ppt,pdf)

  • Deepayan Chakrabarti, Spiros Papadimitriou, Dharmendra Modha, Christos Faloutsos, Fully Automatic Cross-Associations, KDD 2004, Seattle, August 2004. [PDF]
  • Καποιες πληροφορίες για MDL και θεωρία πληροφορίας υπάρχουν στα Κεφάλαια 2,4 από το βιβλίο “Introduction to Data Mining” των Tan, Steinbach, Kumar.


Διάλεξη 10: Εισαγωγή στην Κατηγοριοποίηση. Δέντρα Απόφασης. Αξιολόγηση. Nearest-Neighbor Classifier (ppt,pdf)


Διάλεξη 11: Κατηγοριοποίηση: Support Vector Machines, Logistic Regression, Naive Bayes Classifier. Επιβλεπόμενη Μάθηση. (ppt,pdf)


Διάλεξη 12: Ανάλυση Συνδέσμων και Ιεράρχηση στο Web. PageRank -- Τυχαίοι Περίπατοι. HITS αλγόριθμος. (ppt,pdf)


Διάλεξη 13: Αποροφητικοί Τυχαίοι Περίπατοι. Προβληματα κάλυψης. (ppt,pdf)