Αρχική
Υλικό
Διαφάνειες
Ασκήσεις
|
Διαφάνειες
Οι διαφάνειες του μαθήματος
χρησιμοποιούν διαφάνειες και υλικό από άλλα μαθήματα και
βιβλία. Ευχαριστούμε τους: Tan, Steinbach, Kumar, Anand Rajaraman,
Jeff Ullman, and Jure Leskovec,
Evimaria Terzi, Aris Anagnostopoulos για
το υλικό από τις διαφάνειες τους που χρησιμοποιούμε σε
αυτό το μάθημα.
Διάλεξη 1:
Εισαγωγή στην Εξόρυξη Δεδομένων (ppt, pdf).
Διάλεξη 2: Δεδομένα, προ-επεξεργασία και μετεπεξεργασία (ppt, pdf)
Διάλεξη 3: Συχνά στοιχειοσύνολα, κανόνες
συσχέτισης, Αλγόριθμος Apriori (ppt, pdf)
Διάλεξη 4: Κανόνες
συσχέτισης. Αξιολόγηση κανόνων. Εναλλακτικοί
αλγόριθμοι για συχνά στοιχειοσύνολα.
(ppt, pdf)
Διάλεξη 5:
Ομοιότητα και απόσταση. Μετρικές. Συστήματα Συστάσεων,
Document Shingling. (ppt,pdf)
Διάλεξη 6:
Document Shingling. Min-Hashing, Sketching. Locality
Sensitive Hashing (LSH) (ppt,pdf)
Διάλεξη 7:
Clustering: k-means, hierarchical clustering, dbscan (ppt,pdf)
Διάλεξη 8:
Clustering: ΕΜ Αλγόριθμος, Αξιολόγηση Clustering,
Κατάτμηση ακολουθιακών δεδομένων (ppt,pdf)
Διάλεξη 9:
Minimum Description Length (MDL). Εισαγωγή στην Θεωρία
Πληροφορίας. Co-Clustering. (ppt,pdf)
- Deepayan
Chakrabarti, Spiros Papadimitriou,
Dharmendra Modha, Christos Faloutsos, Fully
Automatic Cross-Associations, KDD 2004,
Seattle, August 2004. [PDF]
- Καποιες πληροφορίες για MDL και
θεωρία πληροφορίας υπάρχουν στα Κεφάλαια
2,4 από το βιβλίο “Introduction
to Data Mining” των Tan, Steinbach, Kumar.
Διάλεξη 10:
Εισαγωγή στην Κατηγοριοποίηση. Δέντρα Απόφασης.
Αξιολόγηση. Nearest-Neighbor Classifier (ppt,pdf)
Διάλεξη 11:
Κατηγοριοποίηση: Support Vector Machines, Logistic
Regression, Naive Bayes Classifier. Επιβλεπόμενη
Μάθηση. (ppt,pdf)
Διάλεξη 12:
Ανάλυση Συνδέσμων και Ιεράρχηση στο Web. PageRank --
Τυχαίοι Περίπατοι. HITS αλγόριθμος. (ppt,pdf)
Διάλεξη 13:
Αποροφητικοί Τυχαίοι Περίπατοι. Προβληματα κάλυψης. (ppt,pdf)
|