Ώρες Διδασκαλίας: Τετάρτη 12:00-14:00
Ώρες Διδασκαλίας: Πέμπτη 12:00-13:00
Ύλη Μαθήματος
Το μάθημα καλύπτει τις βασικές αρχές, αλγόριθμους και εφαρμογές για την ανάκτησης πληροφορίας από συλλογές κειμένων, κοινωνικά δίκτυα και τον ιστό.
Εργασία
Θα δοθεί μια εργασία (project) που θα αφορά την υλοποίηση ενός συστήματος ανάκτησης πληροφορίας με χρήση lucene. Αυτή τη χρονιά, η εργασία θα αφορά δεδομένα που θα συλλέξετε από κοινωνικά δίκτυα.
Η εργασία θα γίνει σε ομάδες των 2 ατόμων.
Προκαταρκτικό Χρονοδιάγραμμα
15/3/2017 | Αρχική εκφώνηση εργασίας | εδώ |
30/3/2017 | Ορισμός ομάδων και περιγραφή δεδομένων | Οδηγίες |
6/4/2017 | Παράδοση αρχικού σχεδιασμού | Οδηγίες |
24/5/2017 | Παράδοση κώδικα και αναφοράς | Οδηγίες |
26/5/2017 | Εξέταση εργασίας | Πρόγραμμα Εξέτασης |
Εισαγωγή. Ανάκτηση Boole (κεφ 1) | Διαφάνειες pptx pdf | Προ-επεξεργασία και δημιουργία λεξιλογίου. Ευρετήρια καταχωρήσεων. Ερωτήματα φράσεων και γειτονικότητας. (κεφ 2) | Διαφάνειες pptx pdf |
Δομές αναζήτησης για λεξικά. Ανεκτική ανάκτηση: ερωτήσεις με *, ορθογραφικά λάθη, απόσταση όρων, φωνητική διόρθωση. (κεφ 3) | Διαφάνειες pptx pdf |
Βαθμολόγηση και διάταξη εγγράφων. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου. Πλήρες σύστημα αναζήτησης. (κεφ 6-7) | Διαφάνειες pptx pdf |
Πιθανοτική ανάκτηση πληροφορίας. Περιλήψεις αποτελεσμάτων. (κεφ 11, 8) | Διαφάνειες pptx pdf |
Κατασκευή ευρετηρίου. Στατιστικά συλλογής. Συμπίεση. (κεφ 4-5) | Διαφάνειες pptx pdf |
Αξιολόγηση στην ανάκτηση πληροφορίας. (κεφ. 8) | Διαφάνειες pptx pdf |
Ανάλυση Συνδέσμων. (κεφ 21) | Διαφάνειες pptx pdf |
Θέματα στην Ανάκτηση στον Ιστό. (κεφ 19-20) | Διαφάνειες pptx pdf |
Lucene | Διαφάνειες pdf |
Twitter Crawler | Διαφάνειες pptx pdf |
Διαφάνειες Προηγούμενου Έτους εδώ