Ώρες Διδασκαλίας: Τρίτη 12:00-14:00, Τετάρτη 13:00-14:00
Ύλη Μαθήματος
Το μάθημα καλύπτει τις βασικές αρχές, αλγόριθμους και εφαρμογές για την ανάκτησης πληροφορίας από συλλογές κειμένων, κοινωνικά δίκτυα και τον ιστό καθώς και βασικές έννοιες NLP.
Εργασία
Θα δοθεί μια εργασία (project) που θα αφορά την υλοποίηση ενός συστήματος ανάκτησης πληροφορίας με χρήση lucene.
Η εργασία θα γίνει σε ομάδες των 2 ατόμων. Η εργασία θα είναι το 50% του βαθμού σας στο μάθημα.
Προκαταρκτικό Χρονοδιάγραμμα για την Εργασία.
14/3/2023 | Aνακοίνωση εργασίας | Εκφώνηση |
7/4/2023 | Παράδοση 1ης φάσης | Οδηγίες |
19/5/2023 | Παράδοση τελικής εργασίας | Οδηγίες |
Εβδομάδα 22/5/2023 | Εξέταση εργασίας | Πρόγραμμα Εξέτασης |
Η εργασία περιλαμβάνει και ένα προαιρετικό τμήμα που αφορά χρήση μηχανικής μάθησης. Εδώ η περιγραφή του.
Για όσους το κάνουν: (1) το θέμα αυτό θα μετρά με 20% στο βαθμό και 30% η τελική εξέταση και (2) θα δοθεί bonus +0.5 στον τελικό βαθμό τους. Για τους υπόλοιπους, η τελική εξέταση θα μετρά 50% στο βαθμό.
Εισαγωγή. (κεφ 1) | Διαφάνειες pptx pdf | Ανάκτηση Boole. (κεφ 1) | Διαφάνειες pptx pdf | Προ-επεξεργασία και δημιουργία λεξιλογίου. (κεφ 2) | Διαφάνειες pptx pdf | Λεξικό. Ανεστραμένο ευρετήριο θέσεων (κεφ 2, 3) | Διαφάνειες pptx pdf | Στατιστικά συλογής. Συμπίεση (κεφ 5) | Διαφάνειες pptx pdf | Βαθμολόγηση. Στάθμιση όρων. Διανυσματικό μοντέλο (κεφ 6) | Διαφάνειες pptx pdf | Lucene. Περιγραφή εργασίας. | Διαφάνειες pptx pdf | Μηχανική μάθηση στην ανάκτηση πληροφορίας. Διανυσματικές αναπαραστάσεις (embeddings) | Διαφάνειες pptx pdf | Αξιολόγηση (κεφ, 8) | Διαφάνειες pptx pdf | Web, μηχανές αναζήτησης (κεφ 19, 20) | Διαφάνειες pptx pdf | Ανάλυση συνδέσμων (κεφ 21) | Διαφάνειες pptx pdf | Πρακτικές συμβουλές για την συγγραφή τεχνικών άρθρων | Διαφάνειες pptx pdf |
Διαφάνειες Προηγούμενου Έτους εδώ