MYE003: Ανάκτηση Πληροφορίας
Εαρινό Εξάμηνο 2022-2023

Διδάσκουσα: Ευαγγελία Πιτουρά

Ώρες Διδασκαλίας: Τρίτη 12:00-14:00, Τετάρτη 13:00-14:00

Ανακοινώσεις
Βιβλία


Ύλη Μαθήματος

Το μάθημα καλύπτει τις βασικές αρχές, αλγόριθμους και εφαρμογές για την ανάκτησης πληροφορίας από συλλογές κειμένων, κοινωνικά δίκτυα και τον ιστό καθώς και βασικές έννοιες NLP.


Εργασία

Θα δοθεί μια εργασία (project) που θα αφορά την υλοποίηση ενός συστήματος ανάκτησης πληροφορίας με χρήση lucene.

Η εργασία θα γίνει σε ομάδες των 2 ατόμων. Η εργασία θα είναι το 50% του βαθμού σας στο μάθημα.

Προκαταρκτικό Χρονοδιάγραμμα για την Εργασία.

14/3/2023 Aνακοίνωση εργασίας    Εκφώνηση  
7/4/2023 Παράδοση 1ης φάσης    Οδηγίες
19/5/2023 Παράδοση τελικής εργασίας    Οδηγίες
Εβδομάδα 22/5/2023 Εξέταση εργασίας   Πρόγραμμα Εξέτασης

Η εργασία περιλαμβάνει και ένα προαιρετικό τμήμα που αφορά χρήση μηχανικής μάθησης. Εδώ η περιγραφή του.

Για όσους το κάνουν: (1) το θέμα αυτό θα μετρά με 20% στο βαθμό και 30% η τελική εξέταση και (2) θα δοθεί bonus +0.5 στον τελικό βαθμό τους. Για τους υπόλοιπους, η τελική εξέταση θα μετρά 50% στο βαθμό.


Διαφάνειες

   Εισαγωγή. (κεφ 1) Διαφάνειες pptx pdf
   Ανάκτηση Boole. (κεφ 1) Διαφάνειες pptx pdf
   Προ-επεξεργασία και δημιουργία λεξιλογίου. (κεφ 2)   Διαφάνειες pptx pdf
   Λεξικό. Ανεστραμένο ευρετήριο θέσεων (κεφ 2, 3)   Διαφάνειες pptx pdf
   Στατιστικά συλογής. Συμπίεση (κεφ 5)   Διαφάνειες pptx pdf
   Βαθμολόγηση. Στάθμιση όρων. Διανυσματικό μοντέλο (κεφ 6)   Διαφάνειες pptx pdf
   Lucene. Περιγραφή εργασίας.   Διαφάνειες pptx pdf
   Μηχανική μάθηση στην ανάκτηση πληροφορίας. Διανυσματικές αναπαραστάσεις (embeddings)   Διαφάνειες pptx pdf
   Αξιολόγηση (κεφ, 8)   Διαφάνειες pptx pdf
   Web, μηχανές αναζήτησης (κεφ 19, 20)   Διαφάνειες pptx pdf
   Ανάλυση συνδέσμων (κεφ 21)   Διαφάνειες pptx pdf
   Πρακτικές συμβουλές για την συγγραφή τεχνικών άρθρων   Διαφάνειες pptx pdf

Διαφάνειες Προηγούμενου Έτους εδώ