MYE003: Ανάκτηση Πληροφορίας
Εαρινό Εξάμηνο 2024-2025

Διδάσκουσα: Ευαγγελία Πιτουρά

Βοηθοί για την Εργασία: Γεώργιος Μπαλανος, Ευάγγελος Χασάνης

Ώρες Διδασκαλίας: Πέμπτη 12:00-15:00

Ανακοινώσεις
Βιβλία


Ύλη Μαθήματος

Το μάθημα καλύπτει τις βασικές αρχές, αλγόριθμους και εφαρμογές για την ανάκτησης πληροφορίας από συλλογές κειμένων, κοινωνικά δίκτυα και τον ιστό καθώς και βασικές έννοιες NLP.


Εργασία

Θα δοθεί μια εργασία (project) που θα αφορά την υλοποίηση ενός συστήματος ανάκτησης πληροφορίας με χρήση lucene.

Η εργασία θα γίνει σε ομάδες των 2 ατόμων. Η εργασία θα είναι το 50% του βαθμού σας στο μάθημα. Επίσης, θα δοθεί μια προαιρετική εργασία με χρήση RAG.

Προκαταρκτικό Χρονοδιάγραμμα για την Εργασία.

28/3/2025 Aνακοίνωση εργασίας    Εκφώνηση  
14/4/2025 Παράδοση 1ης φάσης    Οδηγίες
23/5/2025 Παράδοση τελικής εργασίας    Οδηγίες
Εβδομάδα 26/5/2025 Εξέταση εργασίας   

Η εργασία περιλαμβάνει και ένα προαιρετικό τμήμα που αφορά χρήση μηχανικής μάθησης. Η περιγραφή του είναι εδώ.

Η προαιρετική εργασία είναι απαλλακτική.


Διαφάνειες

   Εισαγωγή. Ανάκτηση Boole (κεφ 1) Διαφάνειες pptx pdf
   Προ-επεξεργασία και δημιουργία λεξιλογίου. Λεξικό. (κεφ 2)   Διαφάνειες pptx pdf
   Επεκτάσεις Ευρετηρίου. Στατιστικά συλογής. Συμπίεση. (κεφ 5)   Διαφάνειες pptx pdf
   Βαθμολόγηση. Στάθμιση όρων. Πιθανοτικό Μοντέλο. Διανυσματικό μοντέλο. (κεφ 6)   Διαφάνειες pptx pdf
   Μηχανική μάθηση στην ανάκτηση πληροφορίας. Διανυσματικές αναπαραστάσεις (embeddings).   Διαφάνειες pptx pdf
   Μηχανική μάθηση στην ανάκτηση πληροφορίας. Vector Search. Learning to Rank. RAG   Διαφάνειες pptx pdf
   Lucene. Περιγραφή εργασίας. Ευρετήρια πεδίου. Περιλήψεις.   Διαφάνειες pptx pdf
   Αξιολόγηση (κεφ, 8)   Διαφάνειες pptx pdf
   Web, μηχανές αναζήτησης (κεφ 19, 20)   Διαφάνειες pptx pdf
   Ανάλυση συνδέσμων (κεφ 21)   Διαφάνειες pptx pdf
   Πρακτικές συμβουλές για την συγγραφή τεχνικών άρθρων   Διαφάνειες pptx pdf

Διαφάνειες Προηγούμενου Έτους εδώ