MYE003-ΠΛΕ070: Ανάκτηση Πληροφορίας: Εργασία

Περιγραφή Εργασίας

Θα σχεδιάστε και υλοποιείστε μια μηχανή αναζήτησης επιχειρήσεων.
Η μηχανή (σύστημα ανάκτησης πληροφορίας) θα πρέπει να υποστηρίζει:
  1. Προεπεξεργασία των εγγράφων και κατασκευή ευρετηρίων
  2. Aναζήτηση πληροφορίας

Για την υλοποίηση θα χρησιμοποιήσετε τη Lucene, μια βιβλιοθήκη ανοικτού κώδικα για την κατασκευή μηχανών αναζήτησης κειμένου γραμμένη σε Java. Μπορείτε να την κατεβάσετε από εδώ.

Θα χρησιμοποείστε δεδομένα από το Yelp dataset. Μπορείτε να τα κατεβάσετε από εδώ.

Τα δεδομένα περιέχουν πληροφορίες για επιχειρήσεις σε 4 πόλεις. Περιλαμβάνουν κριτικές (reviews) και σύντομες συστάσεις (tips) από χρήστες καθώς και πληροφορίες για τα χαρακτηριστικά των επιχειρήσεων. Επίσης, είναι διαθέσιμο το κοινωνικό δίκτυο των χρηστών και πληροφορίες για τις επισκέψεις (check-in) στις επιχειρήσεις.

Τα διαθέσιμα δεδομένα είναι πολλά και διαφορετικού τύπου. Επιλέξτε ένα κατάλληλο για την εργασία σας υποσύνολο.

Το σύστημα σας θα πρέπει να υποστηρίζει

Για τη διάταξη των αποτελεσμάτων της αναζήτησης, ο χρήστης θα πρέπει να έχει τη δυνατότητα να επιλέξει ανάμεσα σε τουλάχιστον 3 διαφορετικούς τρόπους διάταξης που θα χρησιμοποιούν διαθέσιμη πληροφορία όπως πχ:

Η απεικόνιση των αποτελεσμάτων της αναζήτησης θα πρέπει να είναι τέτοια ώστε να παρέχει στο χρήστη χρήσιμη πληροφορία.