MYE003: Ανάκτηση Πληροφορίας - Αρχική Περιγραφή
Περιγράψτε τον αρχικό σχεδιασμό της υλοποίησης του συστήματός σας στη Lucene.
Ημερομηνία Παράδοσης: 6/4/2017, έως 5μμ
με email ως pdf αρχείο στο pitoura <παπάκι> cs.uoi.gr
Η αναφορά θα πρέπει να είναι από 600-1000 λέξεις.
Συμπεριλάβετε πληροφορίες για τα παρακάτω.
- Στοιχεία για την προεπεξεργασία και ευρετηριοποίηση:
ποια είναι αρχική δομή των δεδομένων, ποια θα είναι η μονάδα εγγράφου και τα αντίστοιχα πεδία (fields), ποιοι θα είναι οι όροι που θα εισαχθούν στο ευρετήριο, το είδος του ευρετηρίου (ευρετηρίων) που θα χρησιμοποιήστε, κλπ
- Στοιχεία για την αναζήτηση tweets: πως σχεδιάζετε να υλοποιείστε την (i) αναδιάταξη
με βάση το χρόνο, (ii) την αναδιάταξη με πληροφορία χρήσης (click-through rate), (iii) τις προτάσεις/συστάσεις εναλλακτικών ερωτημάτων.
- Τον αρχικό σχεδιασμό σας σχετικά με τον τρόπο απεικόνισης των αποτελεσμάτων.
Στις απαντήσεις στα παραπάνω αναφερθείτε και στα αντίστοιχα τμήματα της Lucene,
όπως
Build/Analyze/Index Document για το (1), και IndexSearcher/QueryParser, TopDocs, ScoreDocs για το (2).