MYE003: Ανάκτηση Πληροφορίας - Αρχική Περιγραφή

Περιγράψτε τον αρχικό σχεδιασμό της υλοποίησης του συστήματός σας στη Lucene.

Ημερομηνία Παράδοσης: 6/4/2017, έως 5μμ
με email ως pdf αρχείο στο pitoura <παπάκι> cs.uoi.gr

Η αναφορά θα πρέπει να είναι από 600-1000 λέξεις.

Συμπεριλάβετε πληροφορίες για τα παρακάτω.

  1. Στοιχεία για την προεπεξεργασία και ευρετηριοποίηση: ποια είναι αρχική δομή των δεδομένων, ποια θα είναι η μονάδα εγγράφου και τα αντίστοιχα πεδία (fields), ποιοι θα είναι οι όροι που θα εισαχθούν στο ευρετήριο, το είδος του ευρετηρίου (ευρετηρίων) που θα χρησιμοποιήστε, κλπ
  2. Στοιχεία για την αναζήτηση tweets: πως σχεδιάζετε να υλοποιείστε την (i) αναδιάταξη με βάση το χρόνο, (ii) την αναδιάταξη με πληροφορία χρήσης (click-through rate), (iii) τις προτάσεις/συστάσεις εναλλακτικών ερωτημάτων.
  3. Τον αρχικό σχεδιασμό σας σχετικά με τον τρόπο απεικόνισης των αποτελεσμάτων.
Στις απαντήσεις στα παραπάνω αναφερθείτε και στα αντίστοιχα τμήματα της Lucene, όπως Build/Analyze/Index Document για το (1), και IndexSearcher/QueryParser, TopDocs, ScoreDocs για το (2).