Σύσταση επερωτήσεων με λέξεις κλειδιά με βάση την τοποθεσία

Εισαγωγή

Η Σύσταση Επερωτήσεων είναι ένα πρόσφατο και σημαντικό χαρακτηριστικό των σύγχρονων μηχανών αναζήτησης (π.χ. Google), το οποίο βοηθάει τους χρήστες να εκφράσουν καλύτερα την αναζήτηση πληροφορίας. Συγκεκριμένα, υπάρχουν χρήστες οι οποίοι δεν είναι σε θέση να βρουν τις κατάλληλες λέξεις κλειδιά για την αναζήτησή τους στον ιστό, οπότε χρησιμοποιούν λέξεις κλειδιά που δεν επιστρέφουν τα επιθυμητά αποτελέσματα. Το σύστημα συστήνει στο χρήστη εναλλακτικά σύνολα από λέξεις-κλειδιά τα οποία ενδεχομένως να ταιριάζουν καλύτερα με την πρόθεση του χρήστη και να επιστρέφουν τα επιθυμητά αποτελέσματα. Για παράδειγμα, αν ένας χρήστης ψάχνει για "ιταλικό εστιατόριο" μπορεί να μην πάρει σαν αποτελέσματα ιστοσελίδες που δεν έχουν τις συγκεκριμένες λέξεις, αλλά περιέχουν τη φράση "μεσογειακή κουζίνα" η οποία εκφράζει καλύτερα την πρόθεση του χρήστη. Η μηχανή λοιπόν προτείνει τη φράση "μεσογειακή κουζίνα" σαν εναλλακτική επερώτηση στο χρήστη.

Στο έργο αυτό επεκτείνουμε τη λογική της σύστασης επερωτήσεων στο να λαμβάνει υπόψη και τη χωρική θέση του χρήστη σε σχέση με τη θέση των αποτελεσμάτων. Συγκεκριμένα, θεωρούμε ότι ο χρήστης κάνει την αναζήτησή του μέσω μιας κινητής συσκευής και σιωπηρά ενδιαφέρεται για αποτελέσματα (π.χ. σημεία ενδιαφέροντος) που βρίσκονται κοντά του γεωγραφικά. Στην περίπτωση λοιπόν που τα αποτελέσματα δεν είναι κοντα, θα ήταν χρήσιμη η σύσταση εναλλακτικών επερωτήσεων οι οποίες είναι σημασιολογικά όμοιες με την αρχική και ταυτόχρονα δίνουν αποτελέσματα κοντά στο χρήστη. Η προτεινόμενη επέκταση δεν έχει μελετηθεί στο παρελθόν, αν και το γενικότερο πρόβλημα της σύστασης επερωτήσεων έχει προσελκύσει μεγάλο ενδιαφέρον τόσο από την ακαδημία όσο και από τη βιομηχανία. Θεωρούμε ότι υπάρχει ανάγκη αυτής της επέκτασης, η οποία θα βοηθήσει πληθώρα χρηστών που χρησιμοποιούν τις κινητές συσκευές τους ως προς την αποτελεσματική εύρεση πληροφοριάς. Στο τέλος του έργου, επιδιώκουμε την ύπαρξη ενός συστήματος το οποίο θα συστήνει σε πραγματικό χρόνο κατάλληλες επερωτήσεις σε κινητούς χρήστες.

Επιδιωκόμενα Αποτελέσματα

(1) Σχεδιασμός μοντέλων σύστασης επερωτήσεων με λέξεις κλειδιά με βάση την τοποθεσία. Η προτεινόμενη ερευνητική κατεύθυνση είναι η επέκταση υπάρχοντων μοντέλων σύστασης επερωτήσεων, τα οποία επί του παρόντος αγνοούν τη θέση του χρήστη, ώστε να την λαμβανουν υπόψη. Εκτιμούμε ότι τα μοντέλα που θα προκύψουν θα είναι πιο αποτελεσματικά για κινητούς χρήστες σε σχέση με την υπάρχουσα τεχνολογία αιχμής.

(2) Υλοποίηση και αποτίμηση της αποτελεσματικότητας των μοντέλων. Στα πλαίσια του έργου θα αναπτυχθεί ένα σύστημα εύρεσης με λέξεις κλειδιά για κινητούς χρήστες το οποίο θα υποστηρίζει σύσταση επερωτήσεων με βάση τα μοντέλα. Το σύστημα θα δοθεί σε χρήστες οι οποίοι θα μας βοηθήσουν να συλλέξουμε δεδομένα, να αποτιμήσουμε τα μοντέλα και να κατανοήσουμε το βαθμό επιρροής της τοποθεσίας στις ανάγκες εύρεσης πληροφορίας από τους πολίτες. Ο τελευταίος θα μας βοηθήσει στο να προσαρμόσουμε και να τελειοποιήσουμε τα μοντέλα σύστασης.

(3) Aνάπτυξη αποδοτικών τεχνικών σύστασης με βάση τα αποδοτικότερα μοντέλα. Ο τελικός στόχος του σηστήματος μας είναι να συστήνει σε πραγματικό χρόνο κατάλληλες επερωτήσεις σε κινητούς χρήστες. Η ταχύτητα του συστήματος είναι πολύ σημαντική γιατί οι χρήστες τείνουν να αγνοούν συστάσεις οι οποίες παίρνουν χρόνο να γίνουν. Η δυνατότητα σύστασης επερωτήσεων για μεγάλα δεδομένα δεν έχει μελετηθεί μέχρι τώρα, έτσι ώστε να υποστηρίζει ένα μεγάλο όγκο δεδομένων και επερωτήσεων από χρήστες. Λύσεις σε αυτή την κατεύθυνση θα μελετηθούν κατά τη διάρκεια του έργου.

Χρηματοδότηση

MSCA-IF-2014-EF:Marie Skłodowska-Curie Individual Fellowships (IF-EF)

April 2015 - March 2017

Δημοσιεύσεις

  1. Z. Huang, B. Cautis, R. Cheng, Y. Zheng, N. Mamoulis, and J. Yan, "Entity-Based Query Recommendation for Long-Tail Queries," ACM Transactions on Knowledge Discovery from Data (TKDD), to appear.
  2. Y. Fang, R. Cheng, G. Cong, N. Mamoulis, and Y. Li, "On Spatial Pattern Matching," Proceedings of the 34th IEEE International Conference on Data Engineering (ICDE), Paris, France, April 2018.
  3. D. Wu, J. Shi, and N. Mamoulis, "Density-based Place Clustering Using Geo-Social Network Data," IEEE Transactions on Knowledge and Data Engineering (TKDE), 30(5): 838-851, May 2018.
  4. P. Bouros and N. Mamoulis, "Interval Count Semi-Joins," Proceedings of the 21st International Conference on Extending Database Technology (EDBT), pp. 425-428, Vienna, Austria, March 2018.
  5. S. Qi, N. Mamoulis, E. Pitoura, and P. Tsaparas, "Recommending Packages with Validity Constraints to Groups of Users," Knowledge and Information Systems (KAIS), 54(2): 345-374, February 2018.
  6. Y. Qian, C. Tan, N. Mamoulis, and D. W. Cheung, "DSANLS: Accelerating Distributed Nonnegative Matrix Factorization via Sketching," Proceedings of the 11th ACM International Conference on Web Search and Data Mining (WSDM), pp. 450-458, Los Angeles, CA, February 2018.
  7. P. Bouros and N. Mamoulis, "A Forward Scan based Plane Sweep Algorithm for Parallel Interval Joins," Proceedings of the VLDB Endowment (PVLDB), 10(11): 1346-1357, August 2017.
  8. Y. Qian, Z. Lu, N. Mamoulis, and D. W. Cheung, "P-LAG: Location-aware Group Recommendation for Passive Users," Proceedings of the 15th International Symposium on Spatial and Temporal Databases (SSTD), pp. 242-259, Arlington VA, August 2017.
  9. Z. Huang and N. Mamoulis, "Location-Aware Query Recommendation for Search Engines at Scale," Proceedings of the 15th International Symposium on Spatial and Temporal Databases (SSTD), pp. 203-220, Arlington VA, August 2017.
  10. M. Terrovitis, G. Poulis, N. Mamoulis, and S. Skiadopoulos, "Local Suppression and Splitting Techniques for Privacy Preserving Publication of Trajectories," IEEE Transactions on Knowledge and Data Engineering (TKDE), 29(7): 1466-1479, July 2017.
  11. M. Meimaris, G. Papastefanatos, N. Mamoulis, and I. Anagnostopoulos, "Extended Characteristic Sets: Graph Indexing for SPARQL Query Optimization," Proceedings of the 33th International Conference on Data Engineering (ICDE), pp. 497-508, San Diego, CA, April 2017.
  12. D. Serbos, S. Qi, N. Mamoulis, E. Pitoura, and P. Tsaparas, "Fairness in Package-to-Group Recommendations," Proceedings of the 26th International World Wide Web Conference (WWW), pp. 371-379, Perth, Australia, April 2017.
  13. C. Doulkeridis, A. Vlachou, D. Mpestas, and N. Mamoulis, "Parallel and Distributed Processing of Spatial Preference Queries using Keywords," Proceedings of the 20th International Conference on Extending Database Technology (EDBT), pp. 318-329, Venice, Italy, March 2017.
  14. S. Qi, N. Mamoulis, E. Pitoura, and P. Tsaparas, "Recommending Packages to Groups," Proceedings of the IEEE International Conference on Data Mining (ICDM), pp. 449-458, Barcelona, Spain, December 2016.
  15. Z. Lu, N. Mamoulis, E. Pitoura, and P. Tsaparas, "Sentiment-Based Topic Suggestion for Micro-Reviews," Proceedings of the 10th International AAAI Conference on Web and Social Media (ICWSM), pp. 231-240, Cologne, Germany, May 2016.
  16. S. Qi, D. Wu, and N. Mamoulis, "Location aware keyword query suggestion based on document proximity," Proceedings of the 32nd IEEE International Conference on Data Engineering (ICDE), pp. 1566-1567, Helsinki, Finland, May 2016.
  17. S. Qi, D. Wu, and N. Mamoulis, "Location Aware Keyword Query Suggestion Based on Document Proximity," IEEE Transactions on Knowledge and Data Engineering (TKDE), 28(1): 82-97, January 2016.

Δεδομένα

  1. AOL query logs. Can be downloaded from Jeff Huang's webpage. Click here to download our mapping between URLs and locations.
  2. Tweets (from NY) mapped to locations. Download from here.

Κώδικας

Κώδικας από τη δημοσίευση [17].