Προτεινόμενη Διπλωματική εργασία Προπτυχιακού προγράμματος Σπουδών
Ανάπτυξη εφαρμογής για ανάλυση χωρο-κειμενικών δεδομένων.
Τα χωρο-κειμενικά δεδομένα περιγράφονται από γεωγραφικές συντεταγμένες (Χ,Υ) και ένα σύνολο από λέξεις-κλειδιά (π.χ. geotagged tweets, images from Flickr, κτλ). Για την επεξεργασία τέτοιων δεδομένων είναι χρήσιμα ερωτήματα (queries) που συνδυάζουν γεωγραφική απόσταση με κειμενική ομοιότητα. Για παράδειγμα, εύρεση των tweets που έχουν γίνει από σημείο που βρίσκεται σε απόσταση μικρότερη των 500μ από το σημείο λήψης μιας φωτογραφίας του Flickr, και το κείμενο του tweet μοιάζει με την περιγραφή της φωτογραφίας. Συχνά, για την επεξεργασία τέτοιων σύνθετων/προηγμένων τύπων επερώτησης σε δεδομένα τεράστιου όγκου απαιτούνται τεχνικές που έχουν ομοιότητες με παράλληλη σύζευξη (parallel join). Η παρούσα εργασία αποσκοπεί στην ανάπτυξη εφαρμογής που επεξεργάζεται τέτοιου είδους επερωτήσεις με χρήση της Java.
Βάσεις Δεδομένων Ι
Βάσεις Δεδομένων ΙΙ
Java
Felipe, Ian & Hristidis, Vagelis & Rishe, N.. (2008). Keyword Search on Spatial Databases. Proceedings - International Conference on Data Engineering. 656 - 665. 10.1109/ICDE.2008.4497474.
Orestis Gkorgkas, Akrivi Vlachou, Christos Doulkeridis, Kjetil Nørvåg: Finding the Most Diverse Products using Preference Queries. EDBT 2015: 205-216