Προτεινόμενη Διπλωματική εργασία Προπτυχιακού προγράμματος Σπουδών
Σε αυτή τη διπλωματική θα μελετηθούν δίκαιες εκδοχές αλγορίθμων για συστήματα συστάσεων που τρέχουν σε γράφους. Θα θέλαμε οι συστάσεις να είναι δίκαιες τόσο για τους χρήστες όσο και για τα αντικείμενα. Για παράδειγμα, θα θέλαμε μια τεχνολογική δουλειά (π.χ. μηχανικός αυτοκινήτων) να προτείνεται και σε άντρες και σε γυναίκες και όχι αποκλειστικά μόνο σε άντρες λόγω της εξάρτησης που υπάρχει ήδη στα υπό εκπαίδευση δεδομένα με πρότερες προκαταλήψεις χρηστών που αλληλεπίδρασαν με το σύστημα στο παρελθόν.
Τα συστήματα συστάσεων προτείνουν στους χρήστες αντικείμενα (π.χ. ταινίες, βιβλία, φάρμακα, κλπ.) που πιθανόν να τους ενδιαφέρουν. Συνήθως χρησιμοποιούν ιστορική πληροφορία, όπως ποια αντικείμενα ο υπό εξέταση χρήστης ή χρήστες παρόμοιοι με αυτόν έχουν αλληλεπιδράσει στο παρελθόν. Σε αυτήν την εργασία θα εξετάσουμε αλγορίθμους συστάσεων που βασίζονται σε ένα πολυμερείς γράφους ανάμεσα στους χρήστες, στα αντικείμενα, στις κατηγορίες των αντικειμένων, κτλ., όπου οι κόμβοι αντιστοιχούν στους χρήστες, στα αντικείμενα και στις κατηγορίες των αντικειμένων και υπάρχει μια ακμή από ένα χρήστη σε ένα αντικείμενο, αν ο χρήσης έχει διαλέξει το συγκεκριμένο αντικείμενο στο παρελθόν, ενώ υπάρχει και μια ακμή μεταξύ των αντικειμένων και των κατηγοριών στις οποίες αυτά ανήκουν. Οι υπό εξέταση αλγόριθμοι (Personalized PageRank, SimRank, PathSim, κτλ.) θα υπολογίζουν ομοιότητες μεταξύ κόμβων του ίδιου τύπου. Για παράδειγμα, ο PageRank αλγόριθμος κάνει κάποιους τυχαίους περιπάτους σε αυτό το γράφο. Ο τυχαίος περίπατος είναι ένας κλασικός τρόπος διάσχισης ενός γράφου. Ξεκινάει από ένα τυχαίο κόμβο, επισκέπτεται τυχαία κάποιο γείτονα του και μετά τυχαία κάποιο γείτονά του γείτονα, κ.ο.κ.
Μεγάλα Δεδομένα και Εξόρυξη Δεδομένων
Προγραμματισμός σε Python
Singh, A., & Joachims, T. (2018, July). Fairness of exposure in rankings. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining (pp. 2219-2228).