Exploitation de données incomplètes dans les systèmes de recommandation
-
TypeDoctorat
-
Mots-cléssystèmes de recommandation, données manquantes, qualité des données, modèles de préférence
Description
L’objectif des systèmes de recommandation est de suggérer aux utilisateurs des éléments (films, livres, etc.) susceptibles de les intéresser. Ces recommandations personnalisées sont construites sur base de préférences exprimées de manière explicite ou implicite, en utilisant entre autres des techniques de filtrage collaboratif [1, 2]. Cependant, ces techniques reposent sur des données qui sont souvent de pauvre qualité, incomplètes, bruitées ou incohérentes, provenant de plusieurs sources, comme les réseaux sociaux. Par exemple, dans les recommandation de films, les utilisateurs peuvent avoir tendance à n’attribuer des notes qu’aux films qu’ils ont bien aimé (ou l’inverse), ce qui produit des données manquantes non-aléatoires [3, 4]. Le but de ce travail est d’étudier différentes méthodes pour exploiter au mieux ce type de données, afin d’en extraire de l’information fiable sur les préférences des utilisateurs. [1] D. Jannach, M. Zanker, A. Felfernig, and G. Friedrich. Recommender Systems: An Introduction. Cambridge . [2] J.A. Konstan and J. Riedl. Recommender systems: from algorithms to user experience. User Modeling and User-Adapted Interaction, pages 1–23, 2012. .[3] B.M. Marlin and R.S. Zemel. Collaborative prediction and ranking with non-random missing data. In Proceedings of the third ACM conference on Recommender systems, pages 5–12. ACM, 2009. [4] B.M. Marlin, R.S. Zemel, S.T. Roweis, and M. Slaney. Recommender sys- tems: Missing data and statistical model estimation. In Twenty-Second International Joint Conference on Artificial Intelligence, 2011. Univ Press, 2010.