Apprentissage actif : aspects théoriques et application à l’annotation multimédia.
-
TypeDoctorat Post-doctorat
-
Mots-clésmachine learning, apprentissage actif, annotation, bases de données multimédia
Description
L’apprentissage actif est une méthode d’apprentissage automatique (machine learning) qui permet à un algorithme d’interagir avec l’utilisateur pour lui demander les informations sur les éléments jugés les plus pertinents pour discriminer les classes dans une base de données. Ces méthodes présentent donc théoriquement un avantage sur les algorithmes d’apprentissage passif, qui demandent à l’utilisateur des informations sur des éléments choisis aléatoirement. L’apprentissage actif est donc particulièrement adapté pour des bases de données volumineuses, au sein desquelles les informations sur les étiquettes de classes ne s’obtiennent pas facilement [1]. Une application envisagée dans le cadre de ce projet est l’annotation d’une collection de sons. L’apprentissage actif permet dans ce cas de diminuer le nombre de sons que l’utilisateur doit écouter individuellement pour les identifier, ce qui permet un gain de un temps considérable. Les applications industrielles de la classification de sons sont nombreuses, dans des domaines tels que l’identification de nuisances sonores en milieu industriel, ou la classification de bruitages pour la production de films. Ce projet propose d’étudier le gain théoriquement réalisable par divers algorithmes d’apprentissage actif [2, 3] et d’appliquer ces résultats dans le cadre de l’annotation de bases de données de sons.
. [1] T. S. Huang, C. K. Dagli, S. Rajaram, E. Y. Chang, M. I. Mandel, G. E. Poliner, and D. P. W. Ellis. Active learning for interactive multimedia retrieval. Proceedings of the IEEE, 96(4), 2008.
. [2] S. Dasgupta. Two faces of active learning. Theoretical Computer Science, (412):1767– 1781, 2011.
. [3] M.-F. Balcan, S. Hanneke, and J. W. Vaughan. The true sample complex- ity of active learning. Machine learning, 80(2-3):111–139, 2010.