Teaching

Sorbonne M2 S2A 2026

Geometric Methods in Statistics and Machine Learning

Au cours des dernières années, l’essor des données de grande dimension a confronté les statistiques et le machine learning à un défi majeur : le fléau de la dimension. Ce terme désigne le phénomène selon lequel la plupart des algorithmes classiques voient leur vitesse de convergence devenir impraticable lorsque la dimension des données augmente fortement, comme c’est le cas, par exemple, pour les images, représentées par des vecteurs comportant plusieurs millions de composantes. Une approche particulièrement fructueuse pour traiter ce problème consiste à adopter un point de vue géométrique, en exploitant les corrélations internes aux données afin de mettre en évidence une structure sous-jacente de dimension plus faible. Cette idée se décline de diverses manières, que l’on retrouve notamment dans les algorithmes de réduction de dimension non linéaires, l’analyse topologique des données (TDA) ou encore le metric learning. Ce cours présentera ces méthodes ainsi que leurs fondements théoriques. L’accent sera mis sur les notions d’ordre géométrique, sans qu’un prérequis formel en géométrie différentielle ne soit nécessaire. L’analyse statistique des graphes s’inscrit pleinement dans ce cadre géométrique (clustering spectral, multidimensional scaling, Isomap, etc.). Elle sera ici abordée du point de vue des motivations géométriques et des garanties de convergence des algorithmes.

Contact

emails:
serres AT lpsm.paris
jordan.serres AT sorbonne-universite.fr

Google Scholar

Address:
Sorbonne Université
Campus Pierre et Marie Curie
4 place Jussieu 75005 Paris, France