Réseaux de neurones et convergence du gradient

La descente de gradient stochastique comme spirale vers un minimum

Jean-François Weemaes

Architecte IT, Chercheur de motifs

Résumé

L'entraînement d'un réseau de neurones consiste à minimiser une fonction de perte dans un espace de très haute dimension. La descente de gradient stochastique navigue cet espace en spiralant progressivement vers un minimum local. La géométrie de cet espace — ses cols, ses vallées, ses plateaux — détermine la vitesse et la qualité de la convergence.

Cet article est en cours de rédaction.

Article précédent

Ondes gravitationnelles et spirale de fusion

Article suivant

Cryptographie et courbes elliptiques