DeepSeek propose une nouvelle architecture pour réduire le gaspillage énergétique de l’IA
Dans la course à l’IA toujours plus grande, le vrai problème n’est plus seulement la performance brute, mais la stabilité. Un nouveau papier de recherche publié par DeepSeek propose une approche discrète, mais potentiellement déterminante : rendre l’entraînement des grands modèles plus prévisible, afin d’éviter les échecs coûteux qui font exploser la facture énergétique. L’entraînement de […]
Read More