Ce cours porte sur l’optimisation de modèles pour des usages de production, avec un accent sur la quantification, la performance d’inférence, l’optimisation matérielle et l’évaluation en situation réelle. Il montre que la performance utile dépend souvent de compromis techniques bien choisis.
Les notions les plus structurantes concernent la quantification, l’optimisation d’inférence, les contraintes matérielles, la gestion de la mémoire et l’évaluation des performances en production. Le cours est utile parce qu’il relie sophistication du modèle, soutenabilité opérationnelle et exigence de qualité de service.
Pour moi, cela me permet de mieux aider un COMEX à arbitrer entre performance théorique, coût réel, portabilité et robustesse dans les projets IA. Cela renforce ma capacité à replacer les choix techniques dans une logique de valeur et d’exploitation durable.
