Digital Spirit
Module 04Agents IABloc 3Production & Sécurité

Heure 14 / 20 · Heures 12–17

Coûts & Optimisation

Objectif — Contrôler et réduire les coûts d'un agent en production.

Pratique
60 min

Objectif : Contrôler et réduire les coûts d'un agent en production.

Pratique (60 min) :

  • Calculer le coût mensuel d'un agent actif :
    • Nombre de requêtes/jour × tokens_moyen × prix_token × 30
  • Techniques de réduction des coûts :
    • Utiliser claude-haiku-4-5 ou gpt-4o-mini pour les tâches simples
    • Utiliser claude-opus-4-6 seulement pour les tâches complexes (routing par complexité)
    • Compresser la mémoire avant de l'injecter (Summary Memory)
    • Cache les réponses aux questions fréquentes (Redis ou Memcache)
  • Model Router : Créer un classifier qui route vers le bon modèle selon la complexité
  • Benchmark coût/qualité : Comparer Haiku vs Sonnet vs Opus sur le même use case

Checkpoint : Tu peux estimer et optimiser les coûts pour chaque client.