Objectif : Contrôler et réduire les coûts d'un agent en production.
Pratique (60 min) :
- Calculer le coût mensuel d'un agent actif :
- Nombre de requêtes/jour × tokens_moyen × prix_token × 30
- Techniques de réduction des coûts :
- Utiliser
claude-haiku-4-5ougpt-4o-minipour les tâches simples - Utiliser
claude-opus-4-6seulement pour les tâches complexes (routing par complexité) - Compresser la mémoire avant de l'injecter (Summary Memory)
- Cache les réponses aux questions fréquentes (Redis ou Memcache)
- Utiliser
- Model Router : Créer un classifier qui route vers le bon modèle selon la complexité
- Benchmark coût/qualité : Comparer Haiku vs Sonnet vs Opus sur le même use case
Checkpoint : Tu peux estimer et optimiser les coûts pour chaque client.