Analisi costi
Costo build agente AI.
Gli agenti AI sono facili da demo e difficili da mettere in produzione. Ecco cosa serve davvero (e quanto costa) la versione production-ready, contro il prototipo prompt-and-pray che si rompe appena un utente vero lo tocca.
Costo di build (una tantum)
Un build di agente AI in produzione è tipicamente un engagement di 3–4 settimane. €25.000 coprono: selezione del provider (Claude / GPT / open-source), scoping dello use case, definizioni custom dei tool, integrazioni API, vector DB o RAG quando serve, una suite di eval per regressioni del comportamento, difese contro prompt injection, validazione output, e un deploy in produzione con logging e trace.
Salta una qualsiasi di queste cose e hai un prototipo, non un agente in produzione. Saltare gli eval in particolare è la ragione più comune per cui gli agenti degradano silenziosamente dopo il lancio.
Costo run (mensile)
- · Token del provider: dipende dal traffico e dal modello. Un piccolo agente interno può girare sotto i $50/mese. Un agente customer-facing a scala sale nelle migliaia.
- · Vector DB (se usato): $20–200/mese a seconda di storage e volume di query.
- · Compute (Lambda o container): $10–100/mese a scala piccola-media.
- · Observability e rerun degli eval: $20–100/mese per uno stack di observability LLM-traceable.
Dove la maggior parte degli agenti spreca soldi
Tre posti: modelli sovradimensionati per step semplici (usa un modello piccolo per il routing, uno grande solo per lo step difficile), nessun caching delle tool call ripetute, e nessun guardrail di rate-limit (un loop sfuggito può bruciare una bolletta a quattro cifre in un'ora). Tutti e tre sono configurazione, non architettura, e tutti e tre dovrebbero essere in piedi prima del lancio.