2. Fase 2: Gestione della Conversazione (Durante la Chat)
Durante l’interazione, l’obiettivo è limitare la crescita inutile del contesto.
Uso Consapevole delle Funzionalità
Funzioni come:
- ricerca web
- strumenti esterni
- modalità di ragionamento avanzato
possono aumentare lunghezza e complessità delle risposte.
Non è necessario disattivarle sempre, ma è utile attivarle solo quando portano un reale vantaggio.
Raggruppamento delle Attività (Batching)
Ogni turno richiede al modello di processare l’intero contesto.
- 3 richieste separate → 3 elaborazioni complete
- 1 richiesta con 3 task → 1 sola elaborazione
Quando i task sono correlati, raggrupparli riduce il costo complessivo.
Uso della Modifica dei Messaggi
Modificare un messaggio invece di inviarne uno nuovo:
- riduce l’accumulo nella cronologia
- mantiene il contesto più compatto
Non elimina il costo computazionale, ma aiuta a contenere la crescita della conversazione.
Separazione dei Contesti
Mescolare argomenti diversi nella stessa chat aumenta il rumore informativo.
Regola pratica:
nuovo argomento → nuova chat
Questo migliora sia l’efficienza che la qualità delle risposte.

