Migliori pratiche per migliorare le prestazioni degli agenti conversazionali

Evita problemi di prestazioni negli agenti conversazionali comprendendo i punti di guasto comuni e seguendo le migliori pratiche.

Quote e limiti

Comprendi quote e limiti, come le richieste per minuto (richieste per minuto, quando una richiesta è un messaggio inviato a un agente) e il numero di richieste Power Platform consentite entro un arco di 24 ore.

Le quote si applicano ai tuoi agenti insieme ai vincoli di capacità che accompagnano un piano Microsoft Copilot Studio.

Ottimizza il tuo agente al fine di migliorare le prestazioni

Per ottimizzare le prestazioni del tuo agente, considera le seguenti migliori pratiche:

  • Posiziona strategicamente le chiamate API e le invocazioni di connettori nei flussi di conversazione per evitare di far aspettare gli utenti per il completamento di più processi.
  • Quando applicabile, la cache recuperava le informazioni utilizzando variabili, invece di effettuare più chiamate API o invocazioni al flusso.
  • I flussi cloud richiamati dagli agenti di Copilot Studio possono introdurre latenza. Considera invece di usare chiamate dirette tramite connettore o il nodo Send HTTP Request .
  • Comprendere il compromesso tra prestazioni e complessità della classica NLU e dell'orchestrazione generativa in Copilot Studio. I modelli di comprensione del linguaggio naturale (NLU) funzionano bene per intenti specifici, ma faticano con richieste complesse. I modelli di IA generativa gestiscono una gamma più ampia di input ma possono introdurre latenza.
  • Attiva la modalità espresso.

Ottimizza il flusso nel cloud per le prestazioni

Se il tuo agente chiama un flusso Power Automate, assicurati che i flussi cloud siano ottimizzati.