Comparteix a través de


Optimització del rendiment per a càrregues de treball d'aplicacions intel·ligents

L'eficiència del rendiment és la capacitat de la vostra càrrega de treball per escalar de manera eficient per satisfer les demandes dels usuaris. Supervisar el rendiment de la càrrega de treball de la vostra aplicació intel·ligent és crucial per garantir que funcioni de manera eficaç i eficient.

L'equip de càrrega de treball ha d'establir mètriques clau de rendiment, revisar periòdicament el rendiment del sistema i diagnosticar qualsevol problema ràpidament. Els procediments de monitorització i diagnòstic efectius ajuden a mantenir la fiabilitat del sistema i la satisfacció de l'usuari.

Definir objectius de rendiment

La identificació de mètriques clau de rendiment implica determinar les mesures essencials que fan un seguiment del progrés cap a l'assoliment dels objectius de rendiment de la càrrega de treball. Aquestes mètriques proporcionen una manera quantificable de mesurar i millorar l'eficiència del rendiment.

Quan identifiqueu mètriques clau en què centrar-vos, tingueu en compte les mètriques relacionades amb la capacitat, el temps de resposta, la taxa de desviació i la participació i els resultats:

  • Capacitat: el rendiment i la concurrència són mètriques de capacitat de mostra. El rendiment es refereix a la capacitat de gestionar un nombre específic de transaccions en un període de temps determinat. Per exemple, un agent pot gestionar 200.000 sessions de xat al mes. Tingueu en compte també les variacions estacionals i el pic màxim previst de converses simultànies. La concurrència és una mesura d'usuaris o accions simultànies. Per exemple, un agent pot gestionar un màxim de 5.000 xats simultanis durant la temporada alta. Entendre els volums de destinació ajuda a validar l'arquitectura i l'escala de destinació.

  • Temps de resposta: la latència i el temps de càrrega són mètriques de temps de resposta habituals. La latència és el temps que es triga a respondre a una sol·licitud (200 mil·lisegons). El temps de càrrega és el temps que triga un agent a activar-se i respondre al primer missatge. Entendre la latència màxima esperada perquè l'agent respongui consultes i definir un enfocament per gestionar accions de llarga durada (per exemple, esperar que un sistema extern retorni dades).

  • Taxa de desviació: En el context de la IA conversacional, la desviació és un indicador que representa el percentatge de sol·licituds que es completen d'autoservei que d'altra manera serien gestionades pels representants del servei d'atenció al client. En altres paraules, es refereix al nombre de tasques que un equip ja no ha de gestionar a causa de l'automatització. L'optimització de la taxa de desviació de l'agent és una de les principals àrees d'enfocament per a les organitzacions per assolir els seus objectius empresarials, des del retorn de la inversió (ROI) i la satisfacció del client (CSAT), fins a la millora del rendiment general de l'agent. Microsoft Copilot Studio proporciona una visió general del rendiment del vostre agent, inclosos indicadors clau com la taxa de resolució, la taxa d'escalada i el CSAT.

  • Compromís i resultats: el seguiment de la participació i els resultats de la conversa és clau per mesurar les mètriques de rendiment dels agents i identificar àrees de millora. Obteniu més informació a Mesurar la participació dels agents i Mesurar els resultats dels agents.

Planificació del rendiment

Els recursos de la càrrega de treball tenen limitacions de rendiment. Les limitacions de rendiment s'apliquen a les funcions de cada servei. Cal entendre les limitacions dels recursos de la càrrega de treball i tenir-les en compte en les decisions de disseny. Per exemple, hauríeu de saber si les limitacions de recursos us obliguen a canviar l'enfocament de disseny o a canviar els recursos completament.

  • Entendre els volums objectiu. Els volums de destinació ajuden a validar l'arquitectura i l'escala de destinació, els aspectes de llicència de l'agent i l'efecte potencial en Dataverse l'emmagatzematge de les transcripcions de converses.
  • Entendre els límits de la plataforma. Quan integreu la càrrega de treball de l'aplicació intel·ligent amb sistemes externs, per exemple, mitjançant Power Automate sol·licituds HTTP o HTTP, és important validar que tots els components puguin gestionar la càrrega.
  • Identificar colls d'ampolla. Mesureu el rendiment i els temps de resposta per identificar els components del vostre sistema que poden ser problemàtics a mesura que creix la càrrega de treball. Identifiqueu colls d'ampolla en el procés d'extrem a extrem mitjançant capacitats d'anàlisi de mineria de processos com ara la reelaboració i l'anàlisi de la causa arrel.

Més informació: Recomanacions per a la planificació del rendiment

Supervisió del rendiment

L'optimització del rendiment requereix dades per mesurar el rendiment actual d'una càrrega de treball o d'un flux en relació amb els seus objectius de rendiment. Recollir una quantitat i varietat suficients de dades per mesurar amb precisió el rendiment del codi i la infraestructura en relació amb els objectius de rendiment establerts. Assegureu-vos que cada component i flux de la càrrega de treball generi automàticament mètriques i registres continus i significatius.

Superviseu atentament el rendiment de la vostra càrrega de treball d'aplicacions intel·ligents per assegurar-vos que funcioni amb la màxima eficàcia i eficiència.

Copilot Studio Proporciona anàlisis completes que us permeten entendre l'ús d'un agent i els indicadors clau de rendiment.

Podeu consultar informes relacionats amb:

  • Rendiment i ús
  • Satisfacció del client
  • Informació de la sessió
  • Ús del tema
  • Sessions facturades

A més de les funcions d'anàlisi natives que conté Copilot Studio, podeu enviar dades de telemetria a Application Insights. Obteniu més informació a Capturar telemetria amb Application Insights. Superviseu contínuament el rendiment i detecteu anomalies mitjançant eines com ara Azure Monitor, Application Insights Log Analytics i alertes.

Definiu els indicadors clau de rendiment (KPI) que voleu supervisar per mesurar l'èxit de la càrrega de treball de l'aplicació intel·ligent, com ara la taxa d'interacció, la taxa de resolució i la taxa de desviació. Primer, reviseu els escriptoris digitals natius per entendre les dades disponibles. A continuació, decidiu si la creació d'un informe personalitzat satisfaria millor les vostres necessitats específiques.

Més informació:

Optimització contínua del rendiment

L'optimització proactiva del rendiment implica implementar mesures per millorar i millorar el rendiment de la càrrega de treball abans que sorgeixin problemes. Les mesures proactives inclouen la identificació de possibles colls d'ampolla, el seguiment de les mètriques de rendiment i la implementació d'optimitzacions per garantir que la càrrega de treball funcioni de manera eficient i compleixi els objectius de rendiment.

Per millorar contínuament la càrrega de treball de l'aplicació intel·ligent, programeu revisions periòdiques del rendiment de l'agent:

Indicador de rendiment Definició
Índex de resolució Percentatge de sol·licituds d'usuari que l'agent resol correctament sense necessitat d'escalar a un representant del servei d'atenció al client.
Taxa d'interacció Percentatge del total de sessions compromeses. Una sessió es considera activada quan un usuari interactua amb l'agent d'una manera significativa, com ara activar un tema que no és del sistema, escalar la sessió o invocar un tema alternatiu.
Taxa d’abandonament Percentatge de sessions compromeses que acaben sense arribar a una resolució o escalada. Essencialment, mesura la freqüència amb què els usuaris surten o deixen d'interactuar amb l'agent abans que el seu problema es resolgui o s'escali a un representant.
Taxa de derivació Percentatge de sessions compromeses que s'escalen a un representant. Aquesta mètrica és clau per entendre la freqüència amb què l'agent no pot resoldre les consultes dels usuaris per si mateix i requereix intervenció humana.
Enunciats no reconeguts Es produeix quan el model de comprensió del llenguatge natural (NLU) de l'agent no pot fer coincidir una entrada de l'usuari amb cap intent o tema predefinit. El sistema no pot determinar la intenció de l'usuari en funció de l'entrada proporcionada.
CSAT Satisfacció del client.
Temes amb baixa resolució Es refereix a temes de conversa que sovint no resolen les consultes dels usuaris de manera eficaç. Aquests temes sovint condueixen a la insatisfacció de l'usuari, l'abandonament o l'escalada a un representant.

Aquesta revisió ajuda a prioritzar l'endarreriment de les actualitzacions de l'agent. Per exemple, si les declaracions no reconegudes s'escalen sovint a un representant del servei d'atenció al client, aprofiteu l'oportunitat per millorar la desviació. Analitzeu els patrons d'usuari que desencadenen enunciats alternatius i no reconeguts, i entreneu temes existents o creeu-ne de nous per equipar l'agent per satisfer millor les necessitats dels usuaris.

Més informació: