Бележка
Достъпът до тази страница изисква удостоверяване. Можете да опитате да влезете или да промените директориите.
Достъпът до тази страница изисква удостоверяване. Можете да опитате да промените директориите.
Ефективността на производителността е способността на вашето работно натоварване да се мащабира ефективно, за да отговори на изискванията, поставени към него от потребителите. Наблюдението на производителността на работното натоварване на вашето интелигентно приложение е от решаващо значение, за да се гарантира, че то работи ефективно и ефикасно.
Екипът за работно натоварване трябва да установи ключови показатели за ефективност, редовно да преглежда производителността на системата и да диагностицира незабавно всички проблеми. Ефективните процедури за наблюдение и диагностика помагат за поддържане на надеждността на системата и удовлетвореността на потребителите.
Определете цели за ефективност
Идентифицирането на ключови показатели за ефективност включва определяне на основните измервания, които проследяват напредъка към постигане на целите за ефективност на работното натоварване. Тези показатели предоставят количествено измерим начин за измерване и подобряване на ефективността на изпълнението.
Когато идентифицирате ключови показатели, върху които да се съсредоточите, вземете предвид показателите, свързани с капацитета, времето за реакция, степента на отклонение, ангажираността и резултатите:
Капацитет: Пропускателната способност и паралелността са примерни показатели за капацитета. Пропускателната способност се отнася до способността за обработка на определен брой транзакции в рамките на даден период от време. Например, един агент може да обработва 200 000 чат сесии на месец. Също така вземете предвид сезонните колебания и очаквания максимален пик на едновременните разговори. Паралелността е мярка за едновременни потребители или действия. Например, агент може да обработва максимум 5,000 едновременни чата по време на пиковия сезон. Разбирането на целевите томове помага за валидиране на целевата архитектура и мащаб.
Време за реакция: Латентността и времето за зареждане са често срещани показатели за времето за реакция. Латентността е времето, необходимо за отговор на заявка (200 милисекунди). Времето за зареждане е времето, необходимо на агента да стане активен и да отговори на първото съобщение. Разберете очакваната максимална латентност за агента да отговори на заявки и определете подход за обработка на дългосрочни действия (например изчакване на външна система да върне данни).
Степен на отклонение: В контекста на разговорния AI отклонението е показател, представляващ процента на заявките, които са изпълнени по начин на самообслужване, които иначе биха били обработени от представители на отдела за обслужване на клиенти. С други думи, това се отнася до броя на задачите, с които екипът вече не трябва да се справя поради автоматизацията. Оптимизирането на степента на отклонение на агента е една от основните области на фокус за организациите за постигане на техните бизнес цели, от възвръщаемост на инвестициите (ROI) и удовлетвореност на клиентите (CSAT) до подобряване на цялостното представяне на агента. Microsoft Copilot Studio предоставя преглед на ефективността на вашия агент, включително ключови показатели като степен на разрешаване, скорост на ескалация и CSAT.
Ангажираност и резултати: Проследяването на ангажираността и резултатите от разговора е от ключово значение за измерване на показателите за ефективност на агентите и идентифициране на области за подобрение. Научете повече в Измерване на ангажираността на агента и Измерване на резултатите на агента.
Планиране на изпълнението
Ресурсите във вашето работно натоварване имат ограничения за производителността. Ограниченията на производителността важат за функциите във всяка услуга. Трябва да разберете ограниченията на ресурсите във вашето работно натоварване и да вземете предвид тези ограничения във вашите дизайнерски решения. Например трябва да знаете дали ограниченията на ресурсите изискват да промените подхода за проектиране или да промените ресурсите изцяло.
- Разберете целевите обеми. Целевите томове помагат за валидиране на целевата архитектура и мащаб, лицензионните аспекти на агента и потенциалния ефект върху Dataverse съхранението за преписи на разговори.
- Разберете ограниченията на платформата. Когато интегрирате работното натоварване на вашето интелигентно приложение с външни системи, например чрез Power Automate или HTTP заявки, е важно да потвърдите, че всеки компонент може да се справи с натоварването.
- Идентифицирайте тесните места. Измерете пропускателната способност и времето за реакция, за да идентифицирате компонентите на вашата система, които могат да станат проблематични с нарастването на работното натоварване. Идентифицирайте тесните места в процеса от край до край, като използвате възможности за анализ на извличане на процеси, като преработка и анализ на първопричините.
Научете повече: Препоръки за планиране на ефективността
Мониторинг на изпълнението
Оптимизацията на производителността изисква данни за измерване на текущата производителност на работно натоварване или поток спрямо целите за ефективност. Съберете достатъчно количество и разнообразие от данни за точно измерване на ефективността на кода и инфраструктурата спрямо зададените цели за ефективност. Уверете се, че всеки компонент и поток в рамките на работното натоварване автоматично генерира непрекъснати и смислени показатели и регистрационни файлове.
Бдително наблюдавайте производителността на вашето интелигентно работно натоварване на приложението, за да сте сигурни, че то работи с максимална ефективност и ефикасност.
Copilot Studio предоставя изчерпателни готови анализи , които ви позволяват да разберете използването на агента и ключовите показатели за ефективност.
Можете да преглеждате отчети, свързани с:
- Производителност и употреба
- Удовлетвореност на клиента
- Информация за сесия
- Използване на темата
- Таксувани сесии
В допълнение към основните функции Copilot Studio за анализ в тях можете да изпращате телеметрични данни до Application Insights. Научете повече в Заснемане на телеметрия с Application Insights. Непрекъснато наблюдавайте производителността и откривайте аномалии с помощта на инструменти като Azure Monitor, Log Analytics Application Insights и предупреждения.
Определете ключовите показатели за ефективност (KPI), които възнамерявате да наблюдавате, за да измерите успеха на работното натоварване на вашето интелигентно приложение, като например степен на ангажираност, степен на разделителна способност и степен на отклонение. Първо прегледайте основните табла, за да разберете наличните данни. След това решете дали създаването на персонализиран отчет би отговаряло по-добре на вашите специфични нужди.
Научете повече:
Непрекъсната оптимизация на производителността
Проактивното оптимизиране на производителността включва прилагане на мерки за подобряване и подобряване на производителността на работното натоварване, преди да възникнат проблеми. Проактивните мерки включват идентифициране на потенциални затруднения, наблюдение на показателите за ефективност и внедряване на оптимизации, за да се гарантира, че работното натоварване работи ефективно и отговаря на целите за ефективност.
За да подобрявате непрекъснато работното натоварване на вашето интелигентно приложение, планирайте редовни прегледи на работата на агента:
Индикатор за ефективност | Дефиниция |
---|---|
Честота на разрешаване | Процентът на потребителските заявки, които са успешно разрешени от агента, без да се изисква ескалация до представител на отдела за обслужване на клиенти. |
Честота на ангажимент | Процент от общия брой ангажирани сесии. Сесията се счита за ангажирана, когато потребителят взаимодейства с агента по смислен начин, като например задействане на несистемна тема, ескалиране на сесията или извикване на резервна тема. |
Честота на изоставяне | Процент на ангажираните сесии, които приключват без постигане на решение или ескалация. По същество той измерва колко често потребителите напускат или спират да взаимодействат с агента, преди проблемът им да бъде разрешен или ескалиран до представител. |
Честота на ескалация | Процент на ангажираните сесии, които ескалират до представител. Този показател е ключов за разбирането колко често агентът не е в състояние да разреши потребителски заявки сам и изисква човешка намеса. |
Неразпознати изказвания | Възниква, когато моделът за разбиране на естествен език (NLU) на агента не може да съпостави въведен от потребителя с предварително дефинирано намерение или тема. Системата не е в състояние да определи намерението на потребителя въз основа на предоставения вход. |
CSAT | Удовлетвореност на клиентите. |
Теми с ниска разделителна способност | Отнася се за теми на разговори, които често не успяват да разрешат ефективно потребителските заявки. Тези теми често водят до недоволство на потребителите, изоставяне или ескалация до представител. |
Този преглед помага да се приоритизира изоставането на актуализациите на агентите. Например, ако неразпознатите изказвания често се ескалират до представител на отдела за обслужване на клиенти, възползвайте се от възможността да подобрите отклонението. Анализирайте потребителските модели, които задействат резервни и неразпознати изказвания, и или обучете съществуващи теми, или създайте нови, за да подготвите агента да отговори по-добре на нуждите на потребителите.
Научете повече: