Принципи проектування робочих навантажень інтелектуальних додатків

2024-10-16

Рекомендації щодо планування, розробки та підтримки інтелектуальних робочих навантажень додатків ґрунтуються на Power Platform Well-Architected та його п’яти стовпах архітектурної досконалості.

Добре архітектурний стовп	Підсумок
Надійність	Робоче навантаження інтелектуальних додатків вимагає стійкості на рівні архітектури, щоб забезпечити високу доступність моделей і робочих процесів штучного інтелекту та їх здатність швидко відновлюватися після збою. Впроваджуйте надійні механізми обробки помилок. Відмовостійкий архітектура також підтримує цілісність даних, що використовуються моделями штучного інтелекту, забезпечуючи стабільні та точні результати.
Безпека	Інтелектуальне робоче навантаження програми часто обробляє конфіденційні дані. Захистіть конфіденційні дані, які використовуються та генеруються моделями штучного інтелекту. Впроваджуйте шифрування, контроль доступу та регулярні аудити безпеки. Переконайтеся, що робоче навантаження відповідає відповідним стандартам регулювання, таким як GDPR (Загальний регламент про захист даних) і HIPAA (Закон про перенесення та підзвітність медичного страхування), щоб захистити конфіденційність і дані користувачів.
Ефективність роботи	Інтелектуальне робоче навантаження програми має бути розроблено таким чином, щоб безперешкодно масштабуватися зі збільшенням обсягів даних і вимог користувачів. Визначте ключові показники продуктивності та запровадьте моніторинг, щоб відстежувати прогрес у досягненні цілей продуктивності робочого навантаження. У контексті інтелектуальних робочих навантажень додатків продуктивність також враховує кількість запитів і взаємодій, які можуть бути виконані за допомогою самообслуговування, що в іншому випадку вимагало б втручання людини.
Операційна досконалість	Робоче навантаження інтелектуальної програми вимагає всебічного моніторингу та ведення журналу для відстеження продуктивності та працездатності моделей штучного інтелекту, робочих процесів і розмов. Моніторинг допомагає швидко виявляти та вирішувати проблеми. Стовп «Операційна ефективність» рекомендує використовувати автоматизацію для оптимізації операцій, зменшення ручного втручання та мінімізації ризику людських помилок.
Оптимізація досвіду	Інтелектуальне робоче навантаження програми має надавати пріоритет дизайну розмови, щоб забезпечити зручний для користувача досвід, який дозволяє користувачам досягати своїх цілей з мінімальними зусиллями. Дизайн повинен враховувати теми, з якими генеративний ШІ не може впоратися, і включати резервні механізми. Також впроваджуйте механізми збору відгуків користувачів і постійно вдосконалюйте моделі штучного інтелекту та робоче навантаження на основі цих відгуків.

Надійність

Коли ви розробляєте інтелектуальне робоче навантаження програми Power Platform, зосередьтеся на відмовостійкості та доступності.

Стійкість – це здатність системи відновлюватися після збоїв і продовжувати функціонувати.
Доступність забезпечує безперебійну роботу роботи. Висока доступність мінімізує час простою додатків і покращує відновлення після інцидентів.

Надійність важлива при розробці будь-якого робочого навантаження, і генеративний ШІ не є винятком. Насправді існують унікальні фактори, які слід враховувати під час розробки робочих навантажень генеративного ШІ. Визнання та наголошення на стійкості має важливе значення для генеративних робочих навантажень штучного інтелекту для забезпечення організаційної доступності та підтримки безперервності бізнесу.

Збої можуть статися і в хмарі. Замість того, щоб намагатися повністю запобігти збоям, ваша мета повинна полягати в тому, щоб мінімізувати наслідки одного несправного компонента. Використовуйте наведену нижче інформацію, щоб мінімізувати час простою та переконатися, що рекомендовані методи для високої доступності вбудовані у ваше інтелектуальне робоче навантаження програми:

Переконайтеся, що робоче навантаження може впоратися зі збоями та продовжувати працювати, навіть якщо воно має обмежену функціональність. Визначте потенційні несправності та зробіть систему стійкою, щоб терпіти ці несправності та відновлюватися після них.
Зробіть робоче навантаження помітним, щоб команди розробників вчилися на невдачах. Швидко виявляйте та усувайте проблеми за допомогою механізмів моніторингу, ведення журналів і оповіщення.
Переконайтеся, що робоче навантаження можна масштабувати, щоб справлятися з різними навантаженнями, що особливо важливо для робочих навантажень зі штучним інтелектом, вимоги до яких можуть коливатися.
Впроваджуйте надійні механізми обробки та відновлення помилок. Налаштуйте автоматичні оповіщення про збої в системі та майте чіткий план швидкого відновлення.
Перевірте цільову архітектуру та масштабуйте, розуміючи цільові обсяги повідомлень у чаті або розмов. Цільові обсяги також допомагають перевірити аспекти ліцензування інтелектуальної програми та потенційний вплив на Dataverse сховище для стенограм розмов.

Для інтелектуальних програм, які використовують можливості генеративного штучного інтелекту, враховуйте не лише стійкість і доступність, але й надійність і точність відповідей, що забезпечуються інтелектуальним робочим навантаженням. Враховуйте наступні рекомендації для кожного розгляду дизайну:

Оптимізація для розширеної генерації отримання (RAG): переконайтеся, що ваші дані чисті та добре структуровані, створюйте ефективні вбудовування та індекси для швидкого пошуку, а також впроваджуйте надійні механізми моніторингу та зворотного зв’язку для постійного покращення продуктивності робочого навантаження.
Ефективні підказки: Створюйте точні та контекстуально релевантні підказки, щоб спрямовувати штучний інтелект на отримання точних відповідей.
Регулярна оцінка: Впроваджуйте постійний моніторинг і тестування результатів штучного інтелекту для оцінки точності, актуальності та дотримання етичних норм.
Цикли зворотного зв’язку: Встановіть механізми зворотного зв’язку, де користувачі можуть повідомляти про неточності, які потім можуть бути використані для уточнення та вдосконалення моделей. Microsoft Copilot Studio Надає аналітику задоволеності клієнтів, яка надає дієву інформацію про фактори задоволеності або незадоволеності відповідями вашого агента.
Навчання для конкретної предметної області: уточнюйте моделі на даних для конкретної області, щоб підвищити точність у конкретних контекстах.
Регулярні оновлення: періодично оновлюйте моделі новими даними, щоб підтримувати їхню актуальність і точність.
Нерозпізнані наміри: обробляйте нерозпізнані наміри, використовуючи генеративні відповіді для пошуку відповідей із доступних джерел даних і використовуючи резервну тему для інтеграції з іншими системами.

Безпека

У моделі спільної відповідальності:

Організації несуть основну відповідальність за управління та експлуатацію робочих навантажень.
Корпорація Майкрософт керує безпекою базової інфраструктури, включно з центрами обробки даних, мережевою безпекою, заходами фізичної безпеки та вбудованими функціями безпеки, такими як шифрування, керування ідентифікаційними даними та відповідність галузевим стандартам. Дізнайтеся більше про безпеку в Microsoft Power Platform галузі Copilot Studio та безпеку та управління.

Ми рекомендуємо вам регулярно оцінювати послуги та технології, щоб гарантувати, що ваша система безпеки адаптується до мінливого ландшафту загроз. Чітке розуміння моделі спільної відповідальності з постачальниками має важливе значення під час співпраці над впровадженням заходів безпеки.

Ви можете використовувати кілька методів для захисту робочих навантажень інтелектуальних програм:

Автентифікація користувачів і контроль доступу: впроваджуйте надійні заходи автентифікації та контролю доступу, щоб гарантувати, що лише авторизовані користувачі можуть отримати доступ до інтелектуального робочого навантаження програми. Несанкціонований доступ до робочого навантаження інтелектуальної програми може призвести до витоку даних, неправильного використання ресурсів і потенційного розкриття конфіденційної інформації. Слабкі або неефективні механізми автентифікації також можуть призвести до компрометації облікових записів користувачів.
Відповідність: Забезпечте захист даних і керування ними відповідно до нормативних вимог. Ознайомтеся з місцевими нормативними актами, будьте в курсі місцевих законів про захист даних і переконайтеся, що ваша стратегія проживання даних відповідає цим правилам.
Інтеграція: захистіть усі інтеграції з керівниками служб. Контролюйте та захищайте цілісність мережі внутрішніх і зовнішніх кінцевих точок за допомогою функцій безпеки та пристроїв, таких як брандмауери або брандмауери веб-додатків.
Постійний моніторинг та аудит: Постійно контролюйте та перевіряйте діяльність робочих навантажень, щоб виявляти та активно реагувати.
Інструменти безпеки Azure: використовуйте вбудовані інструменти безпеки Azure, такі як Microsoft Defender for Cloud і Azure Policy, для моніторингу та забезпечення дотримання політик безпеки.
Навчання співробітників: Ознайомте співробітників з найкращими практиками захисту даних та важливістю дотримання вимог щодо зберігання даних.

Ефективність роботи

Ефективність продуктивності – це здатність вашого робочого навантаження ефективно масштабуватися відповідно до вимог, що висуваються до нього користувачами.

Підвищуйте ефективність роботи за допомогою:

Розуміння цільових обсягів для перевірки цільової архітектури та масштабування. Цільові обсяги також допомагають перевірити аспекти ліцензування генеративного ШІ (агента) та потенційний вплив на Dataverse сховище для стенограм розмов.
Розуміння обмежень платформи. Коли ви інтегруєте своє інтелектуальне робоче навантаження програми із зовнішніми системами, наприклад, через або Power Automate HTTP-запити, важливо перевірити, що кожен компонент може впоратися з навантаженням.
Постійний моніторинг продуктивності та виявлення аномалій за допомогою таких інструментів, як Azure Monitor, Log Analytics Application Insights та сповіщення.
Розуміння очікуваного часу реагування для:
- Перше завантаження чату та відповідь на перше повідомлення
- Максимальна затримка для відповідей агента на запити користувачів
- Підхід для обробки тривалих дій (наприклад, очікування, поки зовнішня система поверне дані)
Оптимізація швидкості відхилення, або швидкості, з якою запити виконуються в режимі самообслуговування завдяки автоматизації (зменшення кількості запитів, які потребують людської допомоги). Дізнайтеся більше в статті Оптимізація продуктивності для інтелектуальних робочих навантажень програм.

Розгляд кожного з цих аспектів допоможе вам створити інтелектуальне робоче навантаження програми з послідовним, злагодженим користувацьким досвідом.

Досконалість бізнес-процесів

Операційна досконалість передбачає розробку ефективних процесів для підтримки вашого інтелектуального робочого навантаження додатків.

Операційні збої можуть вплинути на інші області проектування, а також на загальний успіх робочого навантаження інтелектуального додатку. Важливо адаптувати свої операційні процеси для підтримки інтелектуального робочого навантаження додатків у продакшн. Наступні рекомендації сприяють підвищенню операційної ефективності:

Автоматизуйте процеси збірки та випуску. Повністю автоматизовані процеси збірки та випуску зменшують тертя та збільшують швидкість розгортання оновлень, забезпечуючи повторюваність і узгодженість у різних середовищах. Автоматизація скорочує цикл зворотного зв’язку: від впровадження розробниками змін до отримання інформації про якість коду, покриття тестів, відмовостійкість, безпеку та продуктивність, що сприяє продуктивності розробників.
Підтримуйте врядування та дотримання вимог.
Проаналізуйте продуктивність навколишнього середовища та здоров’я на виробництві.
Ведіть документацію, яка фіксує:
- Процедури усунення несправностей
- Плани аварійного відновлення
Надайте рекомендації щодо виправлення ситуації щодо прискорення процесу вирішення проблем.
Забезпечте постійне операційне вдосконалення. Надавайте пріоритет рутинному вдосконаленню системи та користувацького досвіду. Використовуйте модель охорони здоров’я для розуміння та вимірювання операційної ефективності, а також механізми зворотного зв’язку, які дозволяють командам додатків розуміти та усувати прогалини ітеративним способом.

Ці рекомендації допоможуть вашій команді ефективно й прозоро співпрацювати.

Оптимізація досвіду

Інтелектуальне робоче навантаження програми має надавати пріоритет дизайну розмови, щоб забезпечити зручний для користувача досвід, який дозволяє користувачам досягати своїх цілей з мінімальними зусиллями. Дизайн повинен враховувати теми, з якими генеративний ШІ не може впоратися, і включати резервні механізми. Також впроваджуйте механізми збору відгуків користувачів і постійно вдосконалюйте моделі штучного інтелекту та робоче навантаження на основі цих відгуків.

Оптимізація користувацького досвіду для інтелектуального робочого навантаження програми включає кілька ключових міркувань:

Дизайн бесід: створюйте інтуїтивно зрозумілі та прості в навігації розмови. Використовуйте чітку та лаконічну мову та переконайтеся, що штучний інтелект може ефективно обробляти поширені запити користувачів. Зосередьтеся на допомозі користувачам у досягненні своїх цілей з мінімальними зусиллями. Розумійте наміри користувачів і швидко надавайте відповідні відповіді, щоб забезпечити безперебійну та ефективну взаємодію з користувачем.
Обробка обмежень: запровадьте резервні механізми для тем, з якими генеративний штучний інтелект не може впоратися, наприклад, перенаправлення користувачів до представників служби підтримки клієнтів або надання альтернативних ресурсів. Розробіть надійні процеси обробки помилок, щоб витончено керувати неочікуваними вхідними даними. Інформуйте користувачів, коли штучний інтелект не може обробити їхній запит, і пропонуйте альтернативи.
Відгуки користувачів: інтегруйте механізми для безперервного збору відгуків користувачів. Microsoft Copilot Studio Надає аналітику задоволеності клієнтів, яка надає дієву інформацію про фактори задоволеності або незадоволеності відповідями вашого агента. Використовуйте зібрані відгуки для уточнення та вдосконалення моделей штучного інтелекту та загального робочого навантаження. Регулярні оновлення на основі введених користувачем даних можуть значно покращити взаємодію з користувачем.
Налаштування та персоналізація: Налаштуйте підказки та інструкції відповідно до ваших конкретних випадків використання та потреб користувача, щоб забезпечити більш точні та актуальні відповіді. Використовуйте динамічні ланцюжки, щоб автоматизувати тригери та ефективно керувати потоками тем, щоб зменшити потребу в попередньо визначених темах вручну та покращити здатність штучного інтелекту розпізнавати наміри користувачів. Дізнайтеся більше в статті Оптимізація підказок і конфігурація теми.

Наступні кроки

Принципи проектування Well-Architected Framework включені в області проектування робочих навантажень інтелектуальних додатків. Кожна область проектування містить цільові вказівки, які допоможуть вам швидко отримати доступ до інформації, необхідної для ефективного підвищення продуктивності.

Почніть з огляду міркувань щодо дизайну, необхідних для підтримки робочого навантаження: