Tìm hiểu về tác nhân AI của Microsoft Agent Framework
Mẹo
Xem tab Văn bản và hình ảnh để biết thêm chi tiết!
Tác nhân AI là một chương trình sử dụng AI tạo ra để diễn giải dữ liệu, đưa ra quyết định và thực hiện các tác vụ thay mặt cho người dùng hoặc các ứng dụng khác. Các tác nhân AI dựa vào các mô hình ngôn ngữ lớn để thực hiện nhiệm vụ của họ. Không giống như các chương trình truyền thống, các tác nhân AI có thể hoạt động tự động, xử lý quy trình làm việc phức tạp và tự động hóa các quy trình mà không yêu cầu sự giám sát liên tục của con người.
AI Agent có thể được phát triển bằng nhiều công cụ và nền tảng khác nhau, bao gồm cả Microsoft Agent Framework. Microsoft Agent Framework là một SDK mã nguồn mở cho phép các nhà phát triển dễ dàng tích hợp các mô hình AI mới nhất vào ứng dụng của họ. Khuôn khổ này cung cấp một nền tảng toàn diện để tạo các tác nhân chức năng có thể sử dụng xử lý ngôn ngữ tự nhiên để hoàn thành nhiệm vụ và cộng tác với các tác nhân khác.
Các thành phần cốt lõi của Microsoft Agent Framework
Microsoft Agent Framework cung cấp các thành phần khác nhau có thể được sử dụng riêng lẻ hoặc kết hợp.
Tác nhân - cung cấp giao diện nhất quán và cho phép các tính năng khác nhau như điều phối nhiều tác nhân. Ngay lập tức, các nhân viên hỗ trợ gọi chức năng, cuộc trò chuyện nhiều lượt với lịch sử trò chuyện, công cụ do dịch vụ cung cấp, đầu ra có cấu trúc và phản hồi trực tuyến.
Nhà cung cấp trò chuyện - cung cấp các khái niệm trừu tượng để kết nối với các dịch vụ AI từ các nhà cung cấp khác nhau trong một giao diện chung. Các nhà cung cấp được hỗ trợ bao gồm Azure OpenAI, OpenAI, Anthropic, Copilot, v.v. thông qua
BaseAgentphần trừu tượng.Công cụ chức năng - vùng chứa cho các chức năng tùy chỉnh mở rộng khả năng của tác nhân. Các tổng đài viên có thể tự động gọi các chức năng để tích hợp với các API và dịch vụ bên ngoài.
Các công cụ tích hợp - các khả năng được xây dựng sẵn bao gồm Trình thông dịch mã để thực thi Python, Tìm kiếm tệp để phân tích tài liệu và Tìm kiếm web để truy cập internet.
Quản lý cuộc trò chuyện - hệ thống tin nhắn có cấu trúc với các vai trò (NGƯỜI DÙNG, TRỢ LÝ, HỆ THỐNG, CÔNG CỤ) và
AgentSessioncho ngữ cảnh cuộc trò chuyện liên tục qua các tương tác.Điều phối quy trình làm việc - hỗ trợ quy trình làm việc tuần tự, thực thi đồng thời, trò chuyện nhóm và các mẫu bàn giao để cộng tác nhiều nhân viên phức tạp.
Microsoft Agent Framework giúp hợp lý hóa việc tạo tổng đài viên và cho phép nhiều tổng đài viên làm việc cùng nhau trong các cuộc hội thoại đồng thời bao gồm đầu vào của con người. Khung này hỗ trợ các loại tác nhân khác nhau từ nhiều nhà cung cấp, bao gồm Microsoft Foundry, Azure OpenAI, OpenAI, Microsoft Copilot Studio và các tác nhân Anthropic.
Đại lý Microsoft Foundry là gì?
Microsoft Foundry Agents cung cấp các chức năng cấp doanh nghiệp bằng cách sử dụng Microsoft Foundry Agent Service. Các tác nhân này cung cấp các tính năng nâng cao cho các tình huống doanh nghiệp phức tạp. Các lợi ích chính bao gồm:
Khả năng cấp doanh nghiệp – Được xây dựng cho môi trường Azure với các tính năng AI nâng cao bao gồm trình thông dịch mã, tích hợp công cụ chức năng và hỗ trợ Giao thức ngữ cảnh mô hình (MCP).
Gọi công cụ tự động – Tổng đài viên có thể tự động gọi và thực thi các công cụ, tích hợp liền mạch với Azure AI Search, Azure Functions và các dịch vụ Azure khác.
Quản lý chuỗi và hội thoại – Cung cấp các cơ chế tích hợp để quản lý trạng thái hội thoại liên tục giữa các phiên, đảm bảo tương tác nhiều tổng đài viên suôn sẻ.
Tích hợp doanh nghiệp an toàn – Cho phép phát triển tác nhân AI an toàn và tuân thủ với xác thực Azure CLI, RBAC và các tùy chọn lưu trữ có thể tùy chỉnh.
Khi bạn sử dụng Microsoft Foundry Agents, bạn sẽ nhận được toàn bộ sức mạnh của các chức năng Azure dành cho doanh nghiệp kết hợp với các tính năng của Microsoft Agent Framework. Các tính năng này có thể giúp bạn tạo quy trình làm việc mạnh mẽ dựa trên AI có thể mở rộng quy mô hiệu quả trên các ứng dụng kinh doanh.
Khái niệm cốt lõi về khung đại lý
BaseAgent - nền tảng cho tất cả các tổng đài viên với các phương pháp nhất quán, cung cấp một giao diện thống nhất trên tất cả các loại tổng đài viên.
Phiên tổng đài viên - quản lý ngữ cảnh hội thoại liên tục và lưu trữ lịch sử hội thoại giữa các phiên bằng cách sử dụng lớp
AgentSessionhọc.Tin nhắn trò chuyện - cấu trúc có tổ chức để giao tiếp với nhân viên bằng cách sử dụng nhắn tin dựa trên vai trò (USER, ASSISTANT, SYSTEM, TOOL) cho phép giao tiếp và tích hợp trơn tru.
Điều phối quy trình làm việc - hỗ trợ quy trình làm việc tuần tự, chạy song song nhiều tổng đài viên, hội thoại nhóm giữa các tổng đài viên và chuyển quyền kiểm soát giữa các tổng đài viên chuyên biệt.
Hỗ trợ đa phương thức - cho phép các tác nhân làm việc với văn bản, hình ảnh và đầu ra có cấu trúc, bao gồm khả năng hiển thị và tạo phản hồi an toàn cho kiểu.
Công cụ chức năng - cho phép bạn thêm các chức năng tùy chỉnh cho tác nhân bằng cách bao gồm các hàm tùy chỉnh với việc tạo lược đồ tự động từ các hàm Python.
Phương pháp xác thực - hỗ trợ nhiều phương pháp xác thực bao gồm thông tin đăng nhập Azure CLI, khóa API, MSAL cho xác thực doanh nghiệp của Microsoft và kiểm soát truy cập dựa trên vai trò.
Khung này hỗ trợ các hành vi AI tự động, đa tác nhân trong khi vẫn duy trì kiến trúc linh hoạt cho phép bạn kết hợp các tác nhân, công cụ và quy trình làm việc khi cần. Thiết kế cho phép bạn chuyển đổi giữa OpenAI, Azure OpenAI, Anthropic và các nhà cung cấp khác mà không cần thay đổi mã, giúp bạn dễ dàng xây dựng hệ thống AI—từ chatbot đơn giản đến các giải pháp kinh doanh phức tạp.