Sử dụng mô hình có khả năng nhìn thấy trong cổng thông tin Microsoft Foundry

Đã hoàn thành

Mẹo

Xem tab Văn bản và hình ảnh để biết thêm chi tiết!

Để xử lý lời nhắc có chứa hình ảnh, bạn cần triển khai mô hình AI tạo đa phương thức - nói cách khác, một mô hình hỗ trợ không chỉ dữ liệu nhập dựa trên văn bản mà còn dựa trên hình ảnh (và trong một số trường hợp, dữ liệu nhập dựa trên âm thanh). Các mô hình đa phương thức có sẵn trong Microsoft Foundry bao gồm (trong số những mô hình khác):

  • Microsoft Phi-4-multimodal-hướng dẫn
  • Mở AI gpt-4.1
  • OpenAI gpt-4.1-mini

Mẹo

Để tìm hiểu thêm về các mô hình có sẵn trong Microsoft Foundry, hãy xem bài viết tổng quan về Mô hình Microsoft Foundry trong tài liệu Microsoft Foundry.

Kiểm tra mô hình đa phương thức bằng lời nhắc dựa trên hình ảnh

Sau khi triển khai mô hình đa phương thức, bạn có thể kiểm tra mô hình đó trong sân chơi trò chuyện trong cổng thông tin Microsoft Foundry.

Ảnh chụp màn hình sân chơi trò chuyện với lời nhắc dựa trên hình ảnh.

Trong sân chơi trò chuyện, bạn có thể tải lên một hình ảnh từ một tập tin cục bộ và thêm văn bản vào tin nhắn để hiển thị phản hồi từ một mô hình đa phương pháp.