Sử dụng Azure Document Intelligence Studio

Đã hoàn thành

Ngoài SDK và API REST, bạn có thể truy cập các dịch vụ Azure Document Intelligence thông qua giao diện người dùng có tên là Azure Document Intelligence Studio, một công cụ trực tuyến để khám phá, hiểu trực quan và tích hợp các tính năng từ dịch vụ Azure Document Intelligence. Studio có thể được sử dụng để phân tích bố trí biểu mẫu, trích xuất dữ liệu từ các mô hình dựng sẵn và đào tạo các mô hình tùy chỉnh.

năng Gif của Azure Document Intelligence Studio.

Azure Document Intelligence Studio hiện hỗ trợ các dự án sau:

  • mô hình phân tích tài liệu
    • Đọc: Trích xuất các dòng văn bản in và viết tay, từ, vị trí và các ngôn ngữ được phát hiện từ tài liệu và hình ảnh.
    • Bố trí: Trích xuất văn bản, bảng, dấu chọn và thông tin cấu trúc từ tài liệu (PDF và TIFF) và hình ảnh (JPG, PNG và BMP).
    • Tài liệu Chung: Trích xuất các cặp khóa-giá trị, dấu lựa chọn và thực thể từ tài liệu.
  • mẫu dựng sẵn
  • Mô hình tùy chỉnh

Xây dựng dự án mô hình phân tích Tài liệu

Để trích xuất văn bản, bảng, cấu trúc, cặp giá trị khóa và các thực thể đã đặt tên với mô hình phân tích tài liệu:

  • Tạo tài nguyên Azure Document Intelligence hoặc Foundry Tools
  • Chọn "Đọc", "Bố trí" hoặc "Tài liệu Chung" bên dưới danh mục Mô hình phân tích tài liệu
  • Phân tích tài liệu của bạn. Bạn sẽ cần điểm cuối và khóa Azure Document Intelligence hoặc Foundry Tools.

Xây dựng các dự án mô hình dựng sẵn

Để trích xuất dữ liệu từ các biểu mẫu phổ biến với các mô hình dựng sẵn:

  • Tạo tài nguyên Azure Document Intelligence hoặc Foundry Tools
  • Chọn một trong các "mô hình tiền xây dựng" bao gồm W-2s, Hóa đơn, Biên lai, giấy tờ TÙY THÂN, Bảo hiểm y tế, tiêm chủng và danh thiếp.
  • Phân tích tài liệu của bạn. Bạn sẽ cần điểm cuối và khóa Azure Document Intelligence hoặc Foundry Tools.

Xây dựng dự án mô hình tùy chỉnh

Bạn có thể sử dụng dịch vụ tùy chỉnh của Azure Document Intelligence Studio cho toàn bộ quy trình đào tạo và thử nghiệm các mô hình tùy chỉnh.

Khi bạn sử dụng Azure Document Intelligence Studio để xây dựng các mô hình tùy chỉnh, các tệp ocr.json, tệp labels.json và tệp fields.json cần thiết cho nội dung đào tạo sẽ tự động được tạo và lưu trữ trong tài khoản lưu trữ của bạn.

Để đào tạo một mô hình tùy chỉnh và sử dụng mô hình đó để trích xuất dữ liệu với các mô hình tùy chỉnh:

  • Tạo tài nguyên Azure Document Intelligence hoặc Foundry Tools
  • Thu thập ít nhất 5-6 biểu mẫu mẫu để đào tạo và tải chúng lên bộ chứa tài khoản lưu trữ của bạn.
  • Cấu hình chia sẻ tài nguyên chéo miền (CORS). CORS cho phép Azure Document Intelligence Studio lưu trữ các tệp có nhãn trong bộ chứa lưu trữ của bạn.
  • Tạo dự án mô hình tùy chỉnh trong Azure Document Intelligence Studio. Bạn sẽ cần cung cấp các cấu hình liên kết vùng chứa lưu trữ của bạn và tài nguyên Azure Document Intelligence hoặc Foundry Tools với dự án.
  • Sử dụng Azure Document Intelligence Studio để áp dụng nhãn cho văn bản.
  • Đào tạo mô hình của bạn. Sau khi mô hình được đào tạo, bạn sẽ nhận được ID Mô hình và Độ chính xác Trung bình cho thẻ.
  • Kiểm tra mô hình của bạn bằng cách phân tích một biểu mẫu mới không được sử dụng trong đào tạo.