Azure Document Intelligence là gì?
Azure Document Intelligence là một trong nhiều Công cụ đúc, dịch vụ trí tuệ nhân tạo (AI) dựa trên đám mây với API REST và SDK thư viện máy khách có thể được sử dụng để xây dựng trí thông minh vào ứng dụng của bạn.
Azure Document Intelligence sử dụng các chức năng Nhận dạng Ký tự Quang học (OCR) và các mô hình học sâu để trích xuất văn bản, cặp giá trị khóa, dấu chọn và bảng từ tài liệu.
OCR chụp cấu trúc tài liệu bằng cách tạo các hộp giới hạn xung quanh các đối tượng được phát hiện trong một hình ảnh. Vị trí của hộp giới hạn được ghi lại là tọa độ liên quan đến phần còn lại của trang. Dịch vụ Thông tin Tài liệu Azure trả về dữ liệu hộp liên kết và thông tin khác trong biểu mẫu có cấu trúc với các mối quan hệ từ tệp gốc.
Để xây dựng mô hình có độ chính xác cao từ đầu, mọi người cần xây dựng các mô hình học sâu, sử dụng một lượng lớn tài nguyên điện toán và đối mặt với thời gian đào tạo mô hình dài. Những yếu tố này có thể làm cho một dự án không thể thực hiện được. Azure Document Intelligence cung cấp các mô hình cơ sở đã được đào tạo về hàng nghìn ví dụ về biểu mẫu. Các mô hình cơ sở cho phép bạn trích xuất dữ liệu chính xác cao từ biểu mẫu của mình mà không cần đào tạo mô hình nào.
Các cấu phần dịch vụ Azure Document Intelligence
Azure Document Intelligence bao gồm các dịch vụ sau:
Mô hình phân tích tài liệu: lấy đầu vào các tệp JPEG, PNG, PDF và TIFF và trả về tệp JSON với vị trí của văn bản trong hộp giới hạn, nội dung văn bản, bảng, dấu chọn (còn được gọi là hộp kiểm hoặc nút chọn một) và cấu trúc tài liệu.
các mô hình dựng sẵn: mô hình này phát hiện và trích xuất thông tin từ hình ảnh tài liệu và trả về dữ liệu được trích xuất trong đầu ra JSON có cấu trúc. Azure Document Intelligence hiện hỗ trợ các mô hình dựng sẵn cho một số biểu mẫu, bao gồm:
- Biểu mẫu W-2
- Hoá đơn
- Hóa đơn
- Tài liệu ID
- Danh thiếp
mô hình tùy chỉnh: mô hình tùy chỉnh trích xuất dữ liệu từ các biểu mẫu cụ thể cho doanh nghiệp của bạn. Các mô hình tùy chỉnh có thể được đào tạo thông qua Azure Document Intelligence Studio.
Lưu ý
Một số tính năng Thông tin Tài liệu Azure đang ở chế độ xem trước, kể từ thời điểm nội dung này được tạo và do đó, các tính năng và chi tiết sử dụng có thể thay đổi. Bạn nên tham khảo trang chính thức để thông up-to-date.
Dịch vụ Access
Bạn có thể truy nhập các dịch vụ Thông tin Tài liệu Azure theo một số cách. Các tùy chọn này bao gồm sử dụng:
- API NGHỈ NGƠI
- SDK thư viện máy khách
- Azure Document Intelligence Studio
- Xưởng đúc Microsoft
Mẹo
Bài tập của mô-đun này tập trung vào các SDK Python và .NET. Dịch vụ REST cơ bản có thể được sử dụng bởi bất kỳ ngôn ngữ nào.
Xem hướng dẫn tài để biết hướng dẫn nhanh về tất cả các SDK có sẵn và API REST.