Lưu ý
Cần có ủy quyền mới truy nhập được vào trang này. Bạn có thể thử đăng nhập hoặc thay đổi thư mục.
Cần có ủy quyền mới truy nhập được vào trang này. Bạn có thể thử thay đổi thư mục.
Bài viết này bao gồm những câu hỏi thường gặp về mô hình xử lý tài liệu trong AI Builder. Nếu bạn không tìm thấy câu hỏi của mình ở đây, hãy xem lại Tổng quan về mô hình AI xử lý tài liệu hoặc gửi câu hỏi của bạn tới Power Automate Cộng đồng AI Builder.
Chức năng
Tôi có thể làm gì với việc xử lý tài liệu?
Với tính năng xử lý tài liệu, bạn có thể xây dựng mô hình AI tùy chỉnh để trích xuất thông tin từ nhiều loại tài liệu khác nhau.
- Tùy chọn Tài liệu mẫu cố định là lý tưởng nếu các thành phần trong tài liệu của bạn có thể được tìm thấy ở những nơi tương tự. Thông thường, điều này áp dụng cho hóa đơn, lệnh mua hàng, lệnh giao hàng và biểu mẫu thuế.
- Tùy chọn Tài liệu chung lý tưởng cho mọi loại tài liệu, bao gồm các tài liệu được tùy chọn đầu tiên hỗ trợ, cũng như hợp đồng, báo cáo công việc, thư từ và các loại tài liệu khác. Tùy chọn này có thể trích xuất dữ liệu hiệu quả hơn nhưng đòi hỏi thời gian đào tạo lâu hơn.
Tìm hiểu thêm trong Tổng quan về mô hình xử lý tài liệu.
Hệ thống xử lý tài liệu có thể xử lý những loại tài liệu nào?
Các loại tệp được hỗ trợ là PDF, JPG và PNG.
Tôi có thể trích xuất dữ liệu nào từ tài liệu bằng cách sử dụng xử lý tài liệu?
Xử lý tài liệu có thể trích xuất các trường, bảng và hộp kiểm từ tài liệu.
Tìm hiểu thêm trong Xác định thông tin cần trích xuất.
Tôi có thể trích xuất văn bản viết tay từ tài liệu không?
Có. Xử lý tài liệu có thể trích xuất văn bản in và viết tay từ tài liệu của bạn.
Tôi cần bao nhiêu mẫu để đào tạo một mô hình xử lý tài liệu?
Đối với các tài liệu chất lượng cao sử dụng cùng một bố cục, năm tài liệu mẫu là đủ. Đối với các tài liệu chất lượng thấp (ví dụ: bản quét chất lượng kém), có thể cần thêm nhiều tài liệu mẫu. Để cải thiện kết quả, hãy sử dụng 15 đến 20 tài liệu mẫu.
Thực tiễn tốt nhất
Đối với tài liệu mẫu
- Một (1) bố cục cho mỗi bộ sưu tập.
- Bố cục phải giống hệt nhau trong cùng một bộ sưu tập.
- Tối thiểu năm (5) tài liệu và tối đa 20 tài liệu cho mỗi lần thu thập (không vượt quá giới hạn này).
Đối với các tài liệu chung
Tạo một mô hình duy nhất cho tất cả các biến thể của một loại tài liệu bao gồm cả tài liệu có cấu trúc và không có cấu trúc.
Đánh nhãn các trường có liên quan đến giá trị của chúng để trích xuất chính xác hơn.
Ví dụ: sử dụng "supplier_id" làm ID nhà cung cấp. Tên trường phải khớp với ngôn ngữ của tài liệu.
Tối thiểu năm (5) tài liệu và tối đa 20 tài liệu cho mỗi lần thu thập (không vượt quá giới hạn này).
Mô hình của tôi hiện được xuất bản ở phiên bản 3.1 (GA) và tôi đang có kế hoạch đào tạo lại nó bằng phiên bản 4.0 (GA). Tôi có cần phải gắn lại thẻ cho tất cả tài liệu của mình không?
Trừ khi bạn đang thêm trường, hộp kiểm, bảng, chữ ký mới để trích xuất dữ liệu hoặc tài liệu mới vào bộ sưu tập, bạn không cần phải gắn lại thẻ cho tất cả tài liệu.
Trước khi xuất bản mô hình, bạn nên kiểm tra nhanh mô hình của mình bằng cách sử dụng một hoặc nhiều mẫu để xác minh và đảm bảo tất cả các trường mong muốn của bạn được trích xuất đúng cách.
Tôi có thể chuyển từ loại tài liệu này sang loại tài liệu khác không?
Có, khi chỉnh sửa mô hình, bạn có thể chuyển đổi giữa loại tài liệu mẫu cố định và loại tài liệu chung. Tuy nhiên, tính năng chuyển đổi này không được hỗ trợ cho hóa đơn.
Một mô hình xử lý biểu mẫu duy nhất có thể trích xuất thông tin từ các tài liệu có bố cục hoặc mẫu khác nhau không?
Có. Bằng cách sử dụng tính năng bộ sưu tập, bạn sẽ đào tạo một mô hình xử lý biểu mẫu duy nhất để xử lý các tài liệu có bố cục khác nhau.
Tìm hiểu thêm trong Nhóm tài liệu theo bộ sưu tập.
Quá trình xử lý tài liệu có thể xử lý nhiều biểu mẫu trong một tài liệu duy nhất không?
Mỗi mẫu đơn phải được lưu trong một tệp riêng biệt. Ví dụ, nếu bạn có một tài liệu PDF chứa nhiều hóa đơn, hãy tạo một tệp riêng cho mỗi hóa đơn trước khi gửi đến mô hình xử lý tài liệu.
Bạn cũng có thể chỉ định các trang để mô hình xử lý tài liệu xử lý. Bằng cách này, bạn có thể tận dụng chức năng của mô hình để lặp từng trang và xử lý từng biểu mẫu một.
Tìm hiểu thêm trong Phạm vi trang.
Tôi đã đào tạo một mô hình xử lý tài liệu, nhưng tôi không nhận được kết quả tốt khi trích xuất dữ liệu. Làm thế nào tôi có thể cải thiện mô hình?
Nếu mô hình của bạn trả về kết quả kém sau khi đào tạo, hãy chỉnh sửa mô hình và cung cấp thêm mẫu để đào tạo. Bạn cung cấp càng nhiều mẫu, mô hình AI càng học được cách trích xuất dữ liệu từ tài liệu của bạn.
Tìm hiểu thêm trong Cải thiện hiệu suất của mô hình xử lý tài liệu của bạn.
Giới hạn
Tôi có thể xử lý tối đa bao nhiêu tài liệu?
Bạn có thể xử lý tối đa 360 tài liệu cho mỗi môi trường, cứ mỗi 60 giây.
Tại sao một số ký tự bị nhận dạng sai?
- Một số ký tự có thể bị nhầm lẫn: 0 (số) và O (chữ cái), 1 (số) và l (chữ cái), 4 (số) và A (chữ cái), v.v.
- Có thể xảy ra trường hợp một số ký tự ở trên hoặc gần các ký tự khác bị nhận dạng không chính xác: O (chữ cái) trên một đường thẳng đứng sẽ trở thành 0 (số), 5 (số) trên một đường thẳng sẽ trở thành $ (ký hiệu đô la Mỹ), l_ (chữ thường, dấu gạch dưới) sẽ trở thành L (chữ hoa), v.v.
- Có thể xảy ra trường hợp một số ký tự trên các tài liệu kém chất lượng không được nhận dạng chính xác hoặc không được nhận dạng.
Trong các trường hợp trước, không thể làm gì để cải thiện khả năng nhận dạng. AI Builder Chúng tôi đề xuất cải thiện chất lượng và bố cục của tài liệu nguồn để giải quyết các vấn đề tương tự.
Lưu ý
Microsoft liên tục cải tiến công nghệ nhận dạng ký tự quang học (OCR) để phát hiện ký tự, do đó những sự cố như vậy ít xảy ra hơn.
Tôi có thể tạo một mô hình có nhiều bộ sưu tập không?
Bạn có thể tạo tối đa 200 bộ sưu tập cho mỗi mô hình. Tuy nhiên, đào tạo Tài liệu chung Các mô hình có hàng chục bộ sưu tập có thể mất vài giờ và—trong một số trường hợp hiếm hoi—hết thời gian chờ. Nếu mô hình của bạn có nhiều bộ sưu tập, hãy chuẩn bị chờ tới 24 giờ để hoàn tất đào tạo mô hình.
Tôi có thể tạo mô hình trong giải pháp không?
Hiện tại, không thể tạo mô hình trong giải pháp.
Tôi có thể sử dụng hợp đồng và thư từ trong mô hình xử lý tài liệu của mình không?
Có, các tài liệu phi cấu trúc như hợp đồng và thư từ được hỗ trợ bằng cách xử lý tài liệu, sử dụng Tài liệu chung lựa chọn.
So sánh
Sự khác biệt giữa xử lý tài liệu, xử lý hóa đơn, xử lý biên lai, đầu đọc chứng minh thư, đầu đọc danh thiếp và nhận dạng văn bản là gì?
Tùy thuộc vào tình huống, bạn có thể cần sử dụng một mô hình cụ thể hoặc kết hợp nhiều mô hình.
Sử dụng nhận dạng văn bản khi bạn muốn trích xuất toàn bộ văn bản có trong hình ảnh hoặc tệp PDF. Ví dụ, sau đó bạn có thể tìm kiếm một từ khóa trong văn bản được trích xuất hoặc xây dựng một số quy tắc cố định để trích xuất các mục nhất định.
Nếu bạn muốn trích xuất thông tin từ hóa đơn, biên lai, hộ chiếu, giấy phép lái xe hoặc danh thiếp, hãy bắt đầu với mô hình dựng sẵn tương ứng:
- Xử lý hóa đơn
- Xử lý biên lai
- Máy đọc giấy tờ tùy thân (hộ chiếu và giấy phép lái xe)
- Máy đọc danh thiếp
Bạn có thể sử dụng các mô hình dựng sẵn này ngay lập tức mà không cần phải tạo mô hình mới. Các mô hình này có thể trích xuất thông tin chung có trong loại tài liệu tương ứng.
Đối với bất kỳ loại tài liệu nào khác, bạn có thể tạo mô hình xử lý tài liệu tùy chỉnh để trích xuất các trường và bảng bạn cần. Điều này cũng áp dụng nếu bạn cần thông tin bổ sung không có trong mô hình dựng sẵn.
Tìm hiểu thêm trong Mô hình xử lý tài liệu tùy chỉnh.
Sự khác biệt giữa xử lý tài liệu và Azure Form Recognizer là gì? AI Builder
AI Builder quá trình xử lý tài liệu được xây dựng dựa trên Azure Form Recognizer. Điều này mang đến cho cả hai sản phẩm những tiến bộ mới nhất trong Microsoft AI.
AI Builder là một phần của Microsoft Power Platform. Điều này cho phép bất kỳ ai cũng có thể thêm AI vào ứng dụng và tự động hóa với giao diện dễ sử dụng. Bạn không cần phải là nhà phát triển hoặc nhà khoa học dữ liệu.
Azure Form Recognizer hướng đến các nhà phát triển chuyên nghiệp . Họ có thể sử dụng REST API đơn giản để thêm khả năng AI vào các giải pháp mã tùy chỉnh của mình.
Tùy chọn chi phí
Chi phí xử lý tài liệu là bao nhiêu? AI Builder
Bạn có thể bắt đầu dùng thử dịch vụ xử lý tài liệu miễn phí bằng cách bắt đầu dùng thử . Sau khi đánh giá, bạn cần mua AI Builder tín dụng để sử dụng tính năng xử lý tài liệu. Mỗi trang bạn xử lý bằng xử lý tài liệu sẽ tiêu tốn AI Builder điểm tín dụng, ngay cả khi trang đó không chứa dữ liệu để trích xuất. AI Builder tín dụng có thể được mua thông qua AI Builder tiện ích bổ sung.
Tìm hiểu thêm trong AI Builder cấp phép.