Đọc bằng tiếng Anh

Chia sẻ qua


Câu hỏi thường gặp về xử lý tài liệu

Bài viết này bao gồm các câu hỏi thường gặp về mô hình xử lý tài liệu trong AI Builder. Nếu bạn không tìm thấy câu hỏi của mình ở đây, hãy xem lại tổng quan về mô hình AI xử lý tài liệu hoặc gửi câu hỏi của bạn tới Power Automate Cộng đồng AI Builder.

Chức năng

Tôi có thể làm gì với việc xử lý tài liệu?

Với việc xử lý tài liệu, bạn có thể xây dựng mô hình AI tùy chỉnh để trích xuất thông tin từ nhiều loại tài liệu khác nhau.

  • Tùy chọn Tài liệu mẫu cố định là lựa chọn lý tưởng nếu các thành phần trong tài liệu của bạn có thể được tìm thấy ở những nơi tương tự. Đó thường là trường hợp của hóa đơn, đơn đặt hàng, lệnh giao hàng và biểu mẫu thuế.
  • Tùy chọn tài liệu chung lý tưởng cho mọi loại tài liệu, bao gồm cả những tài liệu được hỗ trợ bởi tùy chọn đầu tiên cũng như hợp đồng, tuyên bố công việc, thư từ và các tài liệu khác. Tùy chọn này có thể mạnh hơn để trích xuất dữ liệu nhưng cần thời gian đào tạo lâu hơn.

Tìm hiểu thêm: Tổng quan về mô hình xử lý văn bản

Việc xử lý tài liệu có thể xử lý những loại tài liệu nào?

Các loại tệp được hỗ trợ là PDF, JPG và PNG.

Tôi có thể trích xuất dữ liệu nào từ tài liệu bằng cách sử dụng xử lý tài liệu?

Xử lý tài liệu có thể trích xuất các trường, bảng và hộp kiểm từ tài liệu.

Tìm hiểu thêm: Xác định thông tin cần trích xuất

Tôi có thể trích xuất văn bản viết tay từ tài liệu không?

Có. Xử lý tài liệu có thể trích xuất văn bản in và viết tay từ tài liệu của bạn.

Tôi cần bao nhiêu mẫu để đào tạo mô hình xử lý tài liệu?

Đối với các tài liệu chất lượng cao sử dụng cùng một bố cục, năm tài liệu mẫu là đủ. Đối với các tài liệu có chất lượng thấp (ví dụ: bản quét có chất lượng kém, có thể cần thêm nhiều tài liệu mẫu hơn. Để cải thiện kết quả, hãy sử dụng 15 đến 20 tài liệu mẫu.

Một mô hình xử lý biểu mẫu có thể trích xuất thông tin từ các tài liệu có bố cục hoặc mẫu khác nhau không?

Có. Bằng cách sử dụng tính năng bộ sưu tập, bạn huấn luyện một mô hình xử lý biểu mẫu duy nhất để xử lý các tài liệu có bố cục khác nhau.

Tìm hiểu thêm: Nhóm tài liệu theo bộ sưu tập

Việc xử lý tài liệu có thể xử lý nhiều biểu mẫu trong một một tài liệu không?

Mỗi biểu mẫu cần phải ở trong một tệp riêng biệt. Ví dụ: nếu bạn có tài liệu PDF có nhiều hóa đơn trong đó, hãy tạo tệp riêng cho từng hóa đơn trước khi gửi đến mô hình xử lý tài liệu.

Bạn cũng có thể chỉ định các trang để mô hình xử lý tài liệu xử lý. Bằng cách này, bạn có thể tận dụng chức năng của mô hình để lặp lại từng trang và xử lý từng biểu mẫu một.

Tìm hiểu thêm: Phạm vi trang

Tôi đã đào tạo một mô hình xử lý tài liệu nhưng tôi không nhận được kết quả tốt khi trích xuất dữ liệu. Làm cách nào để cải thiện mô hình?

Nếu mô hình của bạn trả về kết quả kém sau khi đào tạo, hãy chỉnh sửa mô hình và cung cấp thêm mẫu để đào tạo. Bạn cung cấp càng nhiều mẫu thì mô hình AI càng học được cách trích xuất dữ liệu từ tài liệu của bạn.

Tìm hiểu thêm: Cải thiện hiệu suất mô hình xử lý tài liệu của bạn

Giới hạn

Tôi có thể xử lý số lượng tài liệu tối đa là bao nhiêu?

Bạn có thể xử lý tối đa 360 tài liệu cho mỗi môi trường, cứ sau 60 giây.

Tại sao một số ký tự được nhận dạng không chính xác?

  • Có thể xảy ra trường hợp một số ký tự bị nhầm lẫn: 0 (số) và O (chữ cái), 1 (số) và l (chữ cái), 4 (số) và A (chữ cái), v.v.
  • Có thể xảy ra trường hợp một số ký tự ở trên hoặc gần các ký tự khác được nhận dạng không chính xác: O (chữ cái) trên một dòng dọc trở thành 0 (số), 5 (số) trên một dòng trở thành $ (ký hiệu đô la Mỹ), l_ (chữ thường, gạch dưới) trở thành chữ L (chữ hoa) và hơn thế nữa.
  • Có thể xảy ra trường hợp một số ký tự trên tài liệu có chất lượng kém được nhận dạng không chính xác hoặc hoàn toàn không.

Trong những trường hợp trên, bạn không thể làm gì AI Builder để cải thiện khả năng nhận dạng. Chúng tôi khuyên bạn nên cải thiện chất lượng và bố cục của tài liệu nguồn để giải quyết các vấn đề tương tự.

Lưu ý

Công nghệ OCR nhận diện ký tự được Microsoft không ngừng cải tiến nên những sự cố như vậy ít xảy ra hơn.

Tôi có thể tạo một mô hình có nhiều bộ sưu tập không?

Bạn có thể tạo tối đa 200 bộ sưu tập cho mỗi mô hình. Tuy nhiên, quá trình đào tạo Các tài liệu chung mô hình với hàng chục bộ sưu tập có thể mất vài giờ và—trong một số trường hợp hiếm hoi—hết thời gian chờ. Nếu mô hình của bạn có số lượng bộ sưu tập cao, bạn có thể phải đợi tối đa 24 giờ để hoàn tất quá trình đào tạo mô hình.

Tôi có thể tạo mô hình trong giải pháp không?

Hiện tại, không thể tạo mô hình trong giải pháp.

Tôi có thể sử dụng hợp đồng và thư từ trong mô hình xử lý tài liệu của mình không?

Có, các tài liệu phi cấu trúc như hợp đồng và thư từ được hỗ trợ bằng cách xử lý tài liệu bằng cách sử dụng tùy chọn Tài liệu chung .

So sánh

Sự khác biệt giữa xử lý tài liệu, xử lý hóa đơn, xử lý biên lai, trình đọc tài liệu nhận dạng, trình đọc danh thiếp và nhận dạng văn bản là gì?

Tùy thuộc vào tình huống của bạn, bạn có thể cần sử dụng một mô hình cụ thể hoặc kết hợp chúng.

Sử dụng nhận dạng văn bản khi bạn muốn trích xuất tất cả văn bản có trong hình ảnh hoặc PDF. Sau đó, bạn có thể tìm kiếm từ khóa trong văn bản được trích xuất hoặc xây dựng một số quy tắc cố định để trích xuất một số mục nhất định.

Nếu bạn muốn trích xuất thông tin từ hóa đơn, biên lai, hộ chiếu, bằng lái xe hoặc danh thiếp, hãy bắt đầu với mô hình dựng sẵn tương ứng:

Bạn có thể sử dụng các mô hình dựng sẵn này ngay lập tức mà không cần phải tạo mô hình mới. Những mô hình này có thể trích xuất thông tin phổ biến được tìm thấy trong loại tài liệu tương ứng của chúng.

Đối với bất kỳ loại tài liệu nào khác, bạn có thể tạo mô hình xử lý tài liệu tùy chỉnh để trích xuất các trường và bảng bạn cần. Điều này cũng áp dụng nếu bạn cần thông tin bổ sung không được cung cấp bởi mô hình dựng sẵn.

Tìm hiểu thêm: Mô hình xử lý tài liệu tùy chỉnh

Sự khác biệt giữa AI Builder xử lý tài liệu và Trình nhận dạng biểu mẫu Azure là gì?

AI Builder quá trình xử lý tài liệu được xây dựng dựa trên Trình nhận dạng biểu mẫu Azure. Điều này mang lại cho cả hai sản phẩm những tiến bộ mới nhất trong Microsoft AI.

  • AI Builder là một phần của Microsoft Power Platform. Điều này cho phép mọi người thêm AI vào ứng dụng và tự động hóa với giao diện dễ sử dụng. Bạn không cần phải là nhà phát triển hoặc nhà khoa học dữ liệu.

  • Trình nhận dạng biểu mẫu Azure được nhắm đến các nhà phát triển chuyên nghiệp. Họ có thể sử dụng các API REST đơn giản để bổ sung khả năng AI vào các giải pháp mã tùy chỉnh của mình.

Tùy chọn chi phí

Chi phí xử lý tài liệu AI Builder là bao nhiêu?

Bạn có thể bắt đầu dùng thử miễn phí quá trình xử lý tài liệu bằng cách bắt đầu dùng thử. Sau khi đánh giá, bạn cần mua AI Builder tín dụng để sử dụng quá trình xử lý tài liệu. Mỗi trang bạn xử lý bằng quá trình xử lý tài liệu đều tiêu tốn AI Builder tín dụng, ngay cả khi trang đó không chứa dữ liệu cần trích xuất. AI Builder tín dụng có thể được mua thông qua AI Builder tiện ích bổ sung.

Tìm hiểu thêm: AI Builder cấp phép