Belge Ayrıştırma

Belge Ayrıştırma; PDF'ler, görüntüler, Word belgeler (DOC/DOCX) ve PowerPoint dosyaları (PPT/PPTX) dahil ancak bunlarla sınırlı olmamak üzere çok çeşitli belge türlerinden yapılandırılmış verileri ayıklamak ve görselleştirmek için son derece gelişmiş araştırma tekniklerini kullanır. Tablolar, grafikler ve karışık metin görüntüsü içeriği gibi karmaşık düzenleri işlemek için tasarlanmıştır.

Belge Ayrıştırma işlevi üzerinde ai_parse_document oluşturulur ve belgeleri ayrıştırmanıza ve biçimlendirilmiş metin veya yapılandırılmış JSON çıkışları aracılığıyla bunların yapısını hemen incelemenize olanak tanıyan bir kullanıcı arabirimi içerir.

Gereksinimler

Belgeleri ayrıştırma

Belgelerinizi ayrıştırmak ve yapılarını görselleştirmek için Belge Ayrıştırma özelliğini kullanın.

  1. Agentler simgesine gidin. Çalışma alanınızın sol gezinti bölmesindeki Agentler'e gidin.
  2. Aracı Oluştur>Belge Ayrıştırma'ya tıklayın.
  3. Kaynak belgenizi seçin. Bir dosyayı karşıya yüklemeyi veya mevcut bir Unity Kataloğu'ndan seçim yapmayı tercih edebilirsiniz. Desteklenen biçimler şunlardır: PDF, resimler, DOC/DOCX ve PPT/PPTX.
  4. Belgeyi ayrıştır'a tıklayın.

Belgenizin ayrıştırılması birkaç dakika sürebilir. Tamamlandığında, Belge Ayrıştırma soldaki kaynak belgeyi ve sağda ayrıştırılmış belgeyi gösterir. Ayrıştırılmış belgeyi Biçimlendirilmiş metin veya Ham JSON olarak görüntülemeyi seçebilirsiniz.

Kaynak ve ayrıştırılmış belgeyi yan yana gösteren belge ayrıştırma kullanıcı arabirimi

İşlem ve sorgu sonuçları

Sorguyu ai_parse_document görüntülemek ve daha fazla belgede çalıştırmak için Aracı Kullan'a tıklayın ve sorguyu SQL Düzenleyicisi'nden veya Not Defteri'nden çalıştırmayı seçin. Sorguyu düzenleyerek belgelerinizin bulunduğu disk birimi veya tabloyu belirtebilirsiniz.

Belge Ayrıştırma, SQL işlevine ai_parse_documentbir UI arabirimi sağlar. ai_parse_document Daha gelişmiş örnekler ve ayrıntılar için başvuru sayfasına bakın.

Sınırlamalar

Bkz ai_parse_document . sınırlamalar.