Bilgi Ayıklama

Önemli

Bu özellik Genel Önizleme aşamasındadır ve HIPAA ile uyumludur.

Bu sayfa, Bilgi Ayıklama'nın yeni sürümünü kapsar. Önceki sürüm hakkında bilgi için bkz. Bilgi Ayıklamayı kullanma (eski)

Bilgi Ayıklama, yapılandırılmamış belgeleri ve metinleri tanımlı bir şema kullanarak anahtar, yapılandırılmış içgörülere dönüştürür. Bu, yapılandırılmamış metinlere, PDF'lere, resimlere veya tablolara eklenmiş bilgilerin analiz, raporlama veya aşağı akış aracıları ve uygulamaları için doğrudan kullanılmasını sağlar.

Bilgi ayıklama örnekleri şunlardır:

  • Sözleşmelerden yasal tarafları ve koşulları ayıklama.
  • Faturalardan satır öğelerini ve ödeme koşullarını ayıklama.
  • Tıbbi kayıtlar ve notlardan önemli detaylar çekme işlemi.

Bilgi Ayıklama, yapay zeka işlevinin ai_extractüzerine kurulmuştur. Bilgi Ayıklama, ayıklama için tanımlanmış bir şemayla işlevi özelleştirmek ve iyileştirmek için görsel bir kullanıcı arabirimine sahiptir.

Bilgi Ayıklama, geçici veri dönüşümlerini, model denetim noktalarını ve her aracıyı destekleyen iç meta verileri depolamak için varsayılan depolamayı kullanır. Aracı silme işleminde, aracıyla ilişkili tüm veriler varsayılan depolama alanından kaldırılır.

Gereksinimler

Bilgi ayıklama aracısı oluşturma

Agentler simgesine gidin. Çalışma alanınızın sol gezinti bölmesindeki Agentler'e gidin. Aracı Oluştur>Bilgi Çıkartma.

Adım 1. Bilgileri ayıklamak için verileri seçin

  1. Bilgileri ayıklamak istediğiniz dosyaları veya verileri seçin. Dosyaları karşıya yükleyebilir, desteklenen dosya türlerine sahip bir Unity Kataloğu birimi veya metin verileri içeren bir tablo seçebilirsiniz.

  2. Aracı Oluştur'a tıklayın.

Adım 2. Ayıklama şemanızı yapılandırma ve iyileştirme

Bilgi Ayıklama verilerinizi işledikten sonra, belgelerinizden ayıklamak istediğiniz verileri yapılandırın ve geliştirin.

  1. Yapılandırma'nın altında ayıklama şemanızı tanımlayın. Bunu yapmanın birkaç yolu vardır:

    • Ayıklamak istediğiniz bilgileri açıklayan doğal bir dil girin ve Şema Oluştur'a tıklayın. Bilgi Ayıklama, alan adları ve tanımları içeren bir JSON şemasını sizin için akıllı bir şekilde otomatik olarak oluşturur. Bu açıklamaları gerektiği gibi düzenleyin.
    • Alternatif olarak, şemanızı Veya, El ile tanımla seçeneğine tıklayarak el ile tanımlayın.
      1. Alan ekle'ye tıklayın.
      2. Alan adınızı, türünüzü ve açıklamanızı girin.
      3. Onayla'yı tıklatın.
      4. Ayıklamak istediğiniz her alan için tekrarlayın.
      5. Kaydet ve Ayıklamayı çalıştır'a tıklayın.
    • JSON şemasını doğrudan düzenlemek üzere JSON'a tıklayabilirsiniz. Tamamlandığında Değişiklikleri Uygula'ya tıklayın.

    Şemanızı her güncelleştirdiğinizde ve Ayıklamayı kaydet ve çalıştır'a bastığınızda, Bilgi Ayıklama ayıklama aracısını güncelleştirir, ayıklamayı çalıştırır ve her girişin sonuçlarını gösterir.

  2. Sol tarafta ayrıştırılmış belgeyi ve ajanın ayıklamasını gözden geçirin. Ayıklama sonuçlarını iki şekilde yineleyin. İlk olarak, bir veya birden çok girişle ilgili doğal dil geri bildirimi sağlayarak. Bu, Ayıklamayı kaydet ve çalıştır'a bastığınızda açıklamalarınızı akıllı bir şekilde otomatik olarak ayarlar. İkincisi, şema açıklamalarını el ile düzelterek. Kaydet ve ayıklamayı çalıştır'a bastığınızda bu işlem geçerli olur.

  3. Önceki yapılandırmayı karşılaştırmak veya eski yapılandırmaya geri dönmek için sürümleri kullanın. Önceki bir sürümün şema tanımını geçerli sürümle karşılaştırmak için Sürümler'e ve ardından Karşılaştır'a tıklayın. Önceki bir sürümü geri yüklemek için Geri Yükle'ye tıklayın.

Adım 3. Ayıklama ajanınızı kullan

Ajanın performansından memnun olduğunuzda, bilgileri ayıklamak için ajanı kullanın.

Sağ üstteki Aracıyı Kullan'a tıklayın. Aşağıdakilerden birini seçebilirsiniz:

  • Aracıyı kullanarak tüm verilerinizden bilgi ayıklamak için SQL'de çalıştırın. Bu, tanımlanan şemayı kullanarak biriminizden veya tablonuzdan bilgi ayıklamak için kullanan ai_extract bir SQL sorgusu açar. SQL sorgularında ai_extract kullanımı hakkında daha fazla bilgi için ai_extract işlevine bakın.
  • Bir Spark Deklaratif İşlem Hattı oluşturun ve ajanınızı yeni veriler üzerinde tetiklemek için zamanlanmış aralıklarda çalışan bir ETL işlem hattı dağıtın. Bu, ayıkladığınız verilerle bir akış tablosunu güncelleyen Lakeflow Spark Tanımlayıcı İşlem Hatları oluşturur. yeni veriler geldiğinde işlem hattının zamanlamasını çalışacak şekilde yapılandırabilirsiniz. Lakeflow Spark Bildirimli İşlem Hatları hakkında daha fazla bilgi için bkz. Lakeflow Spark Bildirimli İşlem Hatları.

Sınırlamalar

  • Bilgi Ayıklama aracılarının bağlam uzunluğu üst sınırı 128k olur.
  • Gelişmiş Güvenlik ve Uyumluluk etkinleştirilmiş çalışma alanları desteklenmez.
  • Birleşim şeması türleri desteklenmez.