Belge ve konuşma özetleme nedir?

Önemli

Önizleme bölgemiz olan Sweden Central, GPT modellerini temel alan en son ve sürekli gelişen LLM ince ayar tekniklerimizi gösterir. Bunları İsveç Orta bölgesindeki bir Dil kaynağıyla deneyebilirsiniz.

Konuşma özetlemesi yalnızca şu şekilde kullanılabilir:

  • REST API
  • Python
  • C#

Özetleme, bulutta yazılı dil içeren akıllı uygulamalar geliştirmeye yönelik bir makine öğrenmesi ve yapay zeka algoritmaları koleksiyonu olan Azure AI Language tarafından sunulan özelliklerden biridir. Bu özellik hakkında daha fazla bilgi edinmek ve uygulamalarınızda nasıl kullanacağınızı öğrenmek için bu makaleyi kullanın.

Hizmetler belge ve konuşma özetlemesi olarak etiketlenmiş olsa da, belge özetleme yalnızca düz metin bloklarını kabul eder ve konuşma özetlemesi modelin daha fazla bilgi edinebilmesi için çeşitli konuşma yapıtlarını kabul eder. Bir konuşmayı işlemek ancak yalnızca metinle ilgilenmek istiyorsanız, bu senaryo için belge özetlemesini kullanabilirsiniz.

Bu belge aşağıdaki makale türlerini içerir:

Belge özetleme, belgeler için bir özet oluşturmak için doğal dil işleme tekniklerini kullanır. Otomatik özetleme için desteklenen üç API yaklaşımı vardır: ayıklayıcı, soyutlayıcı ve sorgu odaklı.

Ayıklayıcı özetleme, özgün içerik içindeki en önemli veya ilgili bilgileri topluca temsil eden cümleleri ayıklar. Soyut özetleme, kısa, tutarlı tümceler veya tam olarak açık olmayan sözcüklerle özgün belgeden tümceleri ayıklayan bir özet oluşturur. Bu özellikler, okunamayacak kadar uzun kabul edilebilecek içeriği kısaltmak için tasarlanmıştır.

Yerel belge desteği

Yerel belge, Microsoft Word (docx) veya taşınabilir belge dosyası (pdf) gibi özgün belgeyi oluşturmak için kullanılan dosya biçimini ifade eder. Yerel belge desteği, Azure AI Dili kaynak özelliklerini kullanmadan önce metin ön işleme gereksinimini ortadan kaldırır. Şu anda hem AbstractiveSummarization hem de ExtractiveSummarization özellikleri için yerel belge desteği sağlanıyor.

Şu anda Belge Özetleme aşağıdaki yerel belge biçimlerini destekler:

Dosya türü Dosya uzantısı Açıklama
Metin .txt Biçimlendirilmemiş bir metin belgesi.
Adobe PDF .pdf Taşınabilir bir belge dosyası biçimlendirilmiş belge.
Microsoft Word .docx Microsoft Word belge dosyası.

Daha fazla bilgi için bkz. Dil işleme için yerel belgeleri kullanma

Önemli özellikler

Bu API'nin sağladığı belge özetlemesinin bazı yönleri vardır:

  • Ayıklayıcı özetleme: Belge içindeki tuzlu cümleleri ayıklayarak bir özet oluşturur.

    • Birden çok ayıklanmış cümle: Bu cümleler, belgenin ana fikrini topluca ifade eder. Bunlar, giriş belgesinin içeriğinden ayıklanan özgün cümlelerdir.
    • Derece puanı: Derece puanı, tümcenin belgenin ana konusuyla ne kadar ilgili olduğunu gösterir. Belge özetleme ayıklanan cümleleri sıralar ve bunların göründükleri sırayla mı yoksa derecelerine göre mi döndürüleceğini belirleyebilirsiniz.
    • Birden çok döndürülen cümle: Döndürülecek en fazla cümle sayısını belirleyin. Örneğin, üç cümlelik özet ayıklayıcı özetleme isteğinde bulunursanız en yüksek puanlı üç cümle döndürülüyor.
    • Konum bilgisi: Ayıklanan cümlelerin başlangıç konumu ve uzunluğu.
  • Soyut özetleme: Belgedekiyle aynı sözcükleri kullanmayan ancak ana fikri yakalayan bir özet oluşturur.

    • Özet metinleri: Soyut özetleme, belgedeki her bağlamsal giriş aralığı için bir özet döndürür. Bağlamsal giriş aralığıyla birden çok özet metin grubunun döndürülebilmesi için uzun bir belge bölümlenebilir.
    • Bağlamsal giriş aralığı: Özet metni oluşturmak için kullanılan giriş belgesi içindeki aralık.
  • Sorgu odaklı özetleme: Sorguyu temel alan bir özet oluşturur

Örneğin, aşağıdaki metin paragrafını göz önünde bulundurun:

"Microsoft olarak, öğrenme ve anlama konusunda daha bütünsel, insan odaklı bir yaklaşım benimseyerek yapay zekayı mevcut tekniklerin ötesine geçirme arayışın içindeyiz. Azure yapay zeka hizmetlerinin Baş Teknoloji Sorumlusu olarak, bu görevi gerçeğe dönüştürmek için harika bilim adamları ve mühendislerden oluşan bir ekiple birlikte çalışıyorum. Rolümde, insan bilişselliğin üç özniteliği arasındaki ilişkiyi görüntülemede benzersiz bir perspektiften keyif alıyorum: monolingual metin (X), sesli veya görsel duyusal sinyaller, (Y) ve çok dilli (Z). Üçünün de kesişiminde, Şekil 1'de gösterildiği gibi XYZ-code olarak adlandırdığımız sihir, insanları daha iyi konuşabilen, duyabilen, görebilen ve anlayan daha güçlü yapay zeka oluşturmaya ilişkin bir ortak gösterimdir. XYZ-code'un uzun vadeli vizyonumuzu yerine getirmemize olanak sağladığına inanıyoruz: etki alanları arası aktarım öğrenmesi, yayılan modaliteler ve diller. Amaç, insanların günümüzdeki gibi çok çeşitli aşağı akış yapay zeka görevlerini desteklemek için gösterimleri birlikte öğrenebilen önceden eğitilmiş modellere sahip olmaktır. Son beş yılda konuşma tanıma, makine çevirisi, konuşma sorusu yanıtlama, makine okuma kavrama ve görüntü başlık etme ölçütlerinde insan performansı elde ettik. Bu beş atılım, insanların öğrenme ve anlama şekline daha yakın olan çok algılayıcılı ve çok dilli öğrenmeyi başararak yapay zeka özelliklerinde bir sıçrama elde etmek için daha iddialı hedeflerimize yönelik güçlü sinyaller sağladı. Ortak XYZ-code'un, aşağı akış yapay zeka görevlerinde dış bilgi kaynaklarıyla temellenmişse, bu isteğin temel bir bileşeni olduğuna inanıyorum."

Belge özetleme API isteği, isteğin alınması üzerine API arka ucu için bir iş oluşturularak işlenir. İş başarılı olursa API'nin çıkışı döndürülür. Çıkış 24 saat boyunca alınabilir. Bu süreden sonra çıkış temizlenir. Çok dilli ve emoji desteği nedeniyle yanıtta metin uzaklıkları bulunabilir. Daha fazla bilgi için bkz . Uzaklıkları işleme.

Yukarıdaki örneği kullanırsak API şu özetlenmiş cümleleri döndürebilir:

Ayıklayıcı özetleme:

  • "Microsoft olarak, öğrenme ve anlama konusunda daha bütünsel, insan odaklı bir yaklaşım benimseyerek yapay zekayı mevcut tekniklerin ötesine geçirme arayışın içindeyiz."
  • "XYZ-code'un uzun vadeli vizyonumuzu yerine getirmemize olanak sağladığına inanıyoruz: etki alanları arası aktarım öğrenmesi, yayılan modaliteler ve diller."
  • "Amaç, insanların bugün yaptığı gibi çok çeşitli aşağı akış yapay zeka görevlerini desteklemek için gösterimleri birlikte öğrenebilen önceden eğitilmiş modellere sahip olmaktır."

Soyut özetleme:

  • "Microsoft, öğrenme ve anlama konusunda daha bütünsel, insan odaklı bir yaklaşım benimser. XYZ-code'un uzun vadeli vizyonumuzu yerine getirmemize olanak sağladığına inanıyoruz: etki alanları arası aktarım öğrenmesi, yayılan modaliteler ve diller. Son beş yıl içinde konuşma tanımada kıyaslamalarda insan performansı elde ettik."

Özetlemeyi kullanmaya başlama

Özetlemeyi kullanmak için analize gönderir ve uygulamanızda API çıkışını işlersiniz. Analiz, verilerinizde kullanılan modele ek özelleştirme yapılmadan olduğu gibi gerçekleştirilir. Özetlemeyi kullanmanın iki yolu vardır:

Geliştirme seçeneği Açıklama
Dil stüdyosu Language Studio, Azure hesabı olmadan metin örnekleriyle varlık bağlamayı ve kaydolduğunuz sırada kendi verilerinizi denemenize olanak tanıyan web tabanlı bir platformdur. Daha fazla bilgi için Language Studio web sitesine veya language studio hızlı başlangıcına bakın.
REST API veya İstemci kitaplığı (Azure SDK) REST API'sini veya çeşitli dillerde kullanılabilen istemci kitaplığını kullanarak belge özetlemeyi uygulamalarınızla tümleştirin. Daha fazla bilgi için özetleme hızlı başlangıcına bakın.

Giriş gereksinimleri ve hizmet sınırları

  • Özetleme, analiz için metin alır. Daha fazla bilgi için nasıl yapılır kılavuzundaki Veri ve hizmet sınırları bölümüne bakın.
  • Özetleme, çeşitli yazılı dillerle çalışır. Daha fazla bilgi için bkz . dil desteği.

Başvuru belgeleri ve kod örnekleri

Uygulamalarınızda belge özetlemeyi kullanırken Azure AI Dili için aşağıdaki başvuru belgelerine ve örneklerine bakın:

Geliştirme seçeneği / dil Başvuru belgeleri Örnekler
C# C# belgeleri C# örnekleri
Java Java belgeleri Java Örnekleri
JavaScript JavaScript belgeleri JavaScript örnekleri
Python Python belgeleri Python örnekleri

Sorumlu AI

Yapay zeka sistemi yalnızca teknolojiyi değil, onu kullanan kişileri, bundan etkilenen kişileri ve dağıtım ortamını da içerir. Sistemlerinizde sorumlu yapay zeka kullanımı ve dağıtımı hakkında bilgi edinmek için özetleme için saydamlık notunu okuyun. Daha fazla bilgi için aşağıdaki makaleleri inceleyin: