Belge ve konuşma özetleme nedir?

Önemli

Tek bir önizleme bölgesi olan Sweden Central, tüm özetleme özelliklerinin kullanılabildiği en son ve sürekli gelişen LLM ince ayar tekniklerimizi gösterir. Müşterilerimizin erişim isteği formunu doldurarak erken benimseyen topluluğumuza katılmasını bekliyoruz. . Değerli geri bildirimleriniz sürekli geliştirmemiz için çok önemlidir. Konuşma özetlemesi yalnızca şu şekilde kullanılabilir:

  • REST API
  • Python
  • C#

Özetleme, bulutta yazılı dil içeren akıllı uygulamalar geliştirmeye yönelik bir makine öğrenmesi ve yapay zeka algoritmaları koleksiyonu olan Azure AI Language tarafından sunulan özelliklerden biridir. Bu özellik hakkında daha fazla bilgi edinmek ve uygulamalarınızda nasıl kullanacağınızı öğrenmek için bu makaleyi kullanın.

Hizmetler belge ve konuşma özetleme olarak etiketlenmiş olsa da, belge özetlemesinin yalnızca düz metin bloklarını kabul ettiğini ve konuşma özetlemesinin modelin daha fazla bilgi edinebilmesi için çeşitli konuşma yapıtlarını kabul edeceğine dikkat edin. Bir konuşmayı işlemek ancak yalnızca metinle ilgilenmek istiyorsanız, bu senaryo için belge özetlemesini kullanabilirsiniz.

Özel Özetleme, kullanıcıların sözleşmeler veya romanlar gibi yapılandırılmamış metinleri özetlemek için özel yapay zeka modelleri oluşturmasını sağlar. Geliştiriciler Özel Özetleme projesi oluşturarak verileri yinelemeli olarak etiketleyebilir, eğitebilir, değerlendirebilir ve kullanım için kullanılabilir hale getirmeden önce model performansını geliştirebilir. Etiketlenen verilerin kalitesi model performansını büyük ölçüde etkiler. Hizmet, modelinizi oluşturmayı ve özelleştirmeyi basitleştirmek için Language Studio üzerinden erişilebilen özel bir web portalı sunar. Bu hızlı başlangıçtaki adımları izleyerek hizmeti kullanmaya kolayca başlayabilirsiniz.

Bu belge aşağıdaki makale türlerini içerir:

Belge özetleme, belgeler için bir özet oluşturmak için doğal dil işleme tekniklerini kullanır. Otomatik özetleme için api tarafından desteklenen iki genel yaklaşım vardır: ayıklayıcı ve soyutlayıcı.

Ayıklayıcı özetleme, özgün içerik içindeki en önemli veya ilgili bilgileri topluca temsil eden cümleleri ayıklar. Soyut özetleme, basit bir şekilde özgün belgeden cümle ayıklamayan kısa, tutarlı cümleler veya sözcükler içeren bir özet oluşturur. Bu özellikler, okunamayacak kadar uzun kabul edilebilecek içeriği kısaltmak için tasarlanmıştır.

Önemli özellikler

Bu API'nin sağladığı iki tür belge özetlemesi vardır:

  • Ayıklayıcı özetleme: Belge içindeki tuzlu cümleleri ayıklayarak bir özet oluşturur.
    • Birden çok ayıklanmış cümle: Bu cümleler, belgenin ana fikrini topluca ifade eder. Bunlar, giriş belgesinin içeriğinden ayıklanan özgün cümlelerdir.
    • Derece puanı: Derece puanı, tümcenin belgenin ana konusuyla ne kadar ilgili olduğunu gösterir. Belge özetleme ayıklanan cümleleri sıralar ve bunların göründükleri sırayla mı yoksa derecelerine göre mi döndürüleceğini belirleyebilirsiniz.
    • Birden çok döndürülen cümle: Döndürülecek en fazla cümle sayısını belirleyin. Örneğin, üç cümlelik özet özet özetleme isteğinde bulunursanız en yüksek puanlanmış üç cümle döndürülecektir.
    • Konum bilgisi: Ayıklanan cümlelerin başlangıç konumu ve uzunluğu.
  • Soyut özetleme: Belgedekilerle aynı sözcükleri kullanamayan ancak ana fikri yakalayan bir özet oluşturur.
    • Özet metinleri: Soyut özetleme, belgedeki her bağlamsal giriş aralığı için bir özet döndürür. Çok sayıda özet metin grubunun bağlamsal giriş aralığıyla döndürülebilmesi için uzun bir belge bölümlenebilir.
    • Bağlamsal giriş aralığı: Özet metni oluşturmak için kullanılan giriş belgesi içindeki aralık.

Örneğin, aşağıdaki metin paragrafını göz önünde bulundurun:

"Microsoft olarak, öğrenme ve anlama konusunda daha bütünsel, insan odaklı bir yaklaşım benimseyerek yapay zekayı mevcut tekniklerin ötesine geçirme arayışındayız. Azure yapay zeka hizmetlerinin Baş Teknoloji Sorumlusu olarak, bu görevi gerçeğe dönüştürmek için harika bilim adamları ve mühendislerden oluşan bir ekiple birlikte çalışıyorum. Rolümde, insan bilişselliğin üç özniteliği arasındaki ilişkiyi görüntülemede benzersiz bir perspektiften keyif alıyorum: monolingual metin (X), sesli veya görsel duyusal sinyaller, (Y) ve çok dilli (Z). Üçünün de kesişiminde, Şekil 1'de gösterildiği gibi XYZ-code olarak adlandırdığımız sihir, insanları daha iyi konuşabilen, duyabilen, görebilen ve anlayan daha güçlü yapay zeka oluşturmaya ilişkin bir ortak gösterimdir. XYZ-code'un uzun vadeli vizyonumuzu gerçekleştirmemize olanak tanıyacağına inanıyoruz: etki alanları arası aktarım öğrenmesi, yayılan yöntemler ve diller. Amaç, insanların bugün yaptığı gibi çok çeşitli aşağı akış yapay zeka görevlerini desteklemek için gösterimleri birlikte öğrenebilen önceden eğitilmiş modellere sahip olmaktır. Son beş yıl içinde konuşma tanıma, makine çevirisi, konuşma sorusu yanıtlama, makine okuma kavrama ve görüntü başlık etme ölçütlerinde insan performansı elde ettik. Bu beş atılım, insanların öğrenme ve anlama şekline daha yakın olan çok algılayıcılı ve çok dilli öğrenmeyi başararak yapay zeka özelliklerinde bir sıçrama elde etmek için daha iddialı hedeflerimize yönelik güçlü sinyaller sağladı. Ortak XYZ-code'un, aşağı akış yapay zeka görevlerinde dış bilgi kaynaklarıyla temellenmişse, bu isteğin temel bir bileşeni olduğuna inanıyorum."

Belge özetleme API isteği, isteğin alınması üzerine API arka ucu için bir iş oluşturularak işlenir. İş başarılı olursa API'nin çıkışı döndürülür. Çıkış 24 saat boyunca alınabilir. Bu süreden sonra çıkış temizlenir. Çok dilli ve emoji desteği nedeniyle yanıtta metin uzaklıkları bulunabilir. Daha fazla bilgi için bkz . uzaklıkları işleme.

Yukarıdaki örneği kullanarak API aşağıdaki özetlenmiş cümleleri döndürebilir:

Ayıklayıcı özetleme:

  • "Microsoft olarak, öğrenme ve anlama konusunda daha bütünsel, insan odaklı bir yaklaşım benimseyerek yapay zekayı mevcut tekniklerin ötesine geçirme arayışındayız."
  • "XYZ-code'un uzun vadeli vizyonumuzu gerçekleştirmemize olanak tanıyacağına inanıyoruz: etki alanları arası aktarım öğrenmesi, farklı modaliteler ve diller."
  • "Amaç, insanların bugün yaptığı gibi çok çeşitli aşağı akış yapay zeka görevlerini desteklemek için temsilleri birlikte öğrenebilen önceden eğitilmiş modellere sahip olmaktır."

Soyut özetleme:

  • "Microsoft, öğrenme ve anlama konusunda daha bütünsel, insan odaklı bir yaklaşım benimser. XYZ-code'un uzun vadeli vizyonumuzu gerçekleştirmemize olanak tanıyacağına inanıyoruz: etki alanları arası aktarım öğrenmesi, yayılan yöntemler ve diller. Son beş yıl içinde, karşılaştırmalar üzerinde insan performansı elde ettik."

Özetlemeyi kullanmaya başlama

Özetlemeyi kullanmak için analiz için yapılandırılmamış ham metin gönderir ve uygulamanızda API çıkışını işlersiniz. Analiz, verilerinizde kullanılan modelde ek özelleştirme yapılmadan olduğu gibi gerçekleştirilir. Özetlemeyi kullanmanın iki yolu vardır:

Geliştirme seçeneği Açıklama
Dil stüdyosu Language Studio, Azure hesabı olmadan metin örnekleriyle varlık bağlamayı ve kaydolduğunuz sırada kendi verilerinizi denemenize olanak tanıyan web tabanlı bir platformdur. Daha fazla bilgi için Language Studio web sitesine veya language studio hızlı başlangıcına bakın.
REST API veya İstemci kitaplığı (Azure SDK) REST API'yi veya çeşitli dillerde kullanılabilen istemci kitaplığını kullanarak belge özetlemeyi uygulamalarınızla tümleştirin. Daha fazla bilgi için özetleme hızlı başlangıcına bakın.

Giriş gereksinimleri ve hizmet sınırları

  • Özetleme, analiz için yapılandırılmamış ham metni alır. Daha fazla bilgi için nasıl yapılır kılavuzundaki Veri ve hizmet sınırları bölümüne bakın.
  • Özetleme, çeşitli yazılı dillerle çalışır. Daha fazla bilgi için bkz . dil desteği .

Başvuru belgeleri ve kod örnekleri

Uygulamalarınızda belge özetlemeyi kullanırken Azure AI Dili için aşağıdaki başvuru belgelerine ve örneklerine bakın:

Geliştirme seçeneği / dil Başvuru belgeleri Örnekler
C# C# belgeleri C# örnekleri
Java Java belgeleri Java Örnekleri
JavaScript JavaScript belgeleri JavaScript örnekleri
Python Python belgeleri Python örnekleri

Sorumlu AI

Yapay zeka sistemi yalnızca teknolojiyi değil, onu kullanacak kişileri, bundan etkilenecek kişileri ve dağıtıldığı ortamı da içerir. Sistemlerinizde sorumlu yapay zeka kullanımı ve dağıtımı hakkında bilgi edinmek için özetleme için saydamlık notunu okuyun. Daha fazla bilgi için aşağıdaki makalelere de bakabilirsiniz: