Belge özetlemeyi kullanma
Belge özetlemesi, kullanıcıların okuması çok uzun olarak kabul eden içeriği kısaltacak şekilde tasarlanmıştır. Hem ayıklayıcı hem de soyut özetleme, makaleleri, makaleleri veya belgeleri önemli cümlelere daraltır.
Ayıklayıcı özetleme: Özgün içerik içindeki en önemli veya ilgili bilgileri topluca temsil eden cümleleri ayıklayarak bir özet oluşturur.
Soyut özetleme: Ana fikri yakalayan belgeden özetlenmiş cümleler oluşturarak bir özet oluşturur.
API tarafından kullanılan yapay zeka modelleri hizmet tarafından sağlanır, yalnızca analiz için içerik göndermeniz gerekir.
Özellikler
İpucu
Bu özellikleri kullanmaya başlamak istiyorsanız, başlamak için hızlı başlangıç makalesini izleyebilirsiniz. Kod yazmaya gerek kalmadan Language Studio'yu kullanarak da örnek isteklerde bulunabilirsiniz.
Ayıklayıcı özetleme API'sinde yapılandırılmamış bir metin belgesindeki temel cümleleri bulmak için doğal dil işleme teknikleri kullanılır. Bu cümleler, belgenin ana fikrini topluca ifade eder.
Ayıklayıcı özetleme, sistem yanıtının bir parçası olarak, ayıklanan cümleler ve özgün belgelerdeki konumlarıyla birlikte bir derece puanı döndürür. Derece puanı, bir cümlenin belgenin ana fikriyle ne kadar ilgili olduğunu gösteren bir göstergedir. Model, her cümleye 0 ile 1 (dahil) arasında bir puan verir ve istek başına en yüksek puanlı cümleleri döndürür. Örneğin, üç cümlelik bir özet isterseniz, hizmet en yüksek puanlı üç cümleyi döndürür.
Azure AI Dili'nde anahtar ifade ayıklama özelliği olan anahtar bilgileri ayıklayan başka bir özellik daha vardır. Anahtar ifade ayıklama ve ayıklayıcı özetleme arasında karar verirken aşağıdakileri göz önünde bulundurun:
- Anahtar ifade ayıklama tümcecikleri döndürürken, ayıklayıcı özetleme tümceleri döndürür.
- Ayıklayıcı özetleme, tümceleri bir derece puanıyla birlikte döndürür ve istek başına en yüksek dereceli cümleler döndürülür.
- Ayıklayıcı özetleme aşağıdaki konum bilgilerini de döndürür:
- Uzaklık: Ayıklanan her cümlenin başlangıç konumu.
- Uzunluk: Ayıklanan her cümlenin uzunluğu.
Verilerin nasıl işleneceğini belirleme (isteğe bağlı)
Veri gönderme
Belgeleri API'ye metin dizesi olarak gönderirsiniz. İstek alındığında analiz gerçekleştirilir. API zaman uyumsuz olduğundan, API isteği gönderme ve sonuçları alma arasında bir gecikme olabilir.
Bu özellik kullanıldığında API sonuçları, isteğin alındığı andan itibaren 24 saat boyunca kullanılabilir ve yanıtta belirtilir. Bu sürenin sonunda sonuçlar temizlenir ve artık alınamayacaktır.
Belge özetleme sonuçlarını alma
Dil algılamadan sonuç aldığınızda, sonuçları bir uygulamaya akışla aktarabilir veya çıkışı yerel sistemdeki bir dosyaya kaydedebilirsiniz.
Aşağıda özetleme için gönderebileceğiniz bir içerik örneği verilmiştir. Bu örnek, Tümleştirici yapay zekaya yönelik bütünsel bir gösterim başlıklı Microsoft blog makalesi kullanılarak ayıklanır. Bu makale yalnızca bir örnektir; API çok daha uzun giriş metnini kabul edebilir. Daha fazla bilgi için veri sınırları bölümüne bakın.
"Microsoft'ta, öğrenme ve anlama konusunda daha bütünsel, insan odaklı bir yaklaşım benimseyerek yapay zekayı mevcut tekniklerin ötesine geçirme arayışındayız. Azure yapay zeka hizmetlerinin Baş Teknoloji Sorumlusu olarak bu görevi gerçeğe dönüştürmek için harika bilim adamları ve mühendislerden oluşan bir ekiple birlikte çalışıyorum. Benim rolümde, insan bilişindeki üç öznitelik arasındaki ilişkiyi görüntüleme açısından benzersiz bir perspektiften keyif alıyorum: monolingual metin (X), sesli veya görsel duyusal sinyaller, (Y) ve çok dilli (Z). Üçünün de kesişiminde, Şekil 1'de gösterildiği gibi XYZ-code olarak adlandırdığımız sihir, insanları daha iyi konuşabilen, duyabilen, görebilen ve anlayan daha güçlü yapay zekalar oluşturmaya ilişkin bir ortak gösterimdir. XYZ-code'un uzun vadeli vizyonumuzu gerçekleştirmemize olanak tanıyacağına inanıyoruz: etki alanları arası aktarım öğrenmesi, modaliteleri ve dilleri kapsayan. Hedef, insanların günümüzdeki gibi çok çeşitli aşağı akış yapay zeka görevlerini desteklemek için gösterimleri birlikte öğrenebilen önceden eğitilmiş modellere sahip olmaktır. Son beş yıl içinde konuşma tanıma, makine çevirisi, konuşma sorusu yanıtlama, makine okuma anlama ve resim yazısı gibi ölçütlerde insan performansı elde ettik. Bu beş atılım, yapay zeka özelliklerinde bir sıçrama elde etmek için daha hırslı hedeflerimize yönelik güçlü sinyaller sağladı ve insanların nasıl öğrendiğine ve anlamasına daha yakın olan çok duyusal ve çok dilli öğrenme elde etti. Ortak XYZ-code'un, aşağı akış yapay zeka görevlerinde dış bilgi kaynaklarıyla temel alınması durumunda bu isteğin temel bir bileşeni olduğuna inanıyorum."
Belge özetleme API isteği, istek alındıktan sonra API arka ucu için bir iş oluşturularak işlenir. İş başarılı olursa API'nin çıkışı döndürülür. Çıktı 24 saat boyunca alınabilir. Bu süreden sonra çıkış temizlenir. Çok dilli ve emoji desteği nedeniyle yanıtta metin uzaklıkları bulunabilir. Daha fazla bilgi için bkz. uzaklıkları işleme .
Yukarıdaki örneği kullanarak API aşağıdaki özetlenmiş cümleleri döndürebilir:
Ayıklayıcı özetleme:
- "Microsoft olarak, öğrenme ve anlama konusunda daha bütünsel, insan odaklı bir yaklaşım benimseyerek yapay zekayı mevcut tekniklerin ötesine geçirme arayışındayız."
- "XYZ-code'un uzun vadeli vizyonumuzu gerçekleştirmemize olanak tanıyacağına inanıyoruz: etki alanları arası aktarım öğrenmesi, modaliteleri ve dilleri kapsayan."
- "Hedef, insanların bugün yaptığı gibi çok çeşitli aşağı akış yapay zeka görevlerini desteklemek için gösterimleri birlikte öğrenebilen önceden eğitilmiş modellere sahip olmaktır."
Soyut özetleme:
- "Microsoft, öğrenme ve anlama konusunda daha bütünsel, insan odaklı bir yaklaşım benimser. XYZ-code'un uzun vadeli vizyonumuzu gerçekleştirmemize olanak tanıyacağına inanıyoruz: etki alanları arası aktarım öğrenmesi, modaliteleri ve dilleri kapsayan. Son beş yılda karşılaştırmalarda insan performansı elde ettik."
Belge ayıklama özetlemeyi deneyin
Makalelerin, makalelerin veya belgelerin özetlerini almak için belge ayıklayıcı özetlemeyi kullanabilirsiniz. Bir örneği görmek için hızlı başlangıç makalesine bakın.
Parametresini sentenceCount
kullanarak varsayılan değer olarak 3
kaç cümle döndürüleceğini gösterebilirsiniz. Aralık 1 ile 20 arasındadır.
Ayıklanan tümcelerin hangi sırada döndürüleceğini belirtmek için parametresini de kullanabilirsiniz sortby
( Offset
veya Rank
varsayılan değer olarak Offset
).
parametre değeri | Açıklama |
---|---|
Derece | Tümceleri, hizmet tarafından belirlenen giriş belgesiyle ilgilerine göre sırala. |
Uzaklık | Tümcelerin giriş belgesinde göründüğü özgün sırayı korur. |
Belge soyut özetlemeyi deneyin
Aşağıdaki örnek, belge soyut özetlemesi ile çalışmaya başlamanızı sağlayacaktır:
- Aşağıdaki komutu bir metin düzenleyicisine kopyalayın. BASH örneği satır devamı karakterini kullanır
\
. Konsolunuz veya terminaliniz farklı bir satır devamlılığı karakteri kullanıyorsa, bunun yerine bu karakteri kullanın.
curl -i -X POST https://<your-language-resource-endpoint>/language/analyze-text/jobs?api-version=2022-10-01-preview \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <your-language-resource-key>" \
-d \
'
{
"displayName": "Document Abstractive Summarization Task Example",
"analysisInput": {
"documents": [
{
"id": "1",
"language": "en",
"text": "At Microsoft, we have been on a quest to advance AI beyond existing techniques, by taking a more holistic, human-centric approach to learning and understanding. As Chief Technology Officer of Azure AI services, I have been working with a team of amazing scientists and engineers to turn this quest into a reality. In my role, I enjoy a unique perspective in viewing the relationship among three attributes of human cognition: monolingual text (X), audio or visual sensory signals, (Y) and multilingual (Z). At the intersection of all three, there’s magic—what we call XYZ-code as illustrated in Figure 1—a joint representation to create more powerful AI that can speak, hear, see, and understand humans better. We believe XYZ-code will enable us to fulfill our long-term vision: cross-domain transfer learning, spanning modalities and languages. The goal is to have pre-trained models that can jointly learn representations to support a broad range of downstream AI tasks, much in the way humans do today. Over the past five years, we have achieved human performance on benchmarks in conversational speech recognition, machine translation, conversational question answering, machine reading comprehension, and image captioning. These five breakthroughs provided us with strong signals toward our more ambitious aspiration to produce a leap in AI capabilities, achieving multi-sensory and multilingual learning that is closer in line with how humans learn and understand. I believe the joint XYZ-code is a foundational component of this aspiration, if grounded with external knowledge sources in the downstream AI tasks."
}
]
},
"tasks": [
{
"kind": "AbstractiveSummarization",
"taskName": "Document Abstractive Summarization Task 1",
"parameters": {
"sentenceCount": 1
}
}
]
}
'
belirtmezseniz sentenceCount
, model özet uzunluğunu belirler. Çıkış özetinin 1 ile 20 arasındaki tümce sayısının yaklaşık değeri olduğunu sentenceCount
unutmayın.
- Gerektiğinde komutta aşağıdaki değişiklikleri yapın:
- değerini
your-language-resource-key
anahtarınızla değiştirin. - İstek URL'sinin ilk bölümünü uç nokta URL'nizle
your-language-resource-endpoint
değiştirin.
Bir komut istemi penceresi açın (örneğin: BASH).
Komutu metin düzenleyicisinden komut istemi penceresine yapıştırın ve komutunu çalıştırın.
operation-location
Yanıt üst bilgisinden öğesini alın. Değer aşağıdaki URL'ye benzer olacaktır:
https://<your-language-resource-endpoint>/language/analyze-text/jobs/12345678-1234-1234-1234-12345678?api-version=2022-10-01-preview
- İsteğin sonuçlarını almak için aşağıdaki cURL komutunu kullanın. değerini önceki
operation-location
yanıt üst bilgisinden aldığınız sayısal kimlik değeriyle değiştirdiğinizden<my-job-id>
emin olun:
curl -X GET https://<your-language-resource-endpoint>/language/analyze-text/jobs/<my-job-id>?api-version=2022-10-01-preview \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <your-language-resource-key>"
Soyutlayıcı belge özetleme örneği JSON yanıtı
{
"jobId": "cd6418fe-db86-4350-aec1-f0d7c91442a6",
"lastUpdateDateTime": "2022-09-08T16:45:14Z",
"createdDateTime": "2022-09-08T16:44:53Z",
"expirationDateTime": "2022-09-09T16:44:53Z",
"status": "succeeded",
"errors": [],
"displayName": "Document Abstractive Summarization Task Example",
"tasks": {
"completed": 1,
"failed": 0,
"inProgress": 0,
"total": 1,
"items": [
{
"kind": "AbstractiveSummarizationLROResults",
"taskName": "Document Abstractive Summarization Task 1",
"lastUpdateDateTime": "2022-09-08T16:45:14.0717206Z",
"status": "succeeded",
"results": {
"documents": [
{
"summaries": [
{
"text": "Microsoft is taking a more holistic, human-centric approach to AI. We've developed a joint representation to create more powerful AI that can speak, hear, see, and understand humans better. We've achieved human performance on benchmarks in conversational speech recognition, machine translation, ...... and image captions.",
"contexts": [
{
"offset": 0,
"length": 247
}
]
}
],
"id": "1"
}
],
"errors": [],
"modelVersion": "latest"
}
}
]
}
}
parametre | Açıklama |
---|---|
-X POST <endpoint> |
API'ye erişmek için uç noktanızı belirtir. |
-H Content-Type: application/json |
JSON verilerini göndermek için içerik türü. |
-H "Ocp-Apim-Subscription-Key:<key> |
API'ye erişmek için anahtarı belirtir. |
-d <documents> |
Göndermek istediğiniz belgeleri içeren JSON. |
Aşağıdaki cURL komutları bir BASH kabuğundan yürütülür. Bu komutları kendi kaynak adınız, kaynak anahtarınız ve JSON değerlerinizle düzenleyin.
Hizmet ve veri sınırları
Dakika ve saniye başına gönderebileceğiniz isteklerin boyutu ve sayısı hakkında bilgi için hizmet sınırları makalesine bakın.