Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Azure AI Search, Azure Blob Depolama'da depolanan PDF belgelerinden hem metinleri hem de görüntüleri ayıklayabilir ve dizine ekleyebilir. Bu öğretici, Azure AI Search'te yerleşik Metin Bölme becerisini kullanarak verileri öbekleyen ve aynı belgedeki metin ve görselleri vektörleştirmek için çok modlu gömüleri kullanan çok modlu dizinleme işlem hattı oluşturmayı gösterir. Kırpılan görüntüler bir bilgi deposunda depolanır ve hem metin hem de görsel içerik vektörleştirilir ve aranabilir bir dizine eklenir.
Bu öğreticide şunları kullanacaksınız:
Grafikler, bilgi grafikleri ve taranmış sayfalar gibi zengin görsel içerikleri geleneksel metinlerle birleştiren 36 sayfalık PDF belgesi.
Beceriler aracılığıyla yapay zeka zenginleştirmesi içeren bir dizin oluşturma işlem hattı oluşturmak için bir dizin oluşturucu ve beceri kümesi.
Normalleştirilmiş görüntüleri ve metinleri ayıklamak için Belge Ayıklama becerisi . Metin Bölme becerisi verileri öbekler.
Azure Vision çok modüllü ekleme becerisi, metin ve görüntüleri vektörleştirmeye yöneliktir.
Ayıklanan metin ve görüntü içeriğini depolamak için yapılandırılmış bir arama dizini. Bazı içerikler vektör tabanlı benzerlik araması için vektörleştirilir.
Bu öğreticide, Belge Ayıklama becerisini kullanarak çok modüllü içeriğin dizinini oluşturmak için daha düşük maliyetli bir yaklaşım gösterilmektedir. Azure Blob Depolama'dan çekilen belgelerden hem metin hem de görüntü ayıklamayı ve aramayı etkinleştirir. Ancak, sayfa numaraları veya sınırlayıcı bölgeler gibi metinler için konum meta verilerini içermez. Yapılandırılmış metin düzeni ve uzamsal meta veriler içeren daha kapsamlı bir çözüm için bkz . Öğretici: Yapılandırılmış belge düzeninden vektörleştirme.
Note
Belge Ayıklama becerisi tarafından görüntü ayıklama ücretsiz değildir.
imageAction ayarını beceri seti içinde generateNormalizedImages olarak ayarlamak, ek bir ücretli olan görüntü ayıklamayı tetikler. Faturalama bilgileri için bkz. Azure AI Search fiyatlandırması.
Prerequisites
Microsoft Foundry kaynağı. Bu kaynak, bu öğreticide kullanılan Azure Vision çok modüllü ekleme modeline erişim sağlar. Bu kaynağa beceri kümesi erişimi için Bir Foundry kaynağı kullanmanız gerekir.
Azure AI Arama. Arama hizmetinizi rol tabanlı erişim denetimi ve Azure Depolama ile Azure Görüntü İşleme bağlantıları için yönetilen kimlik için yapılandırın. Hizmetiniz Temel katmanda veya daha yüksek bir katmanda olmalıdır. Bu öğretici Ücretsiz katmanında desteklenmez.
Azure Depolama, örnek verileri depolamak ve bilgi deposu oluşturmak için kullanılır.
Limitations
- Azure Vision çok modüllü ekleme becerileri sınırlı bölgesel kullanılabilirliğe sahiptir. Bir Foundry kaynağı oluşturduğunuzda, çok modüllü eklemeler sağlayan bir bölge seçin. Çok modüllü eklemeler sağlayan bölgelerin güncelleştirilmiş listesi için Azure Vision belgelerine bakın.
Verileri hazırlama
Aşağıdaki yönergeler, örnek verileri sağlayan ve bilgi depolarını barındıran Azure Depolama için geçerlidir. Bir arama hizmeti kimliğinin örnek verileri almak için Azure Depolama'ya okuma erişimine ve bilgi deposunu oluşturmak için yazma erişimine ihtiyacı vardır. Arama hizmeti, beceri kümesi işleme sırasında bir ortam değişkeninde sağladığınız adı kullanarak kırpılan görüntüler için kapsayıcı oluşturur.
Aşağıdaki örnek PDF'yi indirin: sürdürülebilir-ai-pdf
Azure Depolama'da sustainable-ai-pdf adlı yeni bir kapsayıcı oluşturun.
Rol atamaları oluşturun ve bir bağlantı dizesinde yönetilen kimlik belirtin:
Dizin oluşturucu tarafından veri almak için Depolama Blobu Veri Okuyucusu atayın. Bilgi deposu oluşturmak ve yüklemek için Depolama Blob Verisi Katkıda Bulunan Rolü ve Depolama Tablosu Verisi Katkıda Bulunan Rolü atayın. Arama hizmeti rol atamanız için sistem tarafından atanan yönetilen kimliği veya kullanıcı tarafından atanan yönetilen kimliği kullanabilirsiniz.
Sistem tarafından atanan yönetilen kimlik kullanılarak yapılan bağlantılar için, hesap anahtarı veya parolası olmayan ResourceId içeren bir bağlantı dizesi alın. ResourceId depolama hesabının abonelik kimliğini, depolama hesabının kaynak grubunu ve depolama hesabı adını içermelidir. bağlantı dizesi aşağıdaki örneğe benzer:
"credentials" : { "connectionString" : "ResourceId=/subscriptions/00000000-0000-0000-0000-00000000/resourceGroups/MY-DEMO-RESOURCE-GROUP/providers/Microsoft.Storage/storageAccounts/MY-DEMO-STORAGE-ACCOUNT/;" }Kullanıcı tarafından atanan yönetilen kimlik kullanılarak yapılan bağlantılar için, hesap anahtarı veya parolası olmayan ResourceId içeren bir bağlantı dizesi alın. ResourceId depolama hesabının abonelik kimliğini, depolama hesabının kaynak grubunu ve depolama hesabı adını içermelidir. Aşağıdaki örnekte gösterilen söz dizimini kullanarak bir kimlik sağlayın. userAssignedIdentity değerini kullanıcı tarafından atanan yönetilen kimliğe ayarlayın. bağlantı dizesi aşağıdaki örneğe benzer:
"credentials" : { "connectionString" : "ResourceId=/subscriptions/00000000-0000-0000-0000-00000000/resourceGroups/MY-DEMO-RESOURCE-GROUP/providers/Microsoft.Storage/storageAccounts/MY-DEMO-STORAGE-ACCOUNT/;" }, "identity" : { "@odata.type": "#Microsoft.Azure.Search.DataUserAssignedIdentity", "userAssignedIdentity" : "/subscriptions/00000000-0000-0000-0000-00000000/resourcegroups/MY-DEMO-RESOURCE-GROUP/providers/Microsoft.ManagedIdentity/userAssignedIdentities/MY-DEMO-USER-MANAGED-IDENTITY" }
Modelleri hazırlama
Bu öğreticide, becerinin Azure Vision multimodal 4.0 ekleme modelini çağırdığı mevcut bir Dökümhane kaynağınız olduğu varsayılır. Arama hizmeti, yönetilen kimliğini kullanarak beceri kümesi işlenirken modele bağlanır. Bu bölüm, yetkili erişim için rol atama konusunda size rehberlik ve bağlantılar sağlar.
Azure portalında (Foundry portalında değil) oturum açın ve Foundry kaynağını bulun. Çok modüllü 4.0 API'sini sağlayan bir bölgede olduğundan emin olun.
Erişim denetimi (IAM) öğesini seçin.
Ekle'yi ve ardından Rol ataması ekle'yi seçin.
Bilişsel Hizmetler Kullanıcısı için arama yapın ve ardından seçin.
Yönetilen kimlik'i seçin ve ardından arama hizmeti yönetilen kimliğinizi atayın.
REST dosyanızı ayarlama
Bu eğitimde, Azure AI Search'e yönelik yerel REST istemci bağlantınız için bir uç nokta ve bir API anahtarı gerekmektedir. Bu değerleri Azure portalından alabilirsiniz. Alternatif bağlantı yöntemleri için bkz. Arama hizmetine bağlanma.
Dizin oluşturucu ve beceri kümesi işleme sırasında gerçekleşen kimliği doğrulanmış bağlantılar için, arama hizmeti daha önce tanımladığınız rol atamalarını kullanır.
Visual Studio Code'u başlatın ve yeni bir dosya oluşturun.
İstekte kullanılan değişkenler için değerler sağlayın. için
@storageConnection, bağlantı dizenizin sonunda noktalı virgül veya tırnak işareti olmadığından emin olun.@imageProjectionContaineriçin, blob depolamada benzersiz bir kapsayıcı adı sağlayın. Azure AI Search, beceri işleme sırasında bu kapsayıcıyı sizin için oluşturur.@searchUrl = PUT-YOUR-SEARCH-SERVICE-ENDPOINT-HERE @searchApiKey = PUT-YOUR-ADMIN-API-KEY-HERE @storageConnection = PUT-YOUR-STORAGE-CONNECTION-STRING-HERE @cognitiveServicesUrl = PUT-YOUR-AZURE-AI-FOUNDRY-ENDPOINT-HERE @modelVersion = 2023-04-15 @imageProjectionContainer=sustainable-ai-pdf-imagesVeya
.restdosya uzantısını kullanarak.httpdosyayı kaydedin. REST istemcisiyle ilgili yardım için bkz . Hızlı Başlangıç: REST kullanarak tam metin arama.
Azure AI Arama uç noktasını ve API anahtarını almak için:
Azure portalında oturum açın, arama hizmetine Genel Bakış sayfasına gidin ve URL'yi kopyalayın. Örnek uç nokta
https://mydemo.search.windows.netşeklinde görünebilir.Ayarlarbir yönetici anahtarı kopyalayın. Yönetici anahtarları nesneleri eklemek, değiştirmek ve silmek için kullanılır. Değiştirilebilir iki yönetici anahtarı vardır. İkisini de kopyalayın.
Veri kaynağı oluşturun
Veri Kaynağı Oluştur (REST), hangi verilerin dizine alınacağını belirten bir veri kaynağı bağlantısı oluşturur.
POST {{searchUrl}}/datasources?api-version=2025-11-01-preview HTTP/1.1
Content-Type: application/json
api-key: {{searchApiKey}}
{
"name":"doc-extraction-multimodal-embedding-ds",
"description":null,
"type":"azureblob",
"subtype":null,
"credentials":{
"connectionString":"{{storageConnection}}"
},
"container":{
"name":"sustainable-ai-pdf",
"query":null
},
"dataChangeDetectionPolicy":null,
"dataDeletionDetectionPolicy":null,
"encryptionKey":null,
"identity":null
}
İsteği gönderin. Yanıt şöyle görünmelidir:
HTTP/1.1 201 Created
Transfer-Encoding: chunked
Content-Type: application/json; odata.metadata=minimal; odata.streaming=true; charset=utf-8
Location: https://<YOUR-SEARCH-SERVICE-NAME>.search.windows-int.net:443/datasources('doc-extraction-multimodal-embedding-ds')?api-version=2025-11-01-preview -Preview
Server: Microsoft-IIS/10.0
Strict-Transport-Security: max-age=2592000, max-age=15724800; includeSubDomains
Preference-Applied: odata.include-annotations="*"
OData-Version: 4.0
request-id: 4eb8bcc3-27b5-44af-834e-295ed078e8ed
elapsed-time: 346
Date: Sat, 26 Apr 2025 21:25:24 GMT
Connection: close
{
"name": "doc-extraction-multimodal-embedding-ds",
"description": null,
"type": "azureblob",
"subtype": null,
"indexerPermissionOptions": [],
"credentials": {
"connectionString": null
},
"container": {
"name": "sustainable-ai-pdf",
"query": null
},
"dataChangeDetectionPolicy": null,
"dataDeletionDetectionPolicy": null,
"encryptionKey": null,
"identity": null
}
Dizin oluşturma
Dizin Oluştur (REST), arama hizmetinizde bir arama dizini oluşturur. Dizin, tüm parametreleri ve parametrelerin özniteliklerini belirtir.
İç içe JSON için dizin alanlarının kaynak alanlarla aynı olması gerekir. Azure AI Search şu anda iç içe JSON ile alan eşlemelerini desteklemediğinden alan adlarının ve veri türlerinin tamamen eşleşmesi gerekir. Aşağıdaki dizin ham içerikteki JSON öğelerine hizalanır.
### Create an index
POST {{searchUrl}}/indexes?api-version=2025-11-01-preview HTTP/1.1
Content-Type: application/json
api-key: {{searchApiKey}}
{
"name": "doc-extraction-multimodal-embedding-index",
"fields": [
{
"name": "content_id",
"type": "Edm.String",
"retrievable": true,
"key": true,
"analyzer": "keyword"
},
{
"name": "text_document_id",
"type": "Edm.String",
"searchable": false,
"filterable": true,
"retrievable": true,
"stored": true,
"sortable": false,
"facetable": false
},
{
"name": "document_title",
"type": "Edm.String",
"searchable": true
},
{
"name": "image_document_id",
"type": "Edm.String",
"filterable": true,
"retrievable": true
},
{
"name": "content_text",
"type": "Edm.String",
"searchable": true,
"retrievable": true
},
{
"name": "content_embedding",
"type": "Collection(Edm.Single)",
"dimensions": 1024,
"searchable": true,
"retrievable": true,
"vectorSearchProfile": "hnsw"
},
{
"name": "content_path",
"type": "Edm.String",
"searchable": false,
"retrievable": true
},
{
"name": "offset",
"type": "Edm.String",
"searchable": false,
"retrievable": true
},
{
"name": "location_metadata",
"type": "Edm.ComplexType",
"fields": [
{
"name": "page_number",
"type": "Edm.Int32",
"searchable": false,
"retrievable": true
},
{
"name": "bounding_polygons",
"type": "Edm.String",
"searchable": false,
"retrievable": true,
"filterable": false,
"sortable": false,
"facetable": false
}
]
}
],
"vectorSearch": {
"profiles": [
{
"name": "hnsw",
"algorithm": "defaulthnsw",
"vectorizer": "demo-vectorizer"
}
],
"algorithms": [
{
"name": "defaulthnsw",
"kind": "hnsw",
"hnswParameters": {
"m": 4,
"efConstruction": 400,
"metric": "cosine"
}
}
],
"vectorizers": [
{
"name": "demo-vectorizer",
"kind": "aiServicesVision",
"aiServicesVisionParameters": {
"resourceUri": "{{cognitiveServicesUrl}}",
"authIdentity": null,
"modelVersion": "{{modelVersion}}"
}
}
]
},
"semantic": {
"defaultConfiguration": "semanticconfig",
"configurations": [
{
"name": "semanticconfig",
"prioritizedFields": {
"titleField": {
"fieldName": "document_title"
},
"prioritizedContentFields": [
],
"prioritizedKeywordsFields": []
}
}
]
}
}
Önemli noktalar:
Metin ve görüntü ekleme işlemleri alanda
content_embeddingdepolanır ve 1024 ve vektör arama profili gibi uygun boyutlarda yapılandırılmalıdır.location_metadataher normalleştirilmiş görüntü için sınırlayıcı çokgen ve sayfa numarası meta verilerini yakalar, bu da kesin uzamsal aramalara veya kullanıcı arabirimi katmanlarına olanak tanır.location_metadatayalnızca bu senaryoda görüntüler için mevcuttur. Metin için konum meta verilerini de yakalamak istiyorsanız , Belge Düzeni becerisini kullanmayı göz önünde bulundurun. Sayfanın alt kısmında ayrıntılı bir eğitim bağlantısı bulunmaktadır.Vektör araması hakkında daha fazla bilgi için bkz. Azure AI Search'te vektörler.
Anlam derecelendirmesi hakkında daha fazla bilgi için bkz. Azure AI Search'te anlam derecelendirmesi
Beceri kümesi oluşturma
Beceri Kümesi Oluştur (REST), arama hizmetinizde bir beceri kümesi oluşturur. Beceri kümesi, dizin oluşturmadan önce içeriği öbekleyen ve ekleyen işlemleri tanımlar. Bu beceri kümesi, metin ve görüntüleri ayıklamak için yerleşik Belge Ayıklama becerisini kullanır. Büyük metni öbeklemek için Metin Bölme becerisini kullanır. Görüntü ve metin içeriğini vektörleştirmek için Azure Vision çok modüllü ekleme becerisini kullanır.
### Create a skillset
POST {{searchUrl}}/skillsets?api-version=2025-11-01-preview HTTP/1.1
Content-Type: application/json
api-key: {{searchApiKey}}
{
"name": "doc-extraction-multimodal-embedding-skillset",
"description": "A test skillset",
"skills": [
{
"@odata.type": "#Microsoft.Skills.Util.DocumentExtractionSkill",
"name": "document-extraction-skill",
"description": "Document extraction skill to extract text and images from documents",
"parsingMode": "default",
"dataToExtract": "contentAndMetadata",
"configuration": {
"imageAction": "generateNormalizedImages",
"normalizedImageMaxWidth": 2000,
"normalizedImageMaxHeight": 2000
},
"context": "/document",
"inputs": [
{
"name": "file_data",
"source": "/document/file_data"
}
],
"outputs": [
{
"name": "content",
"targetName": "extracted_content"
},
{
"name": "normalized_images",
"targetName": "normalized_images"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.SplitSkill",
"name": "split-skill",
"description": "Split skill to chunk documents",
"context": "/document",
"defaultLanguageCode": "en",
"textSplitMode": "pages",
"maximumPageLength": 2000,
"pageOverlapLength": 200,
"unit": "characters",
"inputs": [
{
"name": "text",
"source": "/document/extracted_content",
"inputs": []
}
],
"outputs": [
{
"name": "textItems",
"targetName": "pages"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Vision.VectorizeSkill",
"name": "text-embedding-skill",
"description": "Vision Vectorization skill for text",
"context": "/document/pages/*",
"modelVersion": "{{modelVersion}}",
"inputs": [
{
"name": "text",
"source": "/document/pages/*"
}
],
"outputs": [
{
"name": "vector",
"targetName": "text_vector"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Vision.VectorizeSkill",
"name": "image-embedding-skill",
"description": "Vision Vectorization skill for images",
"context": "/document/normalized_images/*",
"modelVersion": "{{modelVersion}}",
"inputs": [
{
"name": "image",
"source": "/document/normalized_images/*"
}
],
"outputs": [
{
"name": "vector",
"targetName": "image_vector"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Util.ShaperSkill",
"name": "shaper-skill",
"description": "Shaper skill to reshape the data to fit the index schema",
"context": "/document/normalized_images/*",
"inputs": [
{
"name": "normalized_images",
"source": "/document/normalized_images/*",
"inputs": []
},
{
"name": "imagePath",
"source": "='{{imageProjectionContainer}}/'+$(/document/normalized_images/*/imagePath)",
"inputs": []
},
{
"name": "dataUri",
"source": "='data:image/jpeg;base64,'+$(/document/normalized_images/*/data)",
"inputs": []
},
{
"name": "location_metadata",
"sourceContext": "/document/normalized_images/*",
"inputs": [
{
"name": "page_number",
"source": "/document/normalized_images/*/pageNumber"
},
{
"name": "bounding_polygons",
"source": "/document/normalized_images/*/boundingPolygon"
}
]
}
],
"outputs": [
{
"name": "output",
"targetName": "new_normalized_images"
}
]
}
],
"cognitiveServices": {
"@odata.type": "#Microsoft.Azure.Search.AIServicesByIdentity",
"subdomainUrl": "{{cognitiveServicesUrl}}",
"identity": null
},
"indexProjections": {
"selectors": [
{
"targetIndexName": "doc-extraction-multimodal-embedding-index",
"parentKeyFieldName": "text_document_id",
"sourceContext": "/document/pages/*",
"mappings": [
{
"name": "content_embedding",
"source": "/document/pages/*/text_vector"
},
{
"name": "content_text",
"source": "/document/pages/*"
},
{
"name": "document_title",
"source": "/document/document_title"
}
]
},
{
"targetIndexName": "doc-extraction-multimodal-embedding-index",
"parentKeyFieldName": "image_document_id",
"sourceContext": "/document/normalized_images/*",
"mappings": [
{
"name": "content_embedding",
"source": "/document/normalized_images/*/image_vector"
},
{
"name": "content_path",
"source": "/document/normalized_images/*/new_normalized_images/imagePath"
},
{
"name": "location_metadata",
"source": "/document/normalized_images/*/new_normalized_images/location_metadata"
},
{
"name": "document_title",
"source": "/document/document_title"
}
]
}
],
"parameters": {
"projectionMode": "skipIndexingParentDocuments"
}
},
"knowledgeStore": {
"storageConnectionString": "{{storageConnection}}",
"identity": null,
"projections": [
{
"files": [
{
"storageContainer": "{{imageProjectionContainer}}",
"source": "/document/normalized_images/*"
}
]
}
]
}
}
Bu beceri kümesi metin ve görüntüleri ayıklar, her ikisini de vektörleştirir ve görüntü meta verilerini dizine yansıtmak üzere şekillendirir.
Önemli noktalar:
Alan, Belge Ayıklama Becerisi kullanılarak ayıklanan metinle doldurulur ve Bölme Becerisi kullanılarak parçalara ayrılır.
content_path, belirlenen görüntü projeksiyon kapsayıcısı içindeki görüntü dosyasının göreli yolunu içerir. Bu alan yalnızca OLARAK ayarlandığındaimageActionPDF'lerdengenerateNormalizedImagesayıklanan görüntüler için oluşturulur ve kaynak alanındaki/document/normalized_images/*/imagePathzenginleştirilmiş belgeden eşlenebilir.Azure Vision çok modüllü ekleme becerisi, girişe göre (metin ve görüntü) ayırt edilen aynı beceri türünü kullanarak hem metin hem de görsel verilerin eklenmesine olanak tanır. Daha fazla bilgi için bkz. Azure Vision çok modüllü ekleme becerisi.
Dizin oluşturucu oluşturma ve çalıştırma
Dizin Oluşturucu Oluştur, arama hizmetinizde bir dizin oluşturucu oluşturur. Dizin oluşturucu veri kaynağına bağlanır, verileri yükler, beceri kümesi çalıştırır ve zenginleştirilmiş verilerin dizinini oluşturur.
### Create and run an indexer
POST {{searchUrl}}/indexers?api-version=2025-11-01-preview HTTP/1.1
Content-Type: application/json
api-key: {{searchApiKey}}
{
"name": "doc-extraction-multimodal-embedding-indexer",
"dataSourceName": "doc-extraction-multimodal-embedding-ds",
"targetIndexName": "doc-extraction-multimodal-embedding-index",
"skillsetName": "doc-extraction-multimodal-embedding-skillset",
"parameters": {
"maxFailedItems": -1,
"maxFailedItemsPerBatch": 0,
"batchSize": 1,
"configuration": {
"allowSkillsetToReadFileData": true
}
},
"fieldMappings": [
{
"sourceFieldName": "metadata_storage_name",
"targetFieldName": "document_title"
}
],
"outputFieldMappings": []
}
Sorgu çalıştırma
İlk belge yüklenir yüklenmez aramaya başlayabilirsiniz.
### Query the index
POST {{searchUrl}}/indexes/doc-extraction-multimodal-embedding-index/docs/search?api-version=2025-11-01-preview HTTP/1.1
Content-Type: application/json
api-key: {{searchApiKey}}
{
"search": "*",
"count": true
}
İsteği gönderin. Bu, dizinde alınabilir olarak işaretlenmiş tüm alanları ve belge sayısını döndüren, belirtilmemiş bir tam metin arama sorgusudur. Yanıt şöyle görünmelidir:
HTTP/1.1 200 OK
Transfer-Encoding: chunked
Content-Type: application/json; odata.metadata=minimal; odata.streaming=true; charset=utf-8
Content-Encoding: gzip
Vary: Accept-Encoding
Server: Microsoft-IIS/10.0
Strict-Transport-Security: max-age=2592000, max-age=15724800; includeSubDomains
Preference-Applied: odata.include-annotations="*"
OData-Version: 4.0
request-id: 712ca003-9493-40f8-a15e-cf719734a805
elapsed-time: 198
Date: Wed, 30 Apr 2025 23:20:53 GMT
Connection: close
{
"@odata.count": 100,
"@search.nextPageParameters": {
"search": "*",
"count": true,
"skip": 50
},
"value": [
],
"@odata.nextLink": "https://<YOUR-SEARCH-SERVICE-NAME>.search.windows.net/indexes/doc-extraction-multimodal-embedding-index/docs/search?api-version=2025-11-01-preview "
}
Yanıt olarak 100 belge iade edilir.
Filtreler için Mantıksal işleçleri (ve veya değil) ve karşılaştırma işleçlerini (eq, ne, gt, lt, ge, le) de kullanabilirsiniz. Dize karşılaştırmaları büyük/küçük harfe duyarlıdır. Daha fazla bilgi ve örnek için bkz. Basit arama sorguları örnekleri.
Note
$filter parametresi yalnızca dizin oluşturma sırasında filtrelenebilir olarak işaretlenmiş alanlarda çalışır.
### Query for only images
POST {{searchUrl}}/indexes/doc-extraction-multimodal-embedding-index/docs/search?api-version=2025-11-01-preview HTTP/1.1
Content-Type: application/json
api-key: {{searchApiKey}}
{
"search": "*",
"count": true,
"filter": "image_document_id ne null"
}
### Query for text or images with content related to energy, returning the id, parent document, and text (only populated for text chunks), and the content path where the image is saved in the knowledge store (only populated for images)
POST {{searchUrl}}/indexes/doc-extraction-multimodal-embedding-index/docs/search?api-version=2025-11-01-preview HTTP/1.1
Content-Type: application/json
api-key: {{searchApiKey}}
{
"search": "energy",
"count": true,
"select": "content_id, document_title, content_text, content_path"
}
Sıfırla ve yeniden çalıştır
Indeksleyiciler, tam bir yeniden çalıştırma sağlamak için yüksek seviye işaretini temizleyecek şekilde sıfırlanabilir. Aşağıdaki POST istekleri sıfırlamaya yöneliktir ve ardından yeniden çalıştırılır.
### Reset the indexer
POST {{searchUrl}}/indexers/doc-extraction-multimodal-embedding-indexer/reset?api-version=2025-11-01-preview HTTP/1.1
api-key: {{searchApiKey}}
### Run the indexer
POST {{searchUrl}}/indexers/doc-extraction-multimodal-embedding-indexer/run?api-version=2025-11-01-preview HTTP/1.1
api-key: {{searchApiKey}}
### Check indexer status
GET {{searchUrl}}/indexers/doc-extraction-multimodal-embedding-indexer/status?api-version=2025-11-01-preview HTTP/1.1
api-key: {{searchApiKey}}
Kaynakları temizle
Kendi aboneliğinizde çalışırken, bir projenin sonunda artık ihtiyacınız olmayan kaynakları kaldırmak iyi bir fikirdir. Çalışır durumda bırakılan kaynaklar sana pahalıya mal olabilir. Kaynakları tek tek silebilir veya kaynak grubunu silip kaynak kümesinin tamamını silebilirsiniz.
Dizinleri, dizin oluşturucuları ve veri kaynaklarını silmek için Azure portalını kullanabilirsiniz.
Ayrıca bakınız
Artık çok modlu dizin oluşturma senaryosunun örnek uygulaması hakkında bilgi sahibi olduğunuz için bkz: