Indexers - Get
Ruft eine Indexerdefinition ab.
GET {endpoint}/indexers('{indexerName}')?api-version=2023-11-01
URI-Parameter
Name | In | Erforderlich | Typ | Beschreibung |
---|---|---|---|---|
endpoint
|
path | True |
string |
Die Endpunkt-URL des Suchdiensts. |
indexer
|
path | True |
string |
Der Name des abzurufenden Indexers. |
api-version
|
query | True |
string |
Client-API-Version. |
Anforderungsheader
Name | Erforderlich | Typ | Beschreibung |
---|---|---|---|
x-ms-client-request-id |
string uuid |
Die Verfolgungs-ID, die mit der Anforderung gesendet wurde, um beim Debuggen zu helfen. |
Antworten
Name | Typ | Beschreibung |
---|---|---|
200 OK | ||
Other Status Codes |
Fehlerantwort. |
Beispiele
SearchServiceGetIndexer
Beispielanforderung
GET https://myservice.search.windows.net/indexers('myindexer')?api-version=2023-11-01
Beispiel für eine Antwort
{
"name": "myindexer",
"description": "a cool indexer",
"dataSourceName": "mydatasource",
"targetIndexName": "orders",
"schedule": {
"interval": "PT1H",
"startTime": "2015-01-01T00:00:00Z"
},
"parameters": {
"maxFailedItems": 10,
"maxFailedItemsPerBatch": 5
},
"fieldMappings": [],
"disabled": false,
"encryptionKey": {
"keyVaultKeyName": "myKeyName",
"keyVaultKeyVersion": "myKeyVersion",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": {
"applicationId": "00000000-0000-0000-0000-000000000000",
"applicationSecret": null
}
}
}
Definitionen
Name | Beschreibung |
---|---|
Azure |
Anmeldeinformationen einer registrierten Anwendung, die für Ihren Suchdienst erstellt wurde und für den authentifizierten Zugriff auf die in Azure Key Vault gespeicherten Verschlüsselungsschlüssel verwendet wird. |
Blob |
Gibt die Daten an, die aus Azure Blob Storage extrahiert werden sollen, und teilt dem Indexer mit, welche Daten aus Bildinhalten extrahiert werden sollen, wenn "imageAction" auf einen anderen Wert als "none" festgelegt ist. Dies gilt für eingebettete Bildinhalte in einem .PDF oder einer anderen Anwendung oder Bilddateien wie .jpg und .png in Azure-Blobs. |
Blob |
Bestimmt, wie eingebettete Bilder und Bilddateien in Azure Blob Storage verarbeitet werden. Wenn Sie die "imageAction"-Konfiguration auf einen anderen Wert als "none" festlegen, muss auch ein Skillset an diesen Indexer angefügt werden. |
Blob |
Stellt den Analysemodus für die Indizierung aus einer Azure-Blobdatenquelle dar. |
Blob |
Bestimmt den Algorithmus für die Textextraktion aus PDF-Dateien in Azure Blob Storage. |
Field |
Definiert eine Zuordnung zwischen einem Feld in einer Datenquelle und einem Zielfeld in einem Index. |
Field |
Stellt eine Funktion dar, die einen Wert aus einer Datenquelle vor der Indizierung transformiert. |
Indexer |
Gibt die Umgebung an, in der der Indexer ausgeführt werden soll. |
Indexing |
Stellt die Parameter für die Indexerausführung dar. |
Indexing |
Ein Wörterbuch mit indexerspezifischen Konfigurationseigenschaften. Jeder Name ist der Name einer bestimmten Eigenschaft. Jeder Wert muss einen primitiven Typ aufweisen. |
Indexing |
Stellt einen Zeitplan für die Indexerausführung dar. |
Search |
Beschreibt eine Fehlerbedingung für die API. |
Search |
Stellt einen Indexer dar. |
Search |
Ein kundenseitig verwalteter Verschlüsselungsschlüssel in Azure Key Vault. Schlüssel, die Sie erstellen und verwalten, können zum Verschlüsseln oder Entschlüsseln ruhender Daten in Ihrem Suchdienst verwendet werden, z. B. Indizes und Synonymzuordnungen. |
AzureActiveDirectoryApplicationCredentials
Anmeldeinformationen einer registrierten Anwendung, die für Ihren Suchdienst erstellt wurde und für den authentifizierten Zugriff auf die in Azure Key Vault gespeicherten Verschlüsselungsschlüssel verwendet wird.
Name | Typ | Beschreibung |
---|---|---|
applicationId |
string |
Eine AAD-Anwendungs-ID, der die erforderlichen Zugriffsberechtigungen für die Azure-Key Vault erteilt wurden, die beim Verschlüsseln ruhender Daten verwendet werden sollen. Die Anwendungs-ID sollte nicht mit der Objekt-ID für Ihre AAD-Anwendung verwechselt werden. |
applicationSecret |
string |
Der Authentifizierungsschlüssel der angegebenen AAD-Anwendung. |
BlobIndexerDataToExtract
Gibt die Daten an, die aus Azure Blob Storage extrahiert werden sollen, und teilt dem Indexer mit, welche Daten aus Bildinhalten extrahiert werden sollen, wenn "imageAction" auf einen anderen Wert als "none" festgelegt ist. Dies gilt für eingebettete Bildinhalte in einem .PDF oder einer anderen Anwendung oder Bilddateien wie .jpg und .png in Azure-Blobs.
Name | Typ | Beschreibung |
---|---|---|
allMetadata |
string |
Extrahiert Metadaten, die vom Azure Blob Storage-Subsystem bereitgestellt werden, und die inhaltstypspezifischen Metadaten (z. B. Metadaten, die nur für .png Dateien indiziert werden). |
contentAndMetadata |
string |
Extrahiert alle Metadaten und Textinhalte aus jedem Blob. |
storageMetadata |
string |
Indiziert nur die Standardblobeigenschaften und vom Benutzer angegebenen Metadaten. |
BlobIndexerImageAction
Bestimmt, wie eingebettete Bilder und Bilddateien in Azure Blob Storage verarbeitet werden. Wenn Sie die "imageAction"-Konfiguration auf einen anderen Wert als "none" festlegen, muss auch ein Skillset an diesen Indexer angefügt werden.
Name | Typ | Beschreibung |
---|---|---|
generateNormalizedImagePerPage |
string |
Extrahiert Text aus Bildern (z. B. das Wort "STOP" aus einem Verkehrsstoppschild) und bettet ihn in das Inhaltsfeld ein, behandelt PDF-Dateien jedoch anders, da jede Seite als Bild gerendert und entsprechend normalisiert wird, anstatt eingebettete Bilder zu extrahieren. Nicht-PDF-Dateitypen werden genauso behandelt, als ob "generateNormalizedImages" festgelegt wurde. |
generateNormalizedImages |
string |
Extrahiert Text aus Bildern (z. B. das Wort "STOP" aus einem Verkehrsstoppzeichen) und bettet ihn in das Inhaltsfeld ein. Diese Aktion erfordert, dass "dataToExtract" auf "contentAndMetadata" festgelegt ist. Ein normalisiertes Bild bezieht sich auf eine zusätzliche Verarbeitung, die zu einer einheitlichen Bildausgabe führt, die größe und gedreht wird, um ein konsistentes Rendering zu fördern, wenn Sie Bilder in visuelle Suchergebnisse einschließen. Diese Informationen werden bei Verwendung dieser Option für jedes Bild generiert. |
none |
string |
Ignoriert eingebettete Bilder oder Bilddateien im Dataset. Dies ist die Standardoption. |
BlobIndexerParsingMode
Stellt den Analysemodus für die Indizierung aus einer Azure-Blobdatenquelle dar.
Name | Typ | Beschreibung |
---|---|---|
default |
string |
Für die normale Dateiverarbeitung wird der Standardwert festgelegt. |
delimitedText |
string |
Legen Sie auf delimitedText fest, wenn Blobs einfache CSV-Dateien sind. |
json |
string |
Legen Sie auf JSON fest, um strukturierte Inhalte aus JSON-Dateien zu extrahieren. |
jsonArray |
string |
Legen Sie auf jsonArray fest, um einzelne Elemente eines JSON-Arrays als separate Dokumente zu extrahieren. |
jsonLines |
string |
Legen Sie diese Einstellung auf jsonLines fest, um einzelne JSON-Entitäten, getrennt durch eine neue Zeile, als separate Dokumente zu extrahieren. |
text |
string |
Legen Sie auf Text fest, um die Indizierungsleistung für Nur-Text-Dateien im Blobspeicher zu verbessern. |
BlobIndexerPDFTextRotationAlgorithm
Bestimmt den Algorithmus für die Textextraktion aus PDF-Dateien in Azure Blob Storage.
Name | Typ | Beschreibung |
---|---|---|
detectAngles |
string |
Kann bessere und besser lesbare Textextraktion aus PDF-Dateien erzeugen, die gedrehten Text darin enthalten. Beachten Sie, dass die Verwendung dieses Parameters möglicherweise geringfügige Auswirkungen auf die Leistungsgeschwindigkeit hat. Dieser Parameter gilt nur für PDF-Dateien und nur für PDF-Dateien mit eingebettetem Text. Wenn der gedrehte Text in einem eingebetteten Bild in der PDF-Datei angezeigt wird, gilt dieser Parameter nicht. |
none |
string |
Nutzt die normale Textextraktion. Dies ist die Standardoption. |
FieldMapping
Definiert eine Zuordnung zwischen einem Feld in einer Datenquelle und einem Zielfeld in einem Index.
Name | Typ | Beschreibung |
---|---|---|
mappingFunction |
Eine Funktion, die vor der Indizierung auf jeden Quellfeldwert angewendet werden soll. |
|
sourceFieldName |
string |
Der Name des Felds in der Datenquelle. |
targetFieldName |
string |
Der Name des Zielfelds im Index. Standardmäßig identisch mit dem Namen des Quellfelds. |
FieldMappingFunction
Stellt eine Funktion dar, die einen Wert aus einer Datenquelle vor der Indizierung transformiert.
Name | Typ | Beschreibung |
---|---|---|
name |
string |
Der Name der Feldzuordnungsfunktion. |
parameters |
object |
Ein Wörterbuch von Parameternamen-Wert-Paaren, die an die Funktion übergeben werden sollen. Jeder Wert muss einen primitiven Typ aufweisen. |
IndexerExecutionEnvironment
Gibt die Umgebung an, in der der Indexer ausgeführt werden soll.
Name | Typ | Beschreibung |
---|---|---|
private |
string |
Gibt an, dass der Indexer mit der Umgebung ausgeführt werden soll, die speziell für den Suchdienst bereitgestellt wurde. Dies sollte nur als Ausführungsumgebung angegeben werden, wenn der Indexer über freigegebene Private Link-Ressourcen sicher auf Ressourcen zugreifen muss. |
standard |
string |
Gibt an, dass der Suchdienst bestimmen kann, wo der Indexer ausgeführt werden soll. Dies ist die Standardumgebung, wenn nichts angegeben ist, und der empfohlene Wert. |
IndexingParameters
Stellt die Parameter für die Indexerausführung dar.
Name | Typ | Standardwert | Beschreibung |
---|---|---|---|
batchSize |
integer |
Die Anzahl der Elemente, die aus der Datenquelle gelesen und als einzelner Batch indiziert werden, um die Leistung zu verbessern. Die Standardeinstellung hängt vom Datenquellentyp ab. |
|
configuration |
Ein Wörterbuch mit indexerspezifischen Konfigurationseigenschaften. Jeder Name ist der Name einer bestimmten Eigenschaft. Jeder Wert muss einen primitiven Typ aufweisen. |
||
maxFailedItems |
integer |
0 |
Die maximale Anzahl von Elementen, bei denen die Indizierung fehlschlagen kann, damit die Indexerausführung weiterhin als erfolgreich angesehen wird. Der Wert "-1" bedeutet, dass es keine Begrenzung gibt. Standard ist "0". |
maxFailedItemsPerBatch |
integer |
0 |
Die maximale Anzahl von Elementen in einem einzelnen Batch, die bei der Indizierung fehlschlagen können, damit der Batch weiterhin als erfolgreich betrachtet wird. Der Wert "-1" bedeutet, dass es keine Begrenzung gibt. Standard ist "0". |
IndexingParametersConfiguration
Ein Wörterbuch mit indexerspezifischen Konfigurationseigenschaften. Jeder Name ist der Name einer bestimmten Eigenschaft. Jeder Wert muss einen primitiven Typ aufweisen.
Name | Typ | Standardwert | Beschreibung |
---|---|---|---|
allowSkillsetToReadFileData |
boolean |
False |
Wenn true, wird ein Pfad //document//file_data erstellt, bei dem es sich um ein Objekt handelt, das die ursprünglichen Dateidaten darstellt, die aus Der Blobdatenquelle heruntergeladen wurden. Dadurch können Sie die ursprünglichen Dateidaten an einen benutzerdefinierten Skill zur Verarbeitung innerhalb der Anreicherungspipeline oder an den Skill Dokumentextraktion übergeben. |
dataToExtract | contentAndMetadata |
Gibt die Daten an, die aus Azure Blob Storage extrahiert werden sollen, und teilt dem Indexer mit, welche Daten aus Bildinhalten extrahiert werden sollen, wenn "imageAction" auf einen anderen Wert als "none" festgelegt ist. Dies gilt für eingebettete Bildinhalte in einem .PDF oder einer anderen Anwendung oder Bilddateien wie .jpg und .png in Azure-Blobs. |
|
delimitedTextDelimiter |
string |
Gibt für CSV-Blobs das Zeilenendetrennzeichen für CSV-Dateien an, bei denen jede Zeile ein neues Dokument beginnt (z. B. "|"). |
|
delimitedTextHeaders |
string |
Gibt für CSV-Blobs eine durch Trennzeichen getrennte Liste von Spaltenüberschriften an, die zum Zuordnen von Quellfeldern zu Zielfeldern in einem Index nützlich ist. |
|
documentRoot |
string |
Bei JSON-Arrays können Sie bei einem strukturierten oder teilweise strukturierten Dokument mithilfe dieser Eigenschaft einen Pfad zum Array angeben. |
|
excludedFileNameExtensions |
string |
Durch Trennzeichen getrennte Liste der Dateinamenerweiterungen, die bei der Verarbeitung aus Azure Blob Storage ignoriert werden sollen. Sie können beispielsweise ".png, .mp4" ausschließen, um diese Dateien während der Indizierung zu überspringen. |
|
executionEnvironment | standard |
Gibt die Umgebung an, in der der Indexer ausgeführt werden soll. |
|
failOnUnprocessableDocument |
boolean |
False |
Legen Sie für Azure-Blobs auf false fest, wenn Sie die Indizierung fortsetzen möchten, wenn die Indizierung eines Dokuments fehlschlägt. |
failOnUnsupportedContentType |
boolean |
False |
Legen Sie für Azure-Blobs auf false fest, wenn Sie die Indizierung fortsetzen möchten, wenn ein nicht unterstützter Inhaltstyp gefunden wird, und Sie nicht alle Inhaltstypen (Dateierweiterungen) im Voraus kennen. |
firstLineContainsHeaders |
boolean |
True |
Gibt für CSV-Blobs an, dass die erste (nicht leere) Zeile jedes Blobs Header enthält. |
imageAction | none |
Bestimmt, wie eingebettete Bilder und Bilddateien in Azure Blob Storage verarbeitet werden. Wenn Sie die "imageAction"-Konfiguration auf einen anderen Wert als "none" festlegen, muss auch ein Skillset an diesen Indexer angefügt werden. |
|
indexStorageMetadataOnlyForOversizedDocuments |
boolean |
False |
Legen Sie diese Eigenschaft für Azure-Blobs auf true fest, um weiterhin Speichermetadaten für Blobinhalte zu indizieren, die für die Verarbeitung zu groß sind. Zu große Blobs werden standardmäßig als Fehler behandelt. Informationen zu Grenzwerten für die Blobgröße finden Sie unter https://docs.microsoft.com/azure/search/search-limits-quotas-capacity. |
indexedFileNameExtensions |
string |
Durch Trennzeichen getrennte Liste der Dateinamenerweiterungen, die bei der Verarbeitung aus Azure Blob Storage ausgewählt werden sollen. Beispielsweise können Sie die Indizierung auf spezifische Anwendungsdateien wie „.docx, .pptx, .msg“ beschränken, um diese Dateitypen explizit einzubeziehen. |
|
parsingMode | default |
Stellt den Analysemodus für die Indizierung aus einer Azure-Blobdatenquelle dar. |
|
pdfTextRotationAlgorithm | none |
Bestimmt den Algorithmus für die Textextraktion aus PDF-Dateien in Azure Blob Storage. |
|
queryTimeout |
string |
00:05:00 |
Erhöht das Timeout über den Standardwert von 5 Minuten für Azure SQL Datenbankdatenquellen, die im Format "hh:mm:ss" angegeben sind. |
IndexingSchedule
Stellt einen Zeitplan für die Indexerausführung dar.
Name | Typ | Beschreibung |
---|---|---|
interval |
string |
Das Zeitintervall zwischen Indexerausführungen. |
startTime |
string |
Der Zeitpunkt, zu dem ein Indexer ausgeführt werden soll. |
SearchError
Beschreibt eine Fehlerbedingung für die API.
Name | Typ | Beschreibung |
---|---|---|
code |
string |
Einer von einem serverdefiniertem Satz von Fehlercodes. |
details |
Ein Array von Details zu bestimmten Fehlern, die zu diesem gemeldeten Fehler geführt haben. |
|
message |
string |
Eine lesbare Darstellung des Fehlers. |
SearchIndexer
Stellt einen Indexer dar.
Name | Typ | Standardwert | Beschreibung |
---|---|---|---|
@odata.etag |
string |
Das ETag des Indexers. |
|
dataSourceName |
string |
Der Name der Datenquelle, aus der dieser Indexer Daten liest. |
|
description |
string |
Die Beschreibung des Indexers. |
|
disabled |
boolean |
False |
Ein Wert, der angibt, ob der Indexer deaktiviert ist. Der Standardwert ist "false". |
encryptionKey |
Eine Beschreibung eines Verschlüsselungsschlüssels, den Sie in Azure Key Vault erstellen. Dieser Schlüssel wird verwendet, um eine zusätzliche Ebene der Verschlüsselung ruhender Daten für Ihre Indexerdefinition (sowie für die Indexerausführung status) bereitzustellen, wenn Sie sicher sein möchten, dass niemand, nicht einmal Microsoft, sie entschlüsseln kann. Nachdem Sie Ihre Indexerdefinition verschlüsselt haben, bleibt sie immer verschlüsselt. Der Suchdienst ignoriert Versuche, diese Eigenschaft auf NULL festzulegen. Sie können diese Eigenschaft bei Bedarf ändern, wenn Sie Ihren Verschlüsselungsschlüssel rotieren möchten. Ihre Indexerdefinition (und die Indexerausführung status) ist nicht betroffen. Die Verschlüsselung mit kundenseitig verwalteten Schlüsseln ist für kostenlose Suchdienste nicht verfügbar und nur für kostenpflichtige Dienste verfügbar, die am oder nach dem 1. Januar 2019 erstellt wurden. |
||
fieldMappings |
Definiert Zuordnungen zwischen Feldern in der Datenquelle und den entsprechenden Zielfeldern im Index. |
||
name |
string |
Der Name des Indexers. |
|
outputFieldMappings |
Ausgabefeldzuordnungen werden nach der Anreicherung und unmittelbar vor der Indizierung angewendet. |
||
parameters |
Parameter für die Indexerausführung. |
||
schedule |
Der Zeitplan für diesen Indexer. |
||
skillsetName |
string |
Der Name des Skillsets, das mit diesem Indexer ausgeführt wird. |
|
targetIndexName |
string |
Der Name des Indexes, in den dieser Indexer Daten schreibt. |
SearchResourceEncryptionKey
Ein kundenseitig verwalteter Verschlüsselungsschlüssel in Azure Key Vault. Schlüssel, die Sie erstellen und verwalten, können zum Verschlüsseln oder Entschlüsseln ruhender Daten in Ihrem Suchdienst verwendet werden, z. B. Indizes und Synonymzuordnungen.
Name | Typ | Beschreibung |
---|---|---|
accessCredentials |
Optionale Azure Active Directory-Anmeldeinformationen, die für den Zugriff auf Ihre Azure Key Vault verwendet werden. Nicht erforderlich, wenn stattdessen eine verwaltete Identität verwendet wird. |
|
keyVaultKeyName |
string |
Der Name Ihres Azure Key Vault Schlüssel, der zum Verschlüsseln ruhender Daten verwendet werden soll. |
keyVaultKeyVersion |
string |
Die Version Ihres Azure Key Vault Schlüssels, der zum Verschlüsseln ruhender Daten verwendet werden soll. |
keyVaultUri |
string |
Der URI Ihres Azure-Key Vault, auch als DNS-Name bezeichnet, der den Schlüssel enthält, der zum Verschlüsseln ruhender Daten verwendet werden soll. Ein Beispiel-URI kann sein |