Indexar dados de bibliotecas de documentos do SharePoint

2025-06-18

Importante

O suporte ao indexador do SharePoint Online está em visualização pública. É oferecido "no estado em que se encontra", de acordo com os Termos de Utilização Suplementares e suportado apenas no melhor esforço. Os recursos de visualização não são recomendados para cargas de trabalho de produção e não é garantido que estejam disponíveis ao público.

Consulte a secção de limitações conhecidas antes de começar.

Preencha este formulário para se registar na pré-visualização. Todos os pedidos são aprovados automaticamente. Depois de preencher o formulário, use uma API REST de visualização para indexar seu conteúdo.

Este artigo explica como configurar um indexador de pesquisa para indexar documentos armazenados em bibliotecas de documentos do SharePoint para pesquisa de texto completo no Azure AI Search. As etapas de configuração são as primeiras, seguidas por comportamentos e cenários

No Azure AI Search, um indexador extrai dados pesquisáveis e metadados de uma fonte de dados. O indexador do SharePoint Online se conecta ao seu site do SharePoint e indexa documentos de uma ou mais bibliotecas de documentos. O indexador fornece a seguinte funcionalidade:

Indexa arquivos e metadados de uma ou mais bibliotecas de documentos.
Indexa de forma incremental, pegando apenas os arquivos e metadados novos e alterados.
Deteta conteúdo excluído automaticamente. A exclusão de documentos na biblioteca é retomada na próxima execução do indexador e o documento de pesquisa correspondente é removido do índice.
Extrai texto e imagens normalizadas de documentos indexados automaticamente. Opcionalmente, você pode adicionar um conjunto de habilidades para um enriquecimento mais profundo da IA, como OCR ou tradução de texto.

Pré-requisitos

Azure AI Search, nível de preços básico ou superior.
SharePoint no serviço de nuvem Microsoft 365 (o OneDrive não é uma fonte de dados suportada).
Arquivos em uma biblioteca de documentos.

Formatos de documento suportados

O indexador do SharePoint Online pode extrair texto dos seguintes formatos de documento:

CSV (consulte Indexação de blobs CSV)
EML
EPUB
GZ
HTML
JSON (consulte Indexação de blobs JSON)
KML (XML para representações geográficas)
Formatos do Microsoft Office: DOCX/DOC/DOCM, XLSX/XLS/XLSM, PPTX/PPT/PPTM, MSG (e-mails do Outlook), XML (XML WORD de 2003 e 2006)
Formatos de documentos abertos: ODT, ODS, ODP
PDF
Arquivos de texto sem formatação (consulte também Indexação de texto sem formatação)
RTF
XML
CEP

Limitações e considerações

Aqui estão as limitações desse recurso:

O indexador pode indexar conteúdo de formatos de documentos suportados em uma biblioteca de documentos. Não há suporte de indexador para Listas do SharePoint, conteúdo de sites .ASPX, ou ficheiros de blocos de notas do OneNote. Além disso, não há suporte para indexação recursiva de subsites de um site específico.
Limitações de indexação incremental:
- Renomear uma pasta do SharePoint interrompe a indexação incremental. Uma pasta renomeada é tratada como novo conteúdo.
- Os processos do Microsoft 365 que atualizam os metadados do sistema de arquivos do SharePoint podem disparar a indexação incremental, mesmo que não haja outras alterações no conteúdo. Certifique-se de testar sua configuração e entender a contagem de processamento de documentos antes de usar o indexador e qualquer enriquecimento de IA.
Limitações de segurança:
- Não há suporte para ponto de extremidade privado.
- Não há suporte para bibliotecas de documentos ou conteúdo configurado para Acesso Condicional do Microsoft Entra ID.
- Não há suporte para ficheiros encriptados pelo utilizador, ficheiros protegidos por Gestão de Direitos de Informação (IRM), ficheiros ZIP com palavras-passe ou conteúdo encriptado semelhante não é suportado.
- Não há suporte para o modelo de autorização granular do SharePoint que determina o acesso por usuário no nível do documento. O indexador não puxa essas permissões para o índice. O conteúdo está disponível para qualquer pessoa que tenha acesso de leitura ao índice. Se você precisar de permissões no nível do documento, considere filtros de segurança para cortar os resultados e automatizar a cópia das permissões em um nível de arquivo para um campo no índice.

Aqui estão algumas considerações ao usar esse recurso:

Se você precisar criar um aplicativo Copilot ou RAG (Retrieval Augmented Generation) personalizado para conversar com dados do SharePoint, a Microsoft recomenda usar o Microsoft Copilot Studio em vez desse recurso de visualização.
Se você ainda precisar de uma solução personalizada de indexação de conteúdo do SharePoint Online usando o Azure AI Search em um ambiente de produção, apesar da recomendação de usar o Microsoft Copilot Studio, considere:
- Criar um conector personalizado com Webhooks do SharePoint, chamar a API do Microsoft Graph para exportar os dados para um contenedor de Blob do Azure e, em seguida, usar o indexador de blob do Azure para a indexação incremental.
- Criar seu próprio fluxo de trabalho de Aplicativos Lógicos do Azure usando o conector do SharePoint dos Aplicativos Lógicos do Azure e o conector de Pesquisa de IA do Azure ao alcançar a Disponibilidade Geral. Você pode usar o fluxo de trabalho gerado pelo assistente do portal do Azure como um ponto de partida e, em seguida, personalizá-lo no designer de Aplicativos Lógicos do Azure para incluir as etapas de transformação necessárias. O fluxo de trabalho do Aplicativo Lógico do Azure criado ao usar o assistente de Pesquisa de IA do Azure para indexar dados do SharePoint Online é um fluxo de trabalho de consumo. Se você estiver configurando cargas de trabalho de produção, certifique-se de alternar para um fluxo de trabalho de aplicativo lógico padrão e aproveite seus recursos empresariais adicionais.
Independentemente da abordagem escolhida, seja criando um conector personalizado com ganchos do SharePoint ou criando um fluxo de trabalho de Aplicativos Lógicos do Azure, certifique-se de implementar medidas de segurança robustas. Essas medidas incluem configurar links privados compartilhados, configurar firewalls, preservar as permissões do usuário da fonte e honrar essas permissões no momento da consulta, entre outras. Você também deve auditar e monitorizar regularmente a sua linha de produção.

Configurar o indexador do SharePoint Online

Para configurar o indexador do SharePoint Online, use uma API REST de visualização. Esta seção fornece as etapas.

Etapa 1 (opcional): Habilitar a identidade gerenciada atribuída ao sistema

Habilite uma identidade gerenciada atribuída ao sistema para detetar automaticamente o locatário no qual o serviço de pesquisa é provisionado.

Execute esta etapa se o site do SharePoint estiver no mesmo locatário que o serviço de pesquisa. Ignore esta etapa se o site do SharePoint estiver em um locatário diferente. A identidade não é usada para indexação, apenas deteção de locatário. Você também pode ignorar esta etapa se quiser colocar a ID do locatário na cadeia de conexão.

Depois de selecionar Salvar, você obtém uma ID de objeto que foi atribuída ao seu serviço de pesquisa.

Etapa 2: Decidir quais permissões o indexador requer

O indexador do SharePoint Online oferece suporte a permissões delegadas e de aplicativo . Escolha quais permissões você deseja usar com base no seu cenário.

Recomendamos permissões baseadas em aplicativos. Consulte as limitações para problemas conhecidos relacionados a permissões delegadas.

Permissões de aplicativo (recomendado), onde o indexador é executado sob a identidade do locatário do SharePoint com acesso a todos os sites e arquivos. O indexador requer um segredo do cliente. O indexador também exigirá a aprovação do administrador do locatário antes de poder indexar qualquer conteúdo.
Permissões delegadas, em que o indexador é executado sob a identidade do usuário ou aplicativo que envia a solicitação. O acesso aos dados é limitado aos sites e arquivos aos quais o chamador tem acesso. Para oferecer suporte a permissões delegadas, o indexador requer um prompt de código de dispositivo para entrar em nome do usuário. As permissões delegadas pelo usuário impõem a expiração do token a cada 75 minutos, de acordo com as bibliotecas de segurança mais recentes usadas para implementar esse tipo de autenticação. Este não é um comportamento que possa ser ajustado. Um token expirado requer indexação manual usando Run Indexer (visualização). Por esse motivo, você deve usar permissões baseadas em aplicativos.

Etapa 3: Criar um registro de aplicativo Microsoft Entra

O indexador do SharePoint Online usa um aplicativo Microsoft Entra para autenticação. Crie o registro do aplicativo no mesmo locatário que o Azure AI Search.

Inicie sessão no portal do Azure.
Procure ou navegue até Microsoft Entra ID e, em seguida, selecione Adicionar>registos de aplicações.
Selecione + Novo registo:
1. Forneça um nome para seu aplicativo.
2. Selecione Locatário único.
3. Ignore a etapa de designação do URI. Nenhum URI de redirecionamento necessário.
4. Selecione Registar.
No painel de navegação, em Gerenciar, selecione Permissões de API, Adicionar uma permissão e Microsoft Graph.
- Se o indexador estiver usando permissões de API de aplicativo, selecione Permissões de aplicativo e adicione o seguinte:
  - Aplicação - Files.Read.All
  - Aplicação - Sites.Read.All
  Usar permissões de aplicativo significa que o indexador acessa o site do SharePoint em um contexto de serviço. Assim, quando você executar o indexador, ele terá acesso a todo o conteúdo no locatário do SharePoint, o que requer aprovação do administrador do locatário. Um segredo do cliente também é necessário para autenticação. A configuração do segredo do cliente é descrita mais adiante neste artigo.
- Se o indexador estiver usando permissões de API delegadas, selecione Permissões delegadas e adicione o seguinte:
  - Delegado - Files.Read.All
  - Delegado - Sites.Read.All
  - Delegado - User.Read
  As permissões delegadas permitem que o cliente de pesquisa se conecte ao SharePoint sob a identidade de segurança do usuário atual.
Dê consentimento ao administrador.

O consentimento do administrador do locatário é necessário ao usar permissões da API do aplicativo. Alguns locatários são bloqueados de tal forma que o consentimento do administrador do locatário também é necessário para permissões de API delegadas. Se qualquer uma dessas condições se aplicar, você precisará ter um administrador de locatário concedendo consentimento para este aplicativo Microsoft Entra antes de criar o indexador.
Selecione a guia Autenticação .
Defina Permitir fluxos de clientes públicos como Sim e selecione Salvar.
Selecione + Adicionar uma plataforma, depois Aplicações móveis e de ambiente de trabalho, depois selecione https://login.microsoftonline.com/common/oauth2/nativecliente, em seguida , Configurar.
(Somente permissões da API do aplicativo) Para autenticar no aplicativo Microsoft Entra usando permissões de aplicativo, o indexador requer um segredo do cliente.
- Selecione Certificados & Segredos no menu à esquerda, depois Segredos do cliente e, em seguida, Novo segredo do cliente.
- No menu que aparece, insira uma descrição para o novo segredo do cliente. Se necessário, ajuste a data de validade. Se o segredo expirar, ele precisa ser recriado e o indexador precisa ser atualizado com o novo segredo.
- O novo segredo do cliente aparece na lista secreta. Depois de navegar para fora da página, o segredo não é mais estar visível, então copie-o usando o botão de cópia e salve-o em um local seguro.

Etapa 4: Criar fonte de dados

A partir desta seção, use uma API REST de visualização para as etapas restantes. Recomendamos a API de visualização mais recente.

Uma fonte de dados especifica quais dados indexar, credenciais e políticas para identificar com eficiência as alterações nos dados (linhas novas, modificadas ou excluídas). Uma fonte de dados pode ser usada por vários indexadores no mesmo serviço de pesquisa.

Para indexação do SharePoint, a fonte de dados deve ter as seguintes propriedades necessárias:

name é o nome exclusivo da fonte de dados dentro do seu serviço de pesquisa.
O tipo deve ser "sharepoint". Esse valor diferencia maiúsculas de minúsculas.
as credenciais fornecem o ponto de extremidade do SharePoint e a ID do aplicativo (cliente) do Microsoft Entra. Um exemplo de ponto de extremidade do SharePoint é https://microsoft.sharepoint.com/teams/MySharePointSite. Você pode obter o ponto de extremidade navegando até a home page do seu site do SharePoint e copiando a URL do navegador.
container especifica qual biblioteca de documentos indexar. As propriedades controlam quais documentos são indexados.

Para criar uma fonte de dados, chame Criar fonte de dados (visualização).

POST https://[service name].search.windows.net/datasources?api-version=2025-05-01-preview
Content-Type: application/json
api-key: [admin key]

{
    "name" : "sharepoint-datasource",
    "type" : "sharepoint",
    "credentials" : { "connectionString" : "[connection-string]" },
    "container" : { "name" : "defaultSiteLibrary", "query" : null }
}

Formato da cadeia de conexão

O formato da cadeia de conexão muda com base no fato de o indexador estar usando permissões de API delegadas ou permissões de API de aplicativo

Formato de cadeia de conexão de permissões de API delegadas

SharePointOnlineEndpoint=[SharePoint site url];ApplicationId=[Azure AD App ID];TenantId=[SharePoint site tenant id]
Formato de cadeia de conexão de permissões da API do aplicativo

SharePointOnlineEndpoint=[SharePoint site url];ApplicationId=[Azure AD App ID];ApplicationSecret=[Azure AD App client secret];TenantId=[SharePoint site tenant id]

Nota

Se o site do SharePoint estiver no mesmo locatário que o serviço de pesquisa e a identidade gerenciada atribuída ao sistema estiver habilitada, TenantId não precisará ser incluída na cadeia de conexão. Se o site do SharePoint estiver em um locatário diferente do serviço de pesquisa, TenantId deverá ser incluído.

Etapa 5: Criar um índice

O índice especifica os campos em um documento, atributos e outras construções que moldam a experiência de pesquisa.

Para criar um índice, chame Criar índice (visualização):

POST https://[service name].search.windows.net/indexes?api-version=2025-05-01-preview
Content-Type: application/json
api-key: [admin key]

{
    "name" : "sharepoint-index",
    "fields": [
        { "name": "id", "type": "Edm.String", "key": true, "searchable": false },
        { "name": "metadata_spo_item_name", "type": "Edm.String", "key": false, "searchable": true, "filterable": false, "sortable": false, "facetable": false },
        { "name": "metadata_spo_item_path", "type": "Edm.String", "key": false, "searchable": false, "filterable": false, "sortable": false, "facetable": false },
        { "name": "metadata_spo_item_content_type", "type": "Edm.String", "key": false, "searchable": false, "filterable": true, "sortable": false, "facetable": true },
        { "name": "metadata_spo_item_last_modified", "type": "Edm.DateTimeOffset", "key": false, "searchable": false, "filterable": false, "sortable": true, "facetable": false },
        { "name": "metadata_spo_item_size", "type": "Edm.Int64", "key": false, "searchable": false, "filterable": false, "sortable": false, "facetable": false },
        { "name": "content", "type": "Edm.String", "searchable": true, "filterable": false, "sortable": false, "facetable": false }
    ]
}

Importante

Somente metadata_spo_site_library_item_id pode ser usado como o campo chave em um índice preenchido pelo indexador do SharePoint Online. Se um campo chave não existir na fonte de dados, metadata_spo_site_library_item_id será automaticamente mapeado para o campo chave.

Etapa 6: Criar um indexador

Um indexador conecta uma fonte de dados a um índice de pesquisa de destino e fornece uma programação para automatizar a atualização de dados. Depois que o índice e a fonte de dados forem criados, você poderá criar o indexador.

Se você estiver usando permissões delegadas, durante esta etapa, você será solicitado a entrar com credenciais da organização que têm acesso ao site do SharePoint. Se possível, recomendamos criar uma nova conta de usuário organizacional e dar a esse novo usuário as permissões exatas que você deseja que o indexador tenha.

Existem algumas etapas para criar o indexador:

Envie uma solicitação Criar indexador (visualização):

POST https://[service name].search.windows.net/indexers?api-version=2025-05-01-preview
Content-Type: application/json
api-key: [admin key]

{
    "name" : "sharepoint-indexer",
    "dataSourceName" : "sharepoint-datasource",
    "targetIndexName" : "sharepoint-index",
    "parameters": {
    "batchSize": null,
    "maxFailedItems": null,
    "maxFailedItemsPerBatch": null,
    "base64EncodeKeys": null,
    "configuration": {
        "indexedFileNameExtensions" : ".pdf, .docx",
        "excludedFileNameExtensions" : ".png, .jpg",
        "dataToExtract": "contentAndMetadata"
      }
    },
    "schedule" : { },
    "fieldMappings" : [
        { 
          "sourceFieldName" : "metadata_spo_site_library_item_id", 
          "targetFieldName" : "id", 
          "mappingFunction" : { 
            "name" : "base64Encode" 
          } 
         }
    ]
}

Se você estiver usando permissões de aplicativo, é necessário esperar até que a execução inicial seja concluída antes de começar a consultar seu índice. As instruções a seguir fornecidas nesta etapa referem-se especificamente a permissões delegadas e não são aplicáveis a permissões de aplicativos.

Quando você cria o indexador pela primeira vez, a solicitação Criar indexador (visualização) aguarda até que você conclua a próxima etapa. Você deve ligar para Obter status do indexador para obter o link e inserir o código do novo dispositivo.
```
GET https://[service name].search.windows.net/indexers/sharepoint-indexer/status?api-version=2025-05-01-preview
Content-Type: application/json
api-key: [admin key]
```
Se você não executar o Get Indexer Status dentro de 10 minutos, o código expirará e você precisará recriar a fonte de dados.

Copie o código de login do dispositivo da resposta Obter Status do Indexador. O login do dispositivo pode ser encontrado na "errorMessage".

{
    "lastResult": {
        "status": "transientFailure",
        "errorMessage": "To sign in, use a web browser to open the page https://microsoft.com/devicelogin and enter the code <CODE> to authenticate."
    }
}

Forneça o código que foi incluído na mensagem de erro.
O indexador do SharePoint Online acessará o conteúdo do SharePoint como o usuário conectado. O utilizador que inicia sessão durante este passo será o utilizador com sessão iniciada. Portanto, se você entrar com uma conta de usuário que não tenha acesso a um documento na Biblioteca de Documentos que deseja indexar, o indexador não terá acesso a esse documento.

Se possível, recomendamos criar uma nova conta de usuário e dar a esse novo usuário as permissões exatas que você deseja que o indexador tenha.
Aprove as permissões que estão sendo solicitadas.
A solicitação inicial Criar Indexador (visualização) será concluída se todas as permissões fornecidas acima estiverem corretas e dentro do período de tempo de 10 minutos.

Nota

Se o aplicativo Microsoft Entra exigir aprovação do administrador e não tiver sido aprovado antes de fazer login, você poderá ver a tela a seguir. A aprovação do administrador é necessária para continuar.

Etapa 7: Verificar o status do indexador

Depois que o indexador tiver sido criado, você poderá chamar Obter Status do Indexador:

GET https://[service name].search.windows.net/indexers/sharepoint-indexer/status?api-version=2025-05-01-preview
Content-Type: application/json
api-key: [admin key]

Atualizando a fonte de dados

Se não houver atualizações para o objeto da fonte de dados, o indexador será executado em um agendamento sem qualquer interação do usuário.

No entanto, se você modificar o objeto da fonte de dados enquanto o código do dispositivo expirou, deverá entrar novamente para que o indexador seja executado. Por exemplo, se você alterar a consulta da fonte de dados, entre novamente usando o e obtenha o novo código do https://microsoft.com/devicelogin dispositivo.

Aqui estão as etapas para atualizar uma fonte de dados, assumindo um código de dispositivo expirado:

Chame o Indexador de Execução (visualização) para iniciar manualmente a execução do indexador.

POST https://[service name].search.windows.net/indexers/sharepoint-indexer/run?api-version=2025-05-01-preview  
Content-Type: application/json
api-key: [admin key]

Verifique o status do indexador.

GET https://[service name].search.windows.net/indexers/sharepoint-indexer/status?api-version=2025-05-01-preview
Content-Type: application/json
api-key: [admin key]

Se você receber um erro solicitando a visita https://microsoft.com/devicelogin, abra a página e copie o novo código.
Cole o código na caixa de diálogo.
Execute manualmente o indexador novamente e verifique o status do indexador. Desta vez, a execução do indexador deve ser iniciada com êxito.

Indexação de metadados de documentos

Se você estiver indexando metadados de documentos ("dataToExtract": "contentAndMetadata"), os metadados a seguir estarão disponíveis para indexação.

Identificador	Tipo	Descrição
metadata_site_biblioteca_item_id	Edm.String	A chave de combinação de ID do site, ID da biblioteca e ID do item, que identifica exclusivamente um item em uma biblioteca de documentos para um site.
metadata_spo_site_id	Edm.String	A ID do site do SharePoint.
metadata_spo_identificador_da_biblioteca	Edm.String	A ID da biblioteca de documentos.
metadata_spo_item_id	Edm.String	A ID do item (documento) na biblioteca.
metadata_último_item_modificado_spo	Edm.DateTimeOffset	A data/hora (UTC) da última modificação do item.
metadata_spo_item_name	Edm.String	O nome do item.
metadados_spo_tamanho_item	Edm.Int64	O tamanho (em bytes) do item.
metadata_spo_tipo_de_conteúdo_do_item	Edm.String	O tipo de conteúdo do item.
metadata_spo_item_extension	Edm.String	A extensão do item.
metadata_spo_item_weburi	Edm.String	O URI do item.
metadata_spo_item_path	Edm.String	A combinação do caminho pai e do nome do item.

O indexador do SharePoint Online também oferece suporte a metadados específicos para cada tipo de documento. Mais informações podem ser encontradas em Propriedades de metadados de conteúdo usadas na Pesquisa de IA do Azure.

Nota

Para indexar metadados personalizados, "additionalColumns" deve ser especificado no parâmetro query da fonte de dados.

Incluir ou excluir por tipo de ficheiro

Você pode controlar quais arquivos são indexados definindo critérios de inclusão e exclusão na seção "parâmetros" da definição do indexador.

Inclua extensões de arquivo específicas definindo "indexedFileNameExtensions" como uma lista separada por vírgulas de extensões de arquivo (com um ponto à esquerda). Exclua extensões de arquivo específicas definindo "excludedFileNameExtensions" as extensões que devem ser ignoradas. Se a mesma extensão estiver em ambas as listas, ela será excluída da indexação.

PUT /indexers/[indexer name]?api-version=2025-05-01-preview
{
    "parameters" : { 
        "configuration" : { 
            "indexedFileNameExtensions" : ".pdf, .docx",
            "excludedFileNameExtensions" : ".png, .jpeg" 
        } 
    }
}

Controlando quais documentos são indexados

Um único indexador do SharePoint Online pode indexar conteúdo de uma ou mais bibliotecas de documentos. Use o parâmetro "container" na definição da fonte de dados para indicar quais sites e bibliotecas de documentos devem ser indexados.

A seção "container" da fonte de dados tem duas propriedades para essa tarefa: "name" e "query".

Nome

A propriedade "name" é necessária e deve ser um dos três valores:

valor	Descrição
padrãoSiteLibrary	Indexe todo o conteúdo da biblioteca de documentos padrão do site.
allSiteLibraries	Indexar todo o conteúdo de todas as bibliotecas de documentos em um site. As bibliotecas de documentos de um subsite estão fora do escopo/ Se você precisar de conteúdo de subsites, escolha "useQuery" e especifique "includeLibrariesInSite".
useQuery	Indexe apenas o conteúdo definido na "consulta".

Pergunta

O parâmetro "query" da fonte de dados é composto por pares palavra-chave/valor. Abaixo estão as palavras-chave que podem ser usadas. Os valores são URLs de site ou URLs de biblioteca de documentos.

Nota

Para obter o valor de uma palavra-chave específica, recomendamos navegar até a biblioteca de documentos que você está tentando incluir/excluir e copiar o URI do navegador. Esta é a maneira mais fácil de obter o valor a ser usado com uma palavra-chave na consulta.

Palavra-chave	Descrição do valor e exemplos
nulo	Se nulo ou vazio, indexe a biblioteca de documentos padrão ou todas as bibliotecas de documentos, dependendo do nome do contêiner. Exemplo: `"container" : { "name" : "defaultSiteLibrary", "query" : null }`
incluirBibliotecasInSite	Indexe o conteúdo de todas as bibliotecas no site especificado na cadeia de conexão. O valor deve ser o URI do site ou subsite. Exemplo 1: `"container" : { "name" : "useQuery", "query" : "includeLibrariesInSite=https://mycompany.sharepoint.com/mysite" }` Exemplo 2 (incluir apenas alguns subsites): `"container" : { "name" : "useQuery", "query" : "includeLibrariesInSite=https://mycompany.sharepoint.com/sites/TopSite/SubSite1;includeLibrariesInSite=https://mycompany.sharepoint.com/sites/TopSite/SubSite2" }`
incluirBiblioteca	Indexe todo o conteúdo desta biblioteca. O valor é o caminho totalmente qualificado para a biblioteca, que pode ser copiado do seu navegador: Exemplo 1 (caminho totalmente qualificado): `"container" : { "name" : "useQuery", "query" : "includeLibrary=https://mycompany.sharepoint.com/mysite/MyDocumentLibrary" }` Exemplo 2 (URI copiado do navegador): `"container" : { "name" : "useQuery", "query" : "includeLibrary=https://mycompany.sharepoint.com/teams/mysite/MyDocumentLibrary/Forms/AllItems.aspx" }`
excluirBiblioteca	Não indexe conteúdo desta biblioteca. O valor é o caminho totalmente qualificado para a biblioteca, que pode ser copiado do seu navegador: Exemplo 1 (caminho totalmente qualificado): `"container" : { "name" : "useQuery", "query" : "includeLibrariesInSite=https://mysite.sharepoint.com/subsite1; excludeLibrary=https://mysite.sharepoint.com/subsite1/MyDocumentLibrary" }` Exemplo 2 (URI copiado do navegador): `"container" : { "name" : "useQuery", "query" : "includeLibrariesInSite=https://mycompany.sharepoint.com/teams/mysite; excludeLibrary=https://mycompany.sharepoint.com/teams/mysite/MyDocumentLibrary/Forms/AllItems.aspx" }`
adicionalColunas	Colunas de índice da biblioteca de documentos. O valor é uma lista separada por vírgulas dos nomes de colunas que você deseja indexar. Use uma barra invertida dupla para escapar de ponto-e-vírgula e vírgulas nos nomes das colunas: Exemplo 1 (additionalColumns=MyCustomColumn,MyCustomColumn2): `"container" : { "name" : "useQuery", "query" : "includeLibrary=https://mycompany.sharepoint.com/mysite/MyDocumentLibrary;additionalColumns=MyCustomColumn,MyCustomColumn2" }` Exemplo 2 (caracteres de escape usando barra invertida dupla): `"container" : { "name" : "useQuery", "query" : "includeLibrary=https://mycompany.sharepoint.com/teams/mysite/MyDocumentLibrary/Forms/AllItems.aspx;additionalColumns=MyCustomColumnWith\\,,MyCustomColumnWith\\;" }`

Processar erros

Por padrão, o indexador do SharePoint Online para assim que encontra um documento com um tipo de conteúdo sem suporte (por exemplo, uma imagem). Você pode usar o excludedFileNameExtensions parâmetro para ignorar determinados tipos de conteúdo. No entanto, talvez seja necessário indexar documentos sem conhecer todos os tipos de conteúdo possíveis com antecedência. Para continuar a indexação quando um tipo de conteúdo sem suporte for encontrado, defina o failOnUnsupportedContentType parâmetro de configuração como false:

PUT https://[service name].search.windows.net/indexers/[indexer name]?api-version=2025-05-01-preview
Content-Type: application/json
api-key: [admin key]

{
    ... other parts of indexer definition
    "parameters" : { "configuration" : { "failOnUnsupportedContentType" : false } }
}

Para alguns documentos, o Azure AI Search não consegue determinar o tipo de conteúdo ou não consegue processar um documento de outro tipo de conteúdo suportado. Para ignorar esse modo de falha, defina o failOnUnprocessableDocument parâmetro de configuração como false:

"parameters" : { "configuration" : { "failOnUnprocessableDocument" : false } }

O Azure AI Search limita o tamanho dos documentos indexados. Esses limites estão documentados em Limites de Serviço no Azure AI Search. Documentos superdimensionados são tratados como erros por padrão. No entanto, você ainda pode indexar metadados de armazenamento de documentos superdimensionados se definir indexStorageMetadataOnlyForOversizedDocuments o parâmetro de configuração como true:

"parameters" : { "configuration" : { "indexStorageMetadataOnlyForOversizedDocuments" : true } }

Você também pode continuar a indexação se ocorrerem erros em qualquer ponto do processamento, seja durante a análise de documentos ou ao adicionar documentos a um índice. Para ignorar um número específico de erros, defina os maxFailedItems parâmetros e maxFailedItemsPerBatch de configuração para os valores desejados. Por exemplo:

{
    ... other parts of indexer definition
    "parameters" : { "maxFailedItems" : 10, "maxFailedItemsPerBatch" : 10 }
}

Se um arquivo no site do SharePoint tiver a criptografia habilitada, você poderá ver a seguinte mensagem de erro:

Code: resourceModified Message: The resource has changed since the caller last read it; usually an eTag mismatch Inner error: Code: irmEncryptFailedToFindProtector

A mensagem de erro também incluirá a ID do site do SharePoint, a ID da unidade e a ID do item da unidade no seguinte padrão: <sharepoint site id> :: <drive id> :: <drive item id>. Essas informações podem ser usadas para identificar qual item está falhando na extremidade do SharePoint. O usuário pode remover a criptografia do item para resolver o problema.

Partilhar via

Indexar dados de bibliotecas de documentos do SharePoint

Pré-requisitos

Formatos de documento suportados

Limitações e considerações

Configurar o indexador do SharePoint Online

Etapa 1 (opcional): Habilitar a identidade gerenciada atribuída ao sistema

Etapa 2: Decidir quais permissões o indexador requer

Etapa 3: Criar um registro de aplicativo Microsoft Entra

Etapa 4: Criar fonte de dados

Formato da cadeia de conexão

Etapa 5: Criar um índice

Etapa 6: Criar um indexador

Etapa 7: Verificar o status do indexador

Atualizando a fonte de dados

Indexação de metadados de documentos

Incluir ou excluir por tipo de ficheiro

Controlando quais documentos são indexados

Nome

Pergunta

Processar erros

Consulte também

Comentários

Recursos adicionais