Partilhar via


Use tags de índice de blob para gerenciar e localizar dados com Python

Este artigo mostra como usar marcas de índice de blob para gerenciar e localizar dados usando a biblioteca de cliente do Armazenamento do Azure para Python.

Para saber mais sobre como definir tags de índice de blob usando APIs assíncronas, consulte Definir tags de índice de blob de forma assíncrona.

Pré-requisitos

  • Este artigo pressupõe que você já tenha um projeto configurado para trabalhar com a biblioteca de cliente do Armazenamento de Blobs do Azure para Python. Para saber mais sobre como configurar seu projeto, incluindo instalação de pacote, adição de import instruções e criação de um objeto de cliente autorizado, consulte Introdução ao Armazenamento de Blob do Azure e Python.
  • O mecanismo de autorização deve ter permissões para trabalhar com tags de índice de blob. Para saber mais, consulte as diretrizes de autorização para as seguintes operações de API REST:

Sobre tags de índice de blob

As tags de índice de Blob categorizam os dados em sua conta de armazenamento usando atributos de tag chave-valor. Essas tags são automaticamente indexadas e expostas como um índice multidimensional pesquisável para encontrar dados facilmente. Este artigo mostra como definir, obter e localizar dados usando tags de índice de blob.

As tags de índice de Blob não são suportadas para contas de armazenamento com namespace hierárquico habilitado. Para saber mais sobre o recurso de marca de índice de blob, juntamente com problemas e limitações conhecidos, consulte Gerenciar e localizar dados de Blob do Azure com tags de índice de blob.

Definir tags

Você pode definir marcas de índice se seu código tiver autorizado o acesso aos dados de blob por meio de um dos seguintes mecanismos:

Para obter mais informações, consulte Definindo tags de índice de blob.

Você pode definir tags usando o seguinte método:

As tags especificadas neste método substituirão as tags existentes. Se os valores antigos devem ser preservados, eles devem ser baixados e incluídos na chamada para este método. O exemplo a seguir mostra como definir tags:

def set_blob_tags(self, blob_service_client: BlobServiceClient, container_name):
    blob_client = blob_service_client.get_blob_client(container=container_name, blob="sample-blob.txt")

    # Get any existing tags for the blob if they need to be preserved
    tags = blob_client.get_blob_tags()

    # Add or modify tags
    updated_tags = {'Sealed': 'false', 'Content': 'image', 'Date': '2022-01-01'}
    tags.update(updated_tags)

    blob_client.set_blob_tags(tags)

Você pode excluir todas as tags passando um objeto vazio dict para o set_blob_tags método:

def clear_blob_tags(self, blob_service_client: BlobServiceClient, container_name):
    blob_client = blob_service_client.get_blob_client(container=container_name, blob="sample-blob.txt")

    # Pass in empty dict object to clear tags
    tags = dict()
    blob_client.set_blob_tags(tags)

Obter tags

Você pode obter tags de índice se seu código tiver autorizado o acesso aos dados de blob por meio de um dos seguintes mecanismos:

Para obter mais informações, consulte Obtendo e listando tags de índice de blob.

Você pode obter tags usando o seguinte método:

O exemplo a seguir mostra como recuperar e iterar sobre as tags do blob:

def get_blob_tags(self, blob_service_client: BlobServiceClient, container_name):
    blob_client = blob_service_client.get_blob_client(container=container_name, blob="sample-blob.txt")

    tags = blob_client.get_blob_tags()
    print("Blob tags: ")
    for k, v in tags.items():
        print(k, v)

Filtrar e localizar dados com tags de índice de blob

Você pode usar tags de índice para localizar e filtrar dados se seu código tiver autorizado o acesso aos dados de blob por meio de um dos seguintes mecanismos:

Para obter mais informações, consulte Localizando dados usando tags de índice de blob.

Nota

Não é possível usar tags de índice para recuperar versões anteriores. As tags de versões anteriores não são passadas para o mecanismo de índice de blob. Para obter mais informações, consulte Condições e problemas conhecidos.

Você pode encontrar dados usando o seguinte método:

O exemplo a seguir localiza e lista todos os blobs marcados como uma imagem:

def find_blobs_by_tags(self, blob_service_client: BlobServiceClient, container_name):
    container_client = blob_service_client.get_container_client(container=container_name)

    query = "\"Content\"='image'"
    blob_list = container_client.find_blobs_by_tags(filter_expression=query)
    
    print("Blobs tagged as images")
    for blob in blob_list:
        print(blob.name)

Definir tags de índice de blob de forma assíncrona

A biblioteca de cliente do Armazenamento de Blobs do Azure para Python dá suporte ao trabalho com marcas de índice de blob de forma assíncrona. Para saber mais sobre os requisitos de configuração do projeto, consulte Programação assíncrona.

Siga estas etapas para definir marcas de índice de blob usando APIs assíncronas:

  1. Adicione as seguintes instruções de importação:

    import asyncio
    
    from azure.identity.aio import DefaultAzureCredential
    from azure.storage.blob.aio import BlobServiceClient
    
  2. Adicione código para executar o programa usando asyncio.runo . Essa função executa a co-rotina passada, em nosso exemplo, main() e gerencia o loop de asyncio eventos. As co-rotinas são declaradas com a sintaxe async/await. Neste exemplo, a main() co-rotina primeiro cria o nível BlobServiceClient superior usando async withe, em seguida, chama o método que define as tags de índice de blob. Observe que apenas o cliente de nível superior precisa usar async witho , pois outros clientes criados a partir dele compartilham o mesmo pool de conexões.

    async def main():
        sample = BlobSamples()
    
        # TODO: Replace <storage-account-name> with your actual storage account name
        account_url = "https://<storage-account-name>.blob.core.windows.net"
        credential = DefaultAzureCredential()
    
        async with BlobServiceClient(account_url, credential=credential) as blob_service_client:
            await sample.set_blob_tags(blob_service_client, "sample-container")
    
    if __name__ == '__main__':
        asyncio.run(main())
    
  3. Adicione código para definir as tags de índice de blob. O código é o mesmo que o exemplo síncrono, exceto que o método é declarado com a palavra-chave e a asyncawait palavra-chave é usada ao chamar os get_blob_tags métodos and set_blob_tags .

    async def set_blob_tags(self, blob_service_client: BlobServiceClient, container_name):
        blob_client = blob_service_client.get_blob_client(container=container_name, blob="sample-blob.txt")
    
        # Get any existing tags for the blob if they need to be preserved
        tags = await blob_client.get_blob_tags()
    
        # Add or modify tags
        updated_tags = {'Sealed': 'false', 'Content': 'image', 'Date': '2022-01-01'}
        tags.update(updated_tags)
    
        await blob_client.set_blob_tags(tags)
    

Com essa configuração básica em vigor, você pode implementar outros exemplos neste artigo como co-rotinas usando a sintaxe async/await.

Recursos

Para saber mais sobre como usar marcas de índice para gerenciar e localizar dados usando a biblioteca de cliente do Armazenamento de Blobs do Azure para Python, consulte os recursos a seguir.

Operações da API REST

O SDK do Azure para Python contém bibliotecas que se baseiam na API REST do Azure, permitindo que você interaja com operações da API REST por meio de paradigmas Python familiares. Os métodos de biblioteca de cliente para gerenciar e usar tags de índice de blob usam as seguintes operações de API REST:

Amostras de código

Recursos da biblioteca do cliente

Consulte também