다음을 통해 공유


Python을 사용하여 원본 개체 URL에서 Blob 복사

이 문서에서는 Python용 Azure Storage 클라이언트 라이브러리를 사용하여 원본 개체 URL에서 Blob을 복사하는 방법을 보여 줍니다. 동일한 스토리지 계정 내의 원본, 다른 스토리지 계정의 원본 또는 지정된 URL의 HTTP GET 요청을 통해 검색되어 액세스 가능한 개체에서 Blob을 복사할 수 있습니다.

이 문서에서 다루는 클라이언트 라이브러리 메서드는 URL에서 Blob 배치URL에서 블록 배치 REST API 작업을 사용합니다. 이러한 메서드는 데이터를 스토리지 계정으로 이동하고 원본 개체에 대한 URL이 있는 복사 시나리오에 선호됩니다. 비동기 일정을 원하는 복사 작업은 Python을 사용하여 비동기 일정으로 Blob 복사를 참조하세요.

비동기 API를 사용하여 Blob을 복사하는 방법에 대해 알아보려면 원본 개체 URL에서 Blob을 비동기식으로 복사를 참조하세요.

필수 조건

  • 이 문서에서는 Python용 Azure Blob Storage 클라이언트 라이브러리로 작업하도록 프로젝트가 이미 설정되어 있다고 가정합니다. 패키지 설치, import 문 추가 및 권한 있는 클라이언트 개체 만들기를 포함하여 프로젝트를 설정하는 방법에 대한 자세한 내용은 Azure Blob Storage 및 Python 시작을 참조하세요.
  • 코드에서 비동기 API를 사용하려면 비동기 프로그래밍 섹션의 요구 사항을 참조하세요.
  • 권한 부여 메커니즘에는 복사 작업을 수행할 수 있는 권한이 있어야 합니다. 자세한 내용은 다음 REST API 작업에 대한 권한 부여 지침을 참조하세요.

원본 개체 URL에서 Blob 복사 정보

Put Blob From URL 작업은 지정된 URL에서 Blob의 내용을 읽는 새 블록 Blob을 만듭니다. 작업은 동기적으로 완료됩니다.

원본은 지정된 URL에서 표준 HTTP GET 요청을 통해 검색할 수 있는 개체일 수 있습니다. 여기에는 블록 Blob, 추가 Blob, 페이지 Blob, Blob 스냅샷, Blob 버전 또는 Azure 내부 또는 외부의 액세스 가능한 개체가 포함됩니다.

원본 개체가 블록 Blob이면 커밋된 모든 Blob 콘텐츠가 복사됩니다. 대상 Blob의 콘텐츠는 원본의 콘텐츠와 동일하지만 커밋된 블록 목록은 보존되지 않으며 커밋되지 않은 블록은 복사되지 않습니다.

대상은 항상 블록 Blob으로, 기존 블록 Blob이거나 작업으로 생성된 새 블록 Blob입니다. 기존 Blob의 콘텐츠를 새 Blob의 콘텐츠로 덮어씁니다.

Put Blob From URL 작업은 항상 전체 원본 Blob을 복사합니다. 바이트 범위 또는 블록 세트 복사는 지원되지 않습니다. 원본 URL을 사용하여 블록 Blob의 콘텐츠에 대한 부분 업데이트를 수행하려면 URL에서 블록 배치Put Block List과 함께 API를 사용합니다.

Blob 크기 제한 및 청구 고려 사항을 포함하여 Put Blob From URL 작업에 대한 자세한 내용은 URL에서 Blob 배치 설명을 참조하세요.

원본 개체 URL에서 Blob 복사

이 섹션에서는 원본 개체 URL에서 복사 작업을 수행하기 위해 Python용 Azure Storage 클라이언트 라이브러리에서 제공하는 메서드에 대한 개요를 제공합니다.

다음 메서드는 URL에서 Blob 배치 REST API 작업을 래핑하고 지정된 URL에서 Blob의 내용을 읽는 새 블록 Blob을 만듭니다.

이러한 메서드는 데이터를 스토리지 계정으로 이동하고 원본 개체에 대한 URL이 있는 시나리오에 선호됩니다.

큰 개체의 경우 개별 블록으로 작업하도록 선택할 수 있습니다. 다음 메서드는 URL에서 블록 배치 REST API 작업을 래핑합니다. 이 메서드는 원본 URL에서 콘텐츠를 읽는 Blob의 일부로 커밋할 새 블록을 만듭니다.

Azure 내 원본에서 Blob 복사

Azure 내의 원본에서 Blob을 복사하는 경우 원본 Blob에 대한 액세스는 Microsoft Entra ID, SAS(공유 액세스 서명) 또는 계정 키를 통해 권한 부여될 수 있습니다.

다음 예제에서는 Azure 내 원본 Blob을 복사하는 시나리오를 보여줍니다. upload_blob_from_url 메서드는 필요에 따라 부울 매개 변수를 수락하여 예제와 같이 기존 Blob을 덮어쓸지 여부를 나타낼 수 있습니다.

def copy_from_source_in_azure(self, source_blob: BlobClient, destination_blob: BlobClient):
    # Get the source blob URL and create the destination blob
    # set overwrite param to True if you want to overwrite existing blob data
    destination_blob.upload_blob_from_url(source_url=source_blob.url, overwrite=False)

Azure 외부의 원본에서 Blob 복사

Azure 외부의 액세스 가능한 개체를 포함하여 지정된 URL에서 HTTP GET 요청을 통해 검색할 수 있는 모든 원본 개체에 대해 복사 작업을 수행할 수 있습니다. 다음 예제에서는 액세스 가능한 원본 개체 URL에서 Blob을 복사하는 시나리오를 보여줍니다.

def copy_from_external_source(self, source_url: str, destination_blob: BlobClient):
    # Create the destination blob from the source URL
    # set overwrite param to True if you want to overwrite existing blob data
    destination_blob.upload_blob_from_url(source_url=source_url, overwrite=False)

원본 개체 URL에서 Blob을 비동기적으로 복사합니다.

Python용 Azure Blob Storage 클라이언트 라이브러리는 원본 URL에서 Blob을 비동기적으로 복사하는 것을 지원합니다. 프로젝트 설정 요구 사항에 대해 자세히 알아보려면 비동기 프로그래밍을 참조하세요.

비동기 API를 사용하여 원본 개체 URL에서 Blob을 복사하려면 다음 단계를 따릅니다.

  1. 다음 import 문을 추가합니다.

    import asyncio
    
    from azure.identity.aio import DefaultAzureCredential
    from azure.storage.blob.aio import BlobServiceClient, BlobClient
    
  2. asyncio.run을 사용하여 프로그램을 실행하는 코드를 추가합니다. 이 함수는 전달된 코루틴(예에서는 main())을 실행하고 asyncio 이벤트 루프를 관리합니다. 코루틴은 async/await 구문으로 선언됩니다. 이 예에서 main() 코루틴은 먼저 async with를 사용하여 최상위 수준 BlobServiceClient를 만든 다음 원본 URL에서 Blob을 복사하는 메서드를 호출합니다. 최상위 클라이언트에서만 async with를 사용해야 합니다. 이 클라이언트에서 만들어진 다른 클라이언트는 동일한 연결 풀을 공유하기 때문입니다.

    async def main():
        sample = BlobCopySamples()
    
        # TODO: Replace <storage-account-name> with your actual storage account name
        account_url = "https://<storage-account-name>.blob.core.windows.net"
        credential = DefaultAzureCredential()
    
        async with BlobServiceClient(account_url, credential=credential) as blob_service_client:
            # Copy a blob from one container to another in the same storage account
            source = blob_service_client.get_blob_client(container="source-container", blob="sample-blob.txt")
            destination = blob_service_client.get_blob_client(container="destination-container", blob="sample-blob.txt")
            await sample.copy_from_source_in_azure(source_blob=source, destination_blob=destination)
    
    if __name__ == '__main__':
        asyncio.run(main())
    
  3. 원본 URL에서 Blob을 복사하는 코드를 추가합니다. 다음 코드 예는 메서드가 async 키워드로 선언되고 upload_blob_from_url 메서드를 호출할 때 await 키워드가 사용된다는 점을 제외하면 동기 예와 동일합니다.

    async def copy_from_source_in_azure(self, source_blob: BlobClient, destination_blob: BlobClient):
        # Get the source blob URL and create the destination blob
        # set overwrite param to True if you want to overwrite existing blob data
        await destination_blob.upload_blob_from_url(source_url=source_blob.url, overwrite=False)
    

이 기본 설정을 사용하면 async/await 구문을 사용하여 이 문서의 다른 예를 코루틴으로 구현할 수 있습니다.

리소스

Python용 Azure Blob Storage 클라이언트 라이브러리를 사용하여 Blob을 복사하는 방법에 대해 자세히 알아보려면 다음 리소스를 참조하세요.

REST API 작업

Python용 Azure SDK에는 Azure REST API를 기반으로 빌드되는 라이브러리가 포함되어 있어 친숙한 Python 패러다임을 통해 REST API 작업과 상호 작용할 수 있습니다. 이 문서에서 다루는 클라이언트 라이브러리 메서드는 다음 REST API 작업을 사용합니다.

코드 샘플

클라이언트 라이브러리 리소스