Einführung in Azure Blob Storage
Azure Blob Storage ist die Objektspeicherlösung von Microsoft für die Cloud. Blob Storage ist für die Speicherung großer Mengen unstrukturierter Daten optimiert. Unstrukturierte Daten sind Daten, die keinem bestimmten Datenmodell und keiner bestimmten Definition entsprechen (also beispielsweise Text- oder Binärdaten).
Informationen zu Azure Blob Storage
Blob Storage ist für Folgendes konzipiert:
- Speichern von Bildern oder Dokumenten direkt für einen Browser
- Speichern von Dateien für verteilten Zugriff
- Video- und Audio-Streaming
- Schreiben in Protokolldateien
- Speichern von Daten für Sicherung und Wiederherstellung, Notfallwiederherstellung und Archivierung
- Speichern von Daten für Analysen durch einen lokalen oder von Azure gehosteten Dienst
Benutzer oder Clientanwendungen können von überall auf der Welt über HTTP/HTTPS auf Objekte in Blob Storage zugreifen. Auf Objekte in Blob Storage kann über die Azure Storage-REST-API, über Azure PowerShell, über die Azure-Befehlszeilenschnittstelle oder über eine Azure Storage-Clientbibliothek zugegriffen werden. Clientbibliotheken sind für verschiedene Sprachen verfügbar, einschließlich:
Clients können auch per SFTP (SSH File Transfer Protocol) eine sichere Verbindung mit Blob Storage herstellen und Blob Storage-Container mithilfe des NFS-Protokolls 3.0 (Network File System) einbinden.
Informationen zu Azure Data Lake Storage Gen2
Blob Storage unterstützt Azure Data Lake Storage Gen2, die cloudbasierte Big Data-Analyselösung von Microsoft für Unternehmen. Azure Data Lake Storage Gen2 bietet ein hierarchisches Dateisystem sowie die Vorteile von Blob Storage, u. a.:
- Kostengünstiger, mehrstufiger Speicher
- Hochverfügbarkeit
- Starke Konsistenz
- Funktionen für die Notfallwiederherstellung
Weitere Informationen zu Data Lake Storage Gen2 finden Sie in der Einführung in Azure Data Lake Storage Gen2.
Blob Storage-Ressourcen
Blob Storage bietet drei Typen von Ressourcen:
- Das Speicherkonto
- Einen Container im Speicherkonto
- Einen Blob in einem Container
Im folgenden Diagramm ist die Beziehung zwischen diesen Ressourcen dargestellt.
Speicherkonten
Ein Speicherkonto bietet einen eindeutigen Namespace für Ihre Daten in Azure. Jedes Objekt, das Sie in Azure speichern, besitzt eine Adresse, die den eindeutigen Namen Ihres Speicherkontos enthält. Die Kombination aus Kontoname und Blob Storage-Endpunkt bildet die Basisadresse für die Objekte in Ihrem Speicherkonto.
Wenn Ihr Speicherkonto beispielsweise mystorageaccount heißt, lautet der Standardendpunkt für Blob Storage wie folgt:
http://mystorageaccount.blob.core.windows.net
In der folgenden Tabelle werden die verschiedenen Typen von Speicherkonten beschrieben, die für Blob-Storage unterstützt werden:
Speicherkontotyp | Leistungsstufe | Verbrauch |
---|---|---|
General Purpose v2 | Standard | Standard-Speicherkontotyp für Blobs, Dateifreigaben, Warteschlangen und Tabellen. Empfohlen für die meisten Szenarien mit Blob Storage oder einem der anderen Azure Storage Dienste. |
Blockblob | Premium | Kontotyp „Premium Storage“ für Block- und Anfügeblobs. Empfohlen für Szenarien mit hohen Transaktionsraten, die kleinere Objekte verwenden oder aber eine gleichbleibend geringe Speicherlatenz erfordern. Erfahren Sie mehr über Workloads für Premium-Blockblobkonten... |
Seitenblob | Premium | Storage Premium-Kontotyp nur für Seitenblobs. Erfahren Sie mehr über Workloads für Premium-Blockblobkonten... |
Weitere Informationen zu Typen von Speicherkonten finden Sie in der Übersicht über Azure Storage-Konten. Informationen zu Legacy-Speicherkontotypen finden Sie unter Legacy-Speicherkontotypen.
Um zu erfahren, wie Sie ein Speicherkonto erstellen, lesen Sie den Artikel Erstellen eines Speicherkontos.
Container
Ein Container dient zum Organisieren einer Gruppe von Blobs (ähnlich wie ein Verzeichnis in einem Dateisystem). Ein Speicherkonto kann eine unbegrenzte Anzahl von Containern enthalten, und in einem Container kann eine unbegrenzte Anzahl von Blobs gespeichert werden.
Ein Containername muss ein gültiger DNS-Name sein, da er Teil des eindeutigen URI (Uniform Resource Identifier) ist, der für die Adressierung des Containers oder seiner Blobs verwendet wird. Befolgen Sie diese Regeln, wenn Sie einen Container benennen:
- Containernamen können zwischen 3 und 63 Zeichen lang sein.
- Containernamen müssen mit einem Buchstaben oder einer Zahl beginnen und dürfen nur Kleinbuchstaben, Zahlen und Bindestriche (-) enthalten.
- Zwei oder mehr aufeinanderfolgende Bindestriche sind in Containernamen nicht zulässig.
Der URI für einen Container ist ähnlich wie:
https://myaccount.blob.core.windows.net/mycontainer
Weitere Informationen zur Benennung von Containern finden Sie unter Naming and Referencing Containers, Blobs, and Metadata (Benennen und Referenzieren von Containern, Blobs und Metadaten).
BLOBs
Azure Storage unterstützt drei Arten von Blobs:
- In Blockblobs werden Text- und Binärdaten gespeichert. Blockblobs bestehen aus Datenblöcken, die einzeln verwaltet werden können. Blockblobs können bis zu 190,7 TiB speichern.
- Anfügeblobs bestehen wie Blockblobs aus Blöcken, sind aber für Anfügevorgänge optimiert. Anfügeblobs sind beispielsweise ideal für Szenarien, bei denen es um das Protokollieren von Daten virtueller Computer geht.
- In Seitenblobs werden Random-Access-Dateien mit einer Größe von bis zu 8 TiB gespeichert. Seitenblobs speichern VHD-Dateien (Virtual Hard Drive, virtuelle Festplatte) und fungieren als Datenträger für Azure-VMs. Weitere Informationen zu Seitenblobs finden Sie in der Übersicht über Azure-Seitenblobs.
Weitere Informationen zu den verschiedenen Blobtypen finden Sie unter Understanding Block Blobs, Append Blobs, and Page Blobs (Grundlegendes zu Block-, Anfüge- und Seitenblobs).
Der URI für ein BLOB ist ähnlich wie:
https://myaccount.blob.core.windows.net/mycontainer/myblob
oder
https://myaccount.blob.core.windows.net/mycontainer/myvirtualdirectory/myblob
Erhalten Sie diese Regeln, wenn Sie ein BLOB benennen:
- Ein BLOB-Name kann eine beliebige Kombination von Zeichen enthalten.
- Ein BLOB-Name muss mindestens ein Zeichen lang sein und darf nicht länger als 1024 Zeichen sein, für BLOB in sein und Azure Storage
- Bei BLOB-Namen wird die Groß- und Kleinschreibung beachtet.
- Reservierte URL-Zeichen müssen korrekt mit Escapezeichen versehen sein.
- Es gibt Einschränkungen für die Anzahl der Pfadsegmente, die einen BLOB-Namen umfassen. Ein Pfadsegment ist die Zeichenfolge zwischen aufeinanderfolgenden Trennzeichen (z. B. ein Schrägstrich (
/
)), die dem Verzeichnis oder virtuellen Verzeichnissen entspricht. Die folgenden Pfadsegmenteinschränkungen gelten für Blobnamen:- Wenn das Speicherkonto keinen hierarchischen Namespace aktiviert, darf die Anzahl der Pfadsegmente, die den Blobnamen umfassen, 254 nicht überschreiten.
- Wenn das Speicherkonto den hierarchischen Namespace aktiviert hat, darf die Anzahl der Pfadsegmente, die den Blobnamen umfassen, 63 nicht überschreiten (einschließlich Pfadsegmente für Containername und Kontohostname).
Hinweis
Vermeiden Sie BLOB-Namen, die mit einem Punkt (.), einem Schrägstrich (/) oder einer Abfolge oder Kombination aus beidem enden. Keine Pfadsegmente sollten mit einem Punkt (.) enden.
Weitere Informationen zur Benennung von Containern finden Sie unter Naming and Referencing Containers, Blobs, and Metadata (Benennen und Referenzieren von Containern, Blobs und Metadaten).
Verschieben von Daten in Blob Storage
Für die Migration vorhandener Daten zu Blob Storage sind zahlreiche Lösungen verfügbar:
- AzCopy ist ein benutzerfreundliches Befehlszeilentool für Windows und Linux, das Daten zwischen Containern oder Speicherkonten nach und aus Blob Storage kopiert. Weitere Informationen zu AzCopy finden Sie unter Übertragen von Daten mit AzCopy v10.
- Die Azure Storage-Datenverschiebungsbibliothek ist eine .NET-Bibliothek für das Verschieben von Daten zwischen Azure Storage-Diensten. Das AzCopy-Hilfsprogramm wird mit der Datenverschiebungsbibliothek erstellt. Weitere Informationen finden Sie in der Referenzdokumentation für die Datenverschiebungsbibliothek.
- Azure Data Factory unterstützt das Kopieren von Daten nach und aus Blob Storage mithilfe des Kontoschlüssels, einer Shared Access Signature (SAS), eines Dienstprinzipals oder verwalteter Identitäten für Azure-Ressourcen. Weitere Informationen finden Sie unter Kopieren von Daten nach oder aus Azure Blob Storage mit Azure Data Factory.
- BlobFuse ist ein virtueller Dateisystemtreiber für Azure Blob Storage. Sie können BlobFuse verwenden, um über das Linux-Dateisystem auf die vorhandenen Blockblobdaten in Ihrem Speicherkonto zuzugreifen. Weitere Informationen finden Sie unter Was ist BlobFuse? – BlobFuse2 (Vorschau).
- Der Dienst Azure Data Box steht zur Übertragung von lokalen Daten in Blob Storage zur Verfügung, wenn der Upload von Daten über das Netzwerk aufgrund großer Datasets oder von Netzwerkeinschränkungen nicht realisierbar ist. Je nach Datengröße können Sie Azure Data Box Disk-, Azure Data Box- oder Azure Data Box Heavy-Geräte von Microsoft anfordern. Anschließend können Sie Ihre Daten auf diese Geräte kopieren und zurück an Microsoft senden, damit sie in Blob Storage hochgeladen werden können.
- Der Azure Import/Export-Dienst ist eine Möglichkeit, um unter Verwendung der von Ihnen bereitgestellten Festplatten große Datenmengen in Ihr Speicherkonto zu importieren bzw. aus Ihrem Speicherkonto zu exportieren. Weitere Informationen finden Sie unter Was ist der Azure Import/Export-Dienst?.