Freigeben über


Merkmale der Blobinventurleistung

Azure Storage Blob Inventory ist ein wesentliches Tool zum Verwalten und Nachverfolgen der Objekte, die in Ihrem Azure Blob Storage-Konto gespeichert sind. Sie bietet einen umfassenden Überblick über Ihre Speicherressourcen, sodass Sie fundierte Entscheidungen über das Datenmanagement und die Kostenoptimierung treffen können.

Nachdem Sie Blob-Bestandsberichte aktiviert haben, werden Objekte in Ihrem Speicherkonto regelmäßig mithilfe der Regeln überprüft, die in der Bestandsrichtlinie definiert sind. Die Zeit, die zum Generieren eines Bestandsberichts benötigt wird, hängt von mehreren Faktoren ab. Zu diesen Faktoren gehören die Anzahl der Objekte, die Verzeichnisstruktur, die über Regeluntertypen angewendeten Filter, die Kundenarbeitsauslastung auf dem Speicherkonto, die Verfügbarkeit von Speicherressourcen und vieles mehr. In einigen Fällen kann es je nach diesen Faktoren mehrere Tage dauern, bis die Verarbeitung aller Objekte im Speicherkonto abgeschlossen ist. Die Leistung des Inventars kann auch zwischen Scans und manchmal auch während des Scans variieren.

Faktoren, die die Leistung des Blobbestands beeinflussen

Wenn Sie blob-Inventar verwenden, um einen Bestandsbericht zu generieren, können sich mehrere wichtige Faktoren auf die Leistung auswirken. Das Verständnis dieser Faktoren kann Ihnen helfen, Bestandsprozesse zu optimieren und eine effiziente Datenverwaltung zu ermöglichen.

Verteilung von Objekten in hierarchischen namespacefähigen Konten

Die Verteilung von Objekten innerhalb eines hierarchischen namespacefähigen Kontos kann sich erheblich auf die Bestandsleistung auswirken. Blobinventur überprüft jeweils ein Verzeichnis und schließt diese Überprüfung ab, bevor Sie zum nächsten Verzeichnis wechseln. Daher kann eine hohe Anzahl von Verzeichnissen, insbesondere bei geringer Objektverteilung und tiefen Schachtelung, die Zeit erhöhen, die zum Generieren des Bestandsberichts erforderlich ist.

Anzahl der für die Bestandsregel verarbeiteten Objekte

Die Gesamtanzahl der objekte, die basierend auf einer Bestandsregel gescannt wurden, ist ein wichtiger Faktor bei der Verarbeitung der Leistung. Regeln, die auf ein großes Objektvolumen abzielen, benötigen mehr Zeit und Ressourcen, um einen Bestandsbericht zu generieren. Die Anzahl der zu verarbeitenden Objekte steigt, wenn Ihre Bestandsregel Versionen, Momentaufnahmen und vorläufig gelöschte Objekte enthält. Wenn diese Untertypen in hohen Mengen vorhanden sind, können sie die Verarbeitungszeit erweitern, die zum Generieren des Bestandsberichts erforderlich ist.

Exportformat des Bestandsberichts

Das ausgewählte Exportformat für einen Bestandsbericht (CSV oder Apache Laminat) kann die Leistung beeinflussen. Während Parkett für die schnelle Datenverarbeitung optimiert ist, führt es zu Mehraufwand, der die Berichtsgenerierung im Vergleich zu CSV verlangsamen kann.

Große Anzahl vorläufig gelöschter Objekte

Vorläufig gelöschte Objekte, jedoch nicht dauerhaft entfernt, sind weiterhin in Bestandsscans enthalten. Ein hohes Volumen dieser Objekte kann der Verarbeitungszeit hinzufügen und die Leistung verringern. Wenn Sie diese Faktoren berücksichtigen, können Sie die Leistung Ihrer Bestandsläufe verbessern und effizientere Datenverwaltungserfahrungen haben.

Bewährte Methoden zur Verbesserung der Blobinventarleistung

Die effiziente Verwaltung Ihres Azure Blob Storage ist unerlässlich, um optimale Leistung und Kosteneffizienz aufrechtzuerhalten. Hier sind einige bewährte Methoden, um die Leistung des Azure Storage-BLOB-Inventars zu verbessern:

Vermeiden Sie sparse Konten in hierarchischen namespacefähigen Konten.

Geringe Konten sind solche, die eine große Anzahl von Objekten enthalten, die sich über viele Verzeichnisse erstrecken. Diese Verzeichnisse können tief geschachtelte Strukturen enthalten. Geringe Konten führen zu einem sehr niedrigen Datei-zu-Verzeichnis-Verhältnis, was zu Ineffizienzen bei der Generierung von Bestandsberichten führen kann und sogar zu Fehlern führt. Um diese Ineffizienzen zu mindern, stellen Sie sicher, dass Ihr hierarchisches Namespace-fähiges Speicherkonto gut organisiert ist, und vermeiden Sie eine geringe Verteilung von Objekten.

Verwenden von CSV für das Exportformat

Wenn Sie Bestandsberichte generieren, entscheiden Sie sich für das CSV-Format, wenn ihr Anwendungsfall keine schnelle Datenverarbeitung erfordert. Parkett ist ein Spaltenspeicherdateiformat, das für die Leistung optimiert ist, und eines der schnellsten Formate für die Datenverarbeitung. Ein Parkettformat kann jedoch die Zeit erhöhen, die erforderlich ist, um Berichte aufgrund seines Aufwands zu generieren, wodurch er langsamer als das Generieren eines Berichts im CSV-Format ist. Wenn Sie das Parkettformat benötigen, um Ihren Bericht nachzubereiten, können Sie die verfügbaren Open-Source-Tools nutzen, die CSV in Das Parkettformat konvertieren.

Festlegen der Bestandsregel mithilfe eines Präfixes

Anstatt den Bestand für das gesamte Speicherkonto auszuführen, verwenden Sie einen Präfixübereinstimmungsfilter, um einen Bestandsbericht für bestimmte Teilmengen Ihrer Daten zu generieren.

  • Präfix einschließen: Dieser Filter zielt auf eine Gruppe von Containern oder Pfaden innerhalb eines Containers ab. Dieser Ansatz hilft dabei, den Umfang Ihres Bestandsberichts einzugrenzen und den Prozess schneller und effizienter zu gestalten.

  • Präfix ausschließen: Verwenden Sie diesen Filter, um eine bestimmte Teilmenge davon auszuschließen. Dieser Ansatz hilft auch, den Umfang Ihres Bestandsberichts einzugrenzen. Weitere Informationen finden Sie unter Regelfilter

Auswählen relevanter Felder

Passen Sie Ihre Bestandsberichte an, indem Sie nur die relevanten Felder auswählen, die Sie benötigen. Dadurch wird die Menge der verarbeiteten und exportierten Daten reduziert, was zu einer schnelleren Berichterstellung und einfacheren Analyse führt. Weitere Informationen zu den Bestandsschemafeldern finden Sie unter "Benutzerdefinierte Schemafelder", die für blobinventar unterstützt werden

Untertypeinschluss: gelöschte Objekte, Momentaufnahmen und Versionen

Obwohl die Einbeziehung dieser Untertypen eine umfassendere Ansicht Ihres Speicherkontos bieten kann, ist es wichtig zu beurteilen, ob sie für Ihre Überwachungs- und Verwaltungsanforderungen unerlässlich sind. Wenn sie nicht kritisch sind, kann dies dazu beitragen, die Leistung und Effizienz Des Berichtsgenerierungsprozesses zu verbessern. Um objekte zu identifizieren, die in der letzten Bestandsausführung gelöscht wurden, vergleichen Sie die Blobnamen aus der aktuellen Ausführung mit denen aus einer vorherigen Ausführung. Der Unterschied kann eine Liste der zuletzt gelöschten Objekte bereitstellen.

Abonnieren von Blobinventarereignissen

Bleiben Sie über benutzerinduzierte Fehler informiert, indem Sie Blob-Bestandsereignisse abonnieren. Dieser proaktive Ansatz hilft Ihnen, Probleme schnell zu beheben. Weitere Informationen zum Abonnieren von Bestandsereignissen finden Sie unter Abonnieren des ereignisses "Blobinventurrichtlinie abgeschlossen".

Unerwartete Kapazitätssteigerungen überwachen

Achten Sie auf unerwartete Spitzen in der Kapazität Ihres Speicherkontos, da sie die Ansammlung von BLOB-Versionen, Momentaufnahmen oder vorläufig gelöschten Objekten signalisieren können. Die Überwachung dieser Änderungen kann Ihnen helfen, potenzielle Probleme zu erkennen und zu beheben, bevor sie sich auf die Leistung auswirken. Darüber hinaus kann das Verwalten des Lebenszyklus dieser Objekte unnötigen Buildups verhindern und die Leistung des Blob-Inventars verbessern. Weitere Informationen zur Blob-Lebenszyklusverwaltung finden Sie in der Übersicht über die Azure Blob Storage-Lebenszyklusverwaltung

Anhand dieser bewährten Methoden können Sie die Leistung Ihres Blob-Inventars verbessern und eine effiziente und effektive Verwaltung Ihres Azure Blob Storage sicherstellen.

Nächste Schritte