Datentypen in Power Query
Datentypen in Power Query werden verwendet, um Werte zu klassifizieren, um ein strukturiertes Dataset zu erhalten. Datentypen werden auf Feldebene definiert. Werte innerhalb eines Felds werden so festgelegt, dass sie dem Datentyp des Felds entsprechen .
Der Datentyp einer Spalte wird auf der linken Seite der Spaltenüberschrift mit einem Symbol angezeigt, das den Datentyp symbolisiert.
Hinweis
Power Query bietet basierend auf dem Datentyp der Spalte eine Reihe kontextbezogener Transformationen und Optionen. Wenn Sie beispielsweise eine Spalte mit dem Datentyp Date auswählen, erhalten Sie Transformationen und Optionen, die für diesen bestimmten Datentyp gelten. Diese Transformationen und Optionen treten in der gesamten Power Query-Schnittstelle auf, z. B. auf den Registerkarten Transformieren und Hinzufügen von Spalten und den Optionen für intelligente Filter.
Die gängigsten Datentypen, die in Power Query verwendet werden, sind in der folgenden Tabelle aufgeführt. Die vollständige Liste der Datentypen finden Sie im Artikel typen der Power Query M-Formelsprache.
Datentyp | Symbol | BESCHREIBUNG |
---|---|---|
Text | ![]() |
Eine Unicodezeichen-Datenzeichenfolge. Hierbei kann es sich um Zeichenfolgen, Zahlen oder Datumsangaben handeln, die im Textformat dargestellt werden. Die maximale Zeichenfolgenlänge beträgt 268.435.456 Unicode-Zeichen (wobei jedes Unicode-Zeichen zwei Bytes umfasst) oder 536.870.912 Bytes. |
True/False | ![]() |
Ein boolescher Wert von True oder False. |
Dezimalzahl | ![]() |
Stellt eine 64-Bit-Gleitkommazahl (acht Byte) dar. Dies ist der am häufigsten verwendete Zahlentyp und entspricht Zahlen, wie Sie sie normalerweise denken. Er ist zwar für die Behandlung von Zahlen mit Bruchwerten vorgesehen, verarbeitet jedoch auch ganze Zahlen. Der Typ Dezimalzahl kann negative Werte von –1,79E +308 bis –2,23E –308, 0 und positive Werte von 2,23E –308 bis 1,79E + 308 verarbeiten. Beispielsweise sind Zahlen wie 34, 34,01 und 34,000367063 gültige Dezimalzahlen. Die größte Genauigkeit, die im Typ „Dezimalzahl“ dargestellt werden kann, ist 15 Stellen. Das Dezimaltrennzeichen kann an einer beliebigen Stelle in der Zahl stehen. Der Typ Dezimalzahl entspricht der Art und Weise, wie Excel Zahlen speichert. Beachten Sie, dass eine binäre Gleitkommazahl nicht alle Zahlen innerhalb des unterstützten Bereichs mit einer Genauigkeit von 100 % darstellen kann. Daher können geringfügige Unterschiede in der Genauigkeit auftreten, wenn bestimmte Dezimalzahlen dargestellt werden. |
Feste Dezimalzahl | ![]() |
Dieser Datentyp wird auch als Währungstyp bezeichnet und verfügt über einen festen Speicherort für das Dezimaltrennzeichen. Rechts vom Dezimaltrennzeichen befinden sich immer vier Stellen, insgesamt sind 19 signifikante Stellen möglich. Der größte Wert, der auf diese Weise dargestellt werden kann, ist 922.337.203.685.477,5807 (positiv oder negativ). Im Gegensatz zu Dezimalzahlen ist der Typ Feste Dezimalzahl immer genau und daher in Fällen nützlich, in denen die Ungenauigkeit der Gleitkommanotation zu Fehlern führen kann. |
Ganze Zahl | ![]() |
Stellt einen 64-Bit-Ganzzahlwert (acht Byte) dar. Da es sich um eine ganze Zahl handelt, enthält sie keine Ziffern rechts neben der Dezimalstelle. Es ermöglicht 19 Ziffern; positive oder negative ganze Zahlen zwischen –9.223.372.036.854.775.807 (–2^63+1) und 9.223.372.036.854.775.806 (2^63–2). Damit kann die größtmögliche Genauigkeit der verschiedenen numerischen Datentypen dargestellt werden. Wie beim Typ Feste Dezimalzahl kann der Typ Ganze Zahl nützlich sein, wenn Sie die Rundung steuern müssen. |
Percentage | ![]() |
Grundsätzlich identisch mit einem Dezimalzahlentyp, aber er verfügt über eine Maske zum Formatieren der Werte in der Spalte als Prozentsatz im fenster Power Query-Editor. |
Datum/Uhrzeit | ![]() |
Stellt sowohl einen Datums- als auch einen Uhrzeitwert dar. Unterhalb der Abdeckung wird der Wert für Datum/Uhrzeit als Dezimalzahl-Typ gespeichert, sodass Sie tatsächlich zwischen den beiden konvertieren können. Der Uhrzeitteil eines Datums wird als Bruchteil von ganzen Vielfachen von 1/300 Sekunden (3,33 ms) gespeichert. Daten zwischen den Jahren 1900 und 9999 werden unterstützt. |
Date | ![]() |
Stellt nur ein Datum (kein Zeitteil) dar. Bei der Konvertierung in das Modell entspricht ein Datum einem Datum/Uhrzeitwert mit 0 (null) für den Bruchteilwert. |
Time | ![]() |
Stellt nur die Uhrzeit (kein Datumsteil) dar. Bei der Konvertierung in das Modell entspricht ein Uhrzeitwert einem Datum/Uhrzeit-Wert ohne Ziffern links vom Dezimaltrennzeichen. |
Datum/Uhrzeit/Zeitzone | ![]() |
Stellt ein UTC-Datum/Uhrzeit mit einem Zeitzonenoffset dar. Es wird in Datum/Uhrzeit konvertiert, wenn es in das Modell geladen wird. |
Dauer | ![]() |
Stellt eine Dauer dar, die beim Laden in das Modell in einen Dezimalzahltyp konvertiert wird. Als Dezimalzahltyp kann er einem Datums-/Uhrzeitfeld mit korrekten Ergebnissen hinzugefügt oder subtrahiert werden. Da es sich um einen Dezimalzahlentyp handelt, können Sie ihn problemlos in Visualisierungen verwenden, die die Größe anzeigen. |
Binär (Binary) | ![]() |
Der Datentyp „Binary“ kann zum Darstellen beliebiger anderer Daten mit einem Binärformat verwendet werden. |
Alle | ![]() |
Der Datentyp Any ist der Status, der einer Spalte ohne explizite Datentypdefinition zugewiesen wird. Any ist der Datentyp, der alle Werte klassifiziert. Es wird empfohlen, die Spaltendatentypen für Ihre Abfragen aus unstrukturierten Quellen immer explizit zu definieren und spalten mit dem Datentyp Any als Ausgabe ihrer Abfrage zu vermeiden. |
Datentyperkennung
Die Datentyperkennung erfolgt automatisch, wenn eine Verbindung mit hergestellt wird:
Strukturierte Datenquellen wie Datenbanken Power Query liest das Tabellenschema aus der Datenquelle und zeigt die Daten automatisch an, indem für jede Spalte der richtige Datentyp verwendet wird.
Unstrukturierte Quellen wie Excel, CSV und Textdateien, Power Query erkennt Datentypen automatisch, indem die Werte in der Tabelle überprüft werden. Standardmäßig ist die automatische Datentyperkennung in Power Query für unstrukturierte Quellen aktiviert.
Sie können auch den Befehl Datentyp erkennen in der Gruppe Beliebige Spalten auf der Registerkarte Transformieren verwenden, um die Datentypen der Spalten in der Tabelle automatisch zu erkennen.
Definieren eines Spaltendatentyps
Sie können den Datentyp einer Spalte an vier Stellen definieren oder ändern:
Auf der Registerkarte Start in der Gruppe Transformieren im Dropdownmenü Datentyp .
Auf der Registerkarte Transformieren in der Gruppe Beliebige Spalten im Dropdownmenü Datentyp .
Indem Sie das Symbol links neben der Spaltenüberschrift auswählen.
Klicken Sie im Kontextmenü der Spalte unter Typ ändern.
Automatische Erkennung von Spaltendatentyp und Headern
Diese Einstellung gilt speziell für unstrukturierte Quellen. Es hilft Ihnen, indem Sie Spaltentypen und Header basierend auf den ersten 200 Zeilen ihrer Tabelle automatisch überprüfen und erkennen. Wenn diese Einstellung aktiviert ist, fügt Power Query Ihrer Abfrage automatisch zwei Schritte hinzu:
- Höherstufen von Spaltenüberschriften: Höherstuft die erste Zeile der Tabelle als Spaltenüberschrift herauf.
- Geänderter Typ: Konvertiert die Werte aus dem Datentyp Any basierend auf der Überprüfung der Werte aus jeder Spalte in einen Datentyp.
Diese Einstellung ist standardmäßig aktiviert. Um diese Einstellung zu deaktivieren oder zu aktivieren, führen Sie die Schritte aus, die für Ihre Power Query Erfahrung gelten.
So konfigurieren Sie die automatische Datentyperkennung in Power Query Online
Wählen Sie auf der Registerkarte Startdie Option Optionen und dann Projektoptionen aus. Aktivieren Sie im Fenster Projektoptionen das Kontrollkästchen Spaltentypen und Header für unstrukturierte Quellen automatisch erkennen .
So konfigurieren Sie die automatische Datentyperkennung in Power Query für Desktop
Sie können dieses Verhalten sowohl auf globaler als auch auf dateibezogener Ebene im Fenster Optionen definieren (wählen Sie im Power Query-Editor auf der Registerkarte DateiOptionen und Einstellungen>Optionen aus.
Global: Wählen Sie im linken Bereich unter Globaldie Option Datenladevorgang aus. Im rechten Bereich unter Typerkennung können Sie eine von drei Typerkennungskonfigurationen auswählen, die auf jede neu in Ihrer Anwendung erstellte Datei angewendet wird:
- Spaltentypen und Header für unstrukturierte Quellen immer erkennen
- Erkennen von Spaltentypen und Headern für unstrukturierte Quellen gemäß den Einstellungen jeder Datei
- Nie Spaltentypen und Header für unstrukturierte Quellen erkennen
Aktuelle Datei: Wählen Sie im linken Bereich unter Aktuelle Dateidie Option Daten laden aus. Wählen Sie im rechten Bereich unter Typerkennung aus, ob Sie die Typerkennung für die aktuelle Datei aktivieren oder deaktivieren möchten.
Dokument- oder Projektgebietsschema
Power Query behandelt zwei verschiedene Komponenten, die das Aussehen und die Interpretation der Dinge verwalten:
- Lokalisierung: Die Komponente, die Power Query angibt, in welcher Sprache sie angezeigt werden soll.
- Globalisierung: Die Komponente, die neben der Interpretation von Textwerten auch die Formatierung der Werte behandelt.
Gebietsschema ist ein einzelner Wert, der sowohl die Lokalisierungs- als auch die Globalisierungskomponenten enthält. Das Gebietsschema wird verwendet, um Textwerte zu interpretieren und in andere Datentypen zu konvertieren. Das Gebietsschema Englisch (USA) bedeutet beispielsweise, dass die Lokalisierung in USA Englisch erfolgt und die Globalisierung oder das Format des Werts auf den standards basiert, die in der USA verwendet werden.
Wenn Power Query einen Spaltendatentyp definiert oder von einem Datentyp in einen anderen konvertiert, muss er die zu konvertierenden Werte interpretieren, bevor er sie in einen anderen Datentyp transformieren kann.
In Power Query Online wird diese Interpretation in Den Projektoptionen unter Gebietsschema definiert.
In Power Query für Desktop erkennt Power Query automatisch das regionale Format Ihres Betriebssystems und verwendet es, um die Werte für die Datentypkonvertierung zu interpretieren. Um diese Gebietsschemakonfiguration außer Kraft zu setzen, öffnen Sie das Abfrageoptionenfenster , und wählen Sie im linken Bereich unter Aktuelle Dateidie Option Regionale Einstellungen aus. Von hier aus können Sie das Gebietsschema in die gewünschte Einstellung ändern.
Diese Gebietsschemaeinstellung ist wichtig für die Interpretation von Textwerten in einen bestimmten Datentyp. Angenommen, Sie haben Ihr Gebietsschema als Englisch (USA) festgelegt, aber eine Spalte in einer Ihrer CSV-Dateien weist Datumsangaben im Format "Tag/Monat/Jahr" des Vereinigten Königreichs auf.
Wenn Sie versuchen, den Datentyp der Spalte Date auf Date festzulegen, erhalten Sie Fehlerwerte.
Diese Fehler treten auf, weil das verwendete Gebietsschema versucht, das Datum im englischen Format (USA) zu interpretieren, das Monat/Tag/Jahr ist. Da der Kalender keinen Monat 22 enthält, verursacht dies einen Fehler.
Anstatt einfach den Datentyp Datum auszuwählen, können Sie mit der rechten Maustaste auf die Spaltenüberschrift klicken, Typ ändern und dann Gebietsschema verwenden auswählen.
Wählen Sie im Dialogfeld Spaltentyp mit Gebietsschema ändern den Datentyp aus, den Sie festlegen möchten, wählen Sie aber auch das zu verwendende Gebietsschema aus, das in diesem Fall Englisch (Vereinigtes Königreich) sein muss.
Mithilfe dieses Gebietsschemas können Power Query Werte richtig interpretieren und in den richtigen Datentyp konvertieren.
.
So überprüfen Sie die Enddatumswerte
Die Formatierung der Werte wird durch den Globalisierungswert gesteuert. Wenn Sie Zweifel an dem von Power Query angezeigten Wert haben, können Sie die Konvertierung von Datumswerten überprüfen, indem Sie neue Spalten für den Tag, Monat und Jahr aus dem Wert hinzufügen. Wählen Sie hierzu die Spalte Datum aus, und wechseln Sie im Menüband zur Registerkarte Spalte hinzufügen . In der Spaltengruppe Datum und Uhrzeit werden die Optionen für eine Datumsspalte angezeigt.
Von hier aus können Sie Teile des Datumswerts extrahieren, z. B. die Jahreszahl, die Monatszahl, die Tagesnummer oder noch mehr Spalten, die aus der Spalte Date extrahiert wurden.
Mithilfe dieser Spalten können Sie überprüfen, ob Ihr Datumswert ordnungsgemäß konvertiert wurde.
Datentypkonvertierungsmatrix
Die folgende Matrix soll Ihnen einen schnellen Einblick in die Machbarkeit der Datentypkonvertierung eines Werts von einem Datentyp in einen anderen geben.
Hinweis
Die Konvertierung in dieser Matrix beginnt mit dem ursprünglichen Datentyp in der Spalte Datentypen . Jedes Ergebnis einer Konvertierung in den neuen Typ wird in der Zeile des ursprünglichen Datentyps angezeigt.
Datentypen | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
---|---|---|---|---|---|---|---|---|---|---|---|
![]() |
— | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
— | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
— | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
— | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
— | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
— | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
— | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
— | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
— | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
— | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
— |
Symbol | BESCHREIBUNG |
---|---|
![]() |
Möglich |
![]() |
Nicht möglich |
![]() |
Möglich, aber dem ursprünglichen Wert werden Werte hinzugefügt. |
![]() |
Möglich, aber es schneidet den ursprünglichen Wert ab. |