Gegevens ophalen uit bestand
Gegevensopname is het proces dat wordt gebruikt om gegevens uit een of meer bronnen in een tabel in Azure Data Explorer te laden. Zodra de gegevens zijn opgenomen, worden ze beschikbaar voor query's. In dit artikel leert u hoe u gegevens uit een lokaal bestand in een nieuwe of bestaande tabel kunt ophalen.
Zie Overzicht van gegevensopname in Azure Data Explorer voor algemene informatie over gegevensopname.
Vereisten
- Een Microsoft-account of een Microsoft Entra gebruikersidentiteit. Er is geen Azure-abonnement vereist.
- Meld u aan bij de azure Data Explorer-webinterface.
- Een Azure Data Explorer-cluster en -database. Maak een cluster en database.
Gegevens ophalen
Selecteer Query in het linkermenu.
Klik met de rechtermuisknop op de database waarin u de gegevens wilt opnemen. Selecteer Gegevens ophalen.
Bron
In het venster Gegevens ophalen is het tabblad Bron geselecteerd.
Selecteer de gegevensbron in de lijst met beschikbare gegevens. In dit voorbeeld neemt u gegevens op uit een lokaal bestand.
Notitie
Opname ondersteunt een maximale bestandsgrootte van 6 GB. Het wordt aanbevolen om bestanden tussen 100 MB en 1 GB op te nemen.
Configureren
Selecteer een doeldatabase en -tabel. Als u gegevens wilt opnemen in een nieuwe tabel, selecteert u + Nieuwe tabel en voert u een tabelnaam in.
Notitie
Tabelnamen kunnen maximaal 1024 tekens bevatten, inclusief spaties, alfanumerieke tekens, afbreekstreepjes en onderstrepingstekens. Speciale tekens worden niet ondersteund.
Sleep bestanden naar het venster of selecteer Bladeren naar bestanden.
Notitie
U kunt maximaal 1000 bestanden toevoegen. Elk bestand kan maximaal 1 GB ongecomprimeerd zijn.
Selecteer Volgende
Inspecteren
Het tabblad Inspecteren wordt geopend met een voorbeeld van de gegevens.
Selecteer Voltooien om het opnameproces te voltooien.
Optioneel:
- Selecteer Opdrachtviewer om de automatische opdrachten weer te geven en te kopiƫren die zijn gegenereerd op basis van uw invoer.
- Gebruik de vervolgkeuzelijst Schemadefinitiebestand om het bestand te wijzigen waaruit het schema wordt afgeleid.
- Wijzig de automatisch afgeleide gegevensindeling door de gewenste indeling te selecteren in de vervolgkeuzelijst. Zie Gegevensindelingen die worden ondersteund door Azure Data Explorer voor opname.
- Kolommen bewerken.
- Geavanceerde opties verkennen op basis van gegevenstype.
Kolommen bewerken
Notitie
- Voor tabellaire indelingen (CSV, TSV, PSV) kunt u een kolom niet tweemaal toewijzen. Als u wilt toewijzen aan een bestaande kolom, verwijdert u eerst de nieuwe kolom.
- U kunt een bestaand kolomtype niet wijzigen. Als u probeert toe te wijzen aan een kolom met een andere indeling, kunt u lege kolommen krijgen.
De wijzigingen die u in een tabel kunt aanbrengen, zijn afhankelijk van de volgende parameters:
- Tabeltype is nieuw of bestaand
- Toewijzingstype is nieuw of bestaand
Tabletype | Toewijzingstype | Beschikbare aanpassingen |
---|---|---|
Nieuwe tabel | Nieuwe toewijzing | Kolomnaam wijzigen, gegevenstype wijzigen, gegevensbron wijzigen, toewijzingstransformatie, kolom toevoegen, kolom verwijderen |
Bestaande tabel | Nieuwe toewijzing | Kolom toevoegen (waarop u vervolgens het gegevenstype kunt wijzigen, de naam kunt wijzigen en bijwerken) |
Bestaande tabel | Bestaande toewijzing | geen |
Toewijzingstransformaties
Sommige toewijzingen van gegevensindelingen (Parquet, JSON en Avro) ondersteunen eenvoudige opnametijdtransformaties. Als u toewijzingstransformaties wilt toepassen, maakt of werkt u een kolom bij in het venster Kolommen bewerken .
Toewijzingstransformaties kunnen worden uitgevoerd op een kolom van het type tekenreeks of datum/tijd, waarbij de bron het gegevenstype int of long heeft. Ondersteunde toewijzingstransformaties zijn:
- DateTimeFromUnixSeconds
- DateTimeFromUnixMilliseconds
- DateTimeFromUnixMicroseconds
- DateTimeFromUnixNanoseconds
Geavanceerde opties op basis van gegevenstype
Tabellair (CSV, TSV, PSV):
Als u tabelindelingen in een bestaande tabel opneemt, kunt u Geavanceerd>Huidig tabelschema behouden selecteren. Tabellaire gegevens bevatten niet noodzakelijkerwijs de kolomnamen die worden gebruikt om brongegevens toe te wijzen aan de bestaande kolommen. Wanneer deze optie is ingeschakeld, wordt de toewijzing op volgorde uitgevoerd en blijft het tabelschema hetzelfde. Als deze optie is uitgeschakeld, worden nieuwe kolommen gemaakt voor binnenkomende gegevens, ongeacht de gegevensstructuur.
Als u de eerste rij als kolomnamen wilt gebruiken, selecteert u Geavanceerd>Eerste rij is kolomkop.
JSON:
Als u de kolomverdeling van JSON-gegevens wilt bepalen, selecteert u Geavanceerde>geneste niveaus, tussen 1 en 100.
Als u Geavanceerd>Fouten in gegevensindeling negeren selecteert, worden de gegevens opgenomen in JSON-indeling. Als u dit selectievakje uitgeschakeld laat, worden de gegevens opgenomen in multijson-indeling.
Samenvatting
In het venster Gegevensvoorbereiding worden alle drie de stappen gemarkeerd met groene vinkjes wanneer de gegevensopname is voltooid. U kunt de opdrachten bekijken die voor elke stap zijn gebruikt of een kaart selecteren om de opgenomen gegevens op te vragen, te visualiseren of te verwijderen.