Betöltés Delta Lake-táblába
A Microsoft Fabric Lakehouse szolgáltatása lehetővé teszi a gyakori fájltípusok hatékony betöltését egy elemzésre kész optimalizált Delta-táblába. A Betöltés táblázatba funkcióval a felhasználók egyetlen fájlt vagy fájlmappát tölthetnek be egy táblába. Ez a funkció növeli az adatmérnökök termelékenységét azáltal, hogy lehetővé teszi számukra a jobb gombbal történő kattintást a fájlok és mappák táblázatbetöltésének engedélyezéséhez. A táblába való betöltés szintén kód nélküli felület, amely csökkenti az összes személy belépési sávját.
A Load to Table (Betöltés a táblázatba) képességek áttekintése
Az alábbiakban felsoroljuk azokat a funkciókat, amelyeket a táblázatos felület integrált terhelésében engedélyeztünk, hogy rugalmasságot biztosítsunk a felhasználóknak a termelékenység növelése mellett:
Támogatott fájltípusok: Ez a funkció jelenleg csak a PARQUET- vagy CSV-fájltípusok betöltését támogatja. A fájlkiterjesztési eset nem számít.
Egyfájlos betöltés: A felhasználók a fájl helyi menüműveletében a "Betöltés deltatáblába" lehetőséget választva betölthetnek egy tetszőleges fájlt a támogatott formátumok egyikében.
Mappaszintű betöltés: A mappában és almappáiban lévő összes fájlt egyszerre töltheti be a "Betöltés a Delta-táblázatba" lehetőség kiválasztásával, miután rákattintott egy mappára. Ez a funkció automatikusan bejárja az összes fájlt, és betölti őket egy Delta-táblába. Fontos megjegyezni, hogy csak az azonos típusú fájlok tölthetők be egyszerre egy táblába.
Betöltés új és meglévő táblába: A felhasználó dönthet úgy, hogy egy új táblába vagy egy tetszőleges meglévő táblába tölti be a fájljait és mappáit. Ha úgy döntenek, hogy betöltenek egy meglévő táblába, lehetősége van arra, hogy hozzáfűzzék vagy felülírják az adataikat a táblában.
CSV-forrásfájl lehetőség: CSV-fájlok esetén lehetővé tesszük a felhasználó számára, hogy megadja, hogy a forrásfájl tartalmaz-e oszlopnévként használni kívánt fejléceket. A felhasználók megadhatnak egy elválasztót is, amely felülbírálja az alapértelmezett vesszőelválasztót.
Delta-táblákként töltve: A táblák mindig a Delta Lake táblaformátummal töltődnek be, és engedélyezve van a V-Order optimalizálás.
Érvényesítési irányelvek és szabályok
A következő szabvány a Terhelés táblára felületre vonatkozik:
A táblanevek csak alfanumerikus karaktereket és aláhúzásjeleket tartalmazhatnak. Emellett bármilyen angol betűt, nagybetűt vagy kisbetűt és aláhúzásjelet (
_
) is engedélyez, legfeljebb 256 karakter hosszúságú. Nem engedélyezett kötőjel (-
) vagy szóköz karakter.Az oszlopfejléceket nem tartalmazó szövegfájlokat a táblaoszlopok neveként szabványos
col#
jelöléssel helyettesíti a rendszer.Az oszlopnevek bármely angol betűt, nagybetűt vagy kisbetűt, aláhúzásjelet (
_
) és más nyelven (például kínait UTF-ben) tartalmazhatnak , legfeljebb 32 karakter hosszúságúak. Az oszlopnevek érvényesítése a terhelési művelet során megtörténik. A Load to Delta algoritmus a tiltott értékeket alulsávra (_
) cseréli. Ha az ellenőrzés során nem érhető el megfelelő oszlopnév, a terhelési művelet meghiúsul.CSV-fájlok esetén az elválasztó nem lehet üres, nem lehet hosszabb 8 karakternél, és nem használhatja a következő karakterek egyikét:
(
,)
, ,]
[
, ,{
}
egyszeri idézőjel ('
), dupla idézőjel ("
) és szóköz.
Kapcsolódó tartalom
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: