Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
Ha külső vagy egyéni kódot szeretne elérhetővé tenni a számítási erőforrásokon futó jegyzetfüzetek és feladatok számára, telepíthet egy tárat. A kódtárak Python, Java, Scala és R nyelven írhatók. Feltölthet Python, Java és Scala-kódtárakat, és külső csomagokra mutathat PyPI-, Maven- és CRAN-adattárakban.
Azure Databricks számos gyakori kódtárat tartalmaz a Databricks Runtime-ban. Ha meg szeretné tekinteni, hogy mely kódtárakat tartalmazza a Databricks Runtime, azt az adott Databricks Runtime-verzió Databricks Runtime kiadási megjegyzéseinekRendszerkörnyezet alszakaszában teheti meg.
Megjegyzés
Microsoft Support segít elkülöníteni és megoldani a Azure Databricks által telepített és karbantartott kódtárak problémáit. A harmadik féltől származó összetevők, köztük a kódtárak esetében a Microsoft kereskedelmi szempontból ésszerű támogatást nyújt a problémák további elhárításához. Microsoft Support segítséget nyújt a lehetőségeihez képest a legjobb módon, és lehetséges, hogy meg tudja oldani a problémát. A Githubon üzemeltetett open source összekötők és projektek esetében javasoljuk, hogy jelentse be a problémákat a GitHubon, és kövesse nyomon őket. Az olyan fejlesztési erőfeszítések, mint az árnyékoló jarok vagy a Python-kódtárak létrehozása nem támogatottak a szabványos támogatási esetbeküldési folyamattal: a gyorsabb megoldáshoz tanácsadási előjegyzésre van szükség. A támogatás kérheti, hogy más csatornákat is bevonjon a nyílt forráskódú technológiákba, ahol mély szakértelemmel rendelkezik ehhez a technológiához. Számos közösségi oldal létezik; két példa:
Számítási hatókörű könyvtárak
A kódtárakat telepítheti egy számítási erőforrásra, hogy a számításon futó összes jegyzetfüzet és feladat használni tudja őket. A Databricks támogatja Python, JAR és R kódtárakat. Lásd Számítási hatókörű könyvtárak.
A számítási hatókörű kódtárakat közvetlenül a következő forrásokból telepítheti:
- Csomagtárház, például PyPI, Maven vagy CRAN
- Munkaterület fájljai
- Unity Catalog tárolóegységek
- Felhőobjektum-tárolóhely
- Elérési út a helyi gépen
Nem minden hely támogatott minden típusú kódtárhoz vagy számítási konfigurációhoz. A konfigurációs javaslatokhoz tekintse meg a kódtárak feltöltésére vonatkozó javaslatokat.
Fontos
A kódtárak a DBFS-ből telepíthetők a Databricks Runtime 14.3 LTS és korábbi verziói használatakor. A munkaterület bármely felhasználója módosíthatja azonban a DBFS-ben tárolt kódtárfájlokat. A tárak Azure Databricks munkaterületen való biztonságának javítása érdekében a tárfájlok dbFS-gyökérben való tárolása alapértelmezés szerint elavult és le van tiltva a Databricks Runtime 15.1-ben és újabb verzióiban. Lásd: A tárak tárolása a DBFS-gyökérben alapértelmezés szerint elavult és le van tiltva.
Ehelyett a Databricks javasolja, hogy töltsük fel az összes könyvtárat, beleértve a Python könyvtárakat, JAR-fájlokat és Spark-összekötőket, a munkaterület fájljaiba vagy a Unity Catalog-kötetekbe, vagy használják a tárcsomag adattárakat. Ha a számítási feladat nem támogatja ezeket a mintákat, a felhőobjektum-tárolóban tárolt kódtárakat is használhatja.
A teljes erőforrástár-támogatási információkért lásd: Python kódtár támogatása, Java és Scala-kódtárak támogatása és R-kódtár támogatása.
Javaslatok tárak feltöltéséhez
A Databricks támogatja a Python, JAR és R kódtárak legtöbb konfigurációs telepítését, de vannak nem támogatott forgatókönyvek. Javasoljuk, hogy tárakat töltsön fel olyan forráshelyekre, amelyek támogatják a számításra való telepítést standard hozzáférési móddal (korábban megosztott hozzáférési móddal), mivel ez az ajánlott mód az összes számítási feladathoz. Lásd: Hozzáférési módok. Amikor standard hozzáférési módban ütemezi a feladatokat, futtassa a feladatot egy szolgáltatásazonosítóval.
Fontos
Csak akkor használja a számítást dedikált hozzáférési móddal (korábban egyfelhasználós hozzáférési mód), ha a standard hozzáférési mód nem támogatja a szükséges funkciókat. Az elkülönítés nélküli megosztott hozzáférési mód egy elavult konfiguráció a Databricksen, amely nem ajánlott.
Az alábbi táblázat a Databricks Runtime-verziók és a Unity Catalog engedélyezése szerinti javaslatokat tartalmazza.
| Konfiguráció | Ajánlás |
|---|---|
| Databricks Runtime 13.3 LTS és újabb verzió a Unity Catalog használatával | Telepítse a könyvtárakat a számítón, a standard hozzáférési móddal a Unity Katalógus meghajtóiról, biztosítva az OLVASÁST a szükséges felhasználóknak. Ha lehetséges, a Maven-koordinátákat és a JAR-kódtár elérési útjait hozzá kell adni az engedélyezési listához. |
| Databricks Runtime 11.3 LTS és újabb verzió Unity Catalog nélkül | Könyvtárak telepítése munkaterületfájlokból. (A fájlméret korlátja 500 MB.) |
| Databricks Runtime 10.4 LTS és korábbi | Könyvtárak telepítése a felhőtárhelyből. |
Python kódtár támogatása
Az alábbi táblázat a Databricks Runtime verziók kompatibilitását mutatja a Python wheel fájlok esetében a különböző számítási hozzáférési módoknál, a könyvtár forráshelyétől függően. Lásd a Databricks Runtime kibocsátási megjegyzéseinek verzióit, valamint a kompatibilitási és hozzáférési módokat.
A Databricks Runtime 15.0-s és újabb verziója requirements.txt fájlok használatával kezelheti Python függőségeit. Ezek a fájlok bármely támogatott forráshelyre feltölthetők.
Megjegyzés
A Python egg fájlok telepítése csak a Databricks Runtime 13.3 LTS-en és az annál korábbi verziókban támogatott, és csak dedikált vagy elszigetelés nélküli megosztott hozzáférési módokban. Ezenkívül nem telepíthet Python tojásfájlokat kötetekre vagy munkaterületfájlokra. Használjon Python kerékfájlokat, vagy telepítse a csomagokat a PyPI-ból.
| Standard hozzáférési mód | Dedikált hozzáférési mód | Nincs elkülönített megosztott hozzáférési mód (Örökölt) | |
|---|---|---|---|
| PyPI | 13.3 LTS és újabb | Minden támogatott Databricks-runtime verzió | Minden támogatott Databricks-runtime verzió |
| Munkaterület fájljai | 13.3 LTS és újabb | 13.3 LTS és újabb | 14.1 vagy újabb |
| kötetek | 13.3 LTS és újabb | 13.3 LTS és újabb | Nem támogatott |
| Felhőtárhely | 13.3 LTS és újabb | Minden támogatott Databricks-runtime verzió | Minden támogatott Databricks-runtime verzió |
| DBFS (Nem ajánlott) | Nem támogatott | 14.3 és korábbi | 14.3 és korábbi |
Java és Scala-kódtár támogatása
Az alábbi táblázat a JAR-fájlok Databricks Runtime-verziókompatibilitását jelzi a tár forráshelyétől függően különböző számítási hozzáférési módokhoz. Lásd a Databricks Runtime kibocsátási megjegyzéseinek verzióit, valamint a kompatibilitási és hozzáférési módokat.
A Scala JAR-fájlok unitykatalógus-kompatibilis fürtökön standard hozzáférési módban való üzembe helyezéséről az oktatóanyagban talál további információt : Scala-kód futtatása kiszolgáló nélküli számításon. Vegye figyelembe, hogy a Unity Catalog standard fürtjeiben a JAR könyvtárak osztályainak nevesített csomagban kell lenniük, például com.databricks.MyClass, különben a könyvtár importálása során hibák léphetnek fel.
Megjegyzés
A standard hozzáférési mód megköveteli, hogy a rendszergazda Maven-koordinátákat és elérési utakat adjon hozzá a JAR-kódtárakhoz egy #B0. Lásd a standard hozzáférési módú (korábban megosztott hozzáférési módú) számítógép engedélyezési könyvtárakat és initszkripteket.
| Standard hozzáférési mód | Dedikált hozzáférési mód | Nincs elkülönített megosztott hozzáférési mód (Örökölt) | |
|---|---|---|---|
| Maven | 13.3 LTS és újabb | Minden támogatott Databricks-runtime verzió | Minden támogatott Databricks-runtime verzió |
| Munkaterület fájljai | Nem támogatott | Nem támogatott | 14.1 vagy újabb |
| kötetek | 13.3 LTS és újabb | 13.3 LTS és újabb | Nem támogatott |
| Felhőtárhely | 13.3 LTS és újabb | Minden támogatott Databricks-runtime verzió | Minden támogatott Databricks-runtime verzió |
| DBFS (Nem ajánlott) | Nem támogatott | 14.3 és korábbi | 14.3 és korábbi |
R-kódtár támogatása
Az alábbi táblázat a Databricks Runtime verziókompatibilitását jelzi a CRAN-csomagokhoz különböző számítási hozzáférési módokhoz. Lásd a Databricks Runtime kibocsátási megjegyzéseinek verzióit, valamint a kompatibilitási és hozzáférési módokat.
| Standard hozzáférési mód | Dedikált hozzáférési mód | Nincs elkülönített megosztott hozzáférési mód (Örökölt) | |
|---|---|---|---|
| CRAN | Nem támogatott | Minden támogatott Databricks-runtime verzió | Minden támogatott Databricks-runtime verzió |
Telepítő identitása
Amikor munkaterületfájlokból vagy Unity-katalóguskötetekből telepít tárat, a számítási hozzáférési módtól függően identitás társítható a telepítéshez. Az identitásnak olvasási hozzáféréssel kell rendelkeznie a tárolófájlhoz.
| Standard hozzáférési mód | Dedikált hozzáférési mód | Nincs elkülönített megosztott hozzáférési mód (Örökölt) |
|---|---|---|
| A tárat telepítő felhasználó identitása | A dedikált igazgató identitása | Nincs identitás |
Jegyzetfüzet-hatókörű könyvtárak
A Python és az R számára elérhető jegyzetfüzet-hatókörű kódtárak lehetővé teszik a tárak telepítését és a jegyzetfüzet-munkamenetek hatókörébe tartozó környezet létrehozását. Ezek a könyvtárak nem érintik az ugyanazon a számítási erőforráson futó többi jegyzetfüzetet. A jegyzetfüzet-hatókörű kódtárak nem maradnak fenn, és minden munkamenethez újra kell őket telepíteni. Jegyzetfüzet-hatókörű könyvtárakat akkor használjon, ha egyéni környezetre van szüksége egy adott jegyzetfüzethez.
Megjegyzés
A JAR-ek nem telepíthetők a jegyzetfüzet szintjén.
Fontos
A munkaterületi könyvtárak elavultak és nem szabad őket használni. Lásd: Munkaterület-könyvtárak (régi típusú). A tárak munkaterületfájlokként való tárolása azonban eltér a munkaterület-táraktól, és továbbra is teljes mértékben támogatott. A munkaterületfájlként tárolt kódtárakat közvetlenül a számítási vagy feladatfeladatok végrehajtásához telepítheti.
Python környezetkezelés
Az alábbi táblázat áttekintést nyújt a Python kódtárak Azure Databricks való telepítéséhez használható lehetőségekről.
Megjegyzés
- Conda-alapú környezetet használó egyéni tárolók nem kompatibilisek a jegyzetfüzet-hatókörű és számítási kódtárakkal a Databricks Runtime 10.4 LTS-ben és felette. Ehelyett az Azure Databricks javasolja, hogy közvetlenül az image-re telepítse a kódtárakat, vagy inicializáló szkripteket használjon. Ha továbbra is szeretné használni a számítási könyvtárakat ezekben a forgatókönyvekben, beállíthatja a Spark konfigurációját
spark.databricks.driverNfs.clusterWidePythonLibsEnabled. A Spark-konfiguráció támogatása 2021. december 31-én vagy azt követően megszűnik.
| Python csomagforrás | Jegyzetfüzetre korlátozott könyvtárak a %pip segítségével | Jegyzetfüzet-hatókörű könyvtárak YAML-fájllal az alapkörnyezethez | Számítási hatókörű kódtárak | Feladattárak a Jobs API-val |
|---|---|---|---|---|
| PyPI | Használja az %pip install parancsot. Lásd ezt a példát. |
PyPI-csomagnév hozzáadása alapkörnyezeti YAML-fájlhoz. Lásd ezt a példát. | Válassza PyPI-t forrásként. | Adjon hozzá egy új pypi objektumot a feladatkódtárakhoz, majd adja meg a package mezőt. |
| Privát PyPI-tükör, például Nexus vagy Artifactory | Használja a %pip install parancsot az --index-url kapcsolóval. A Titkos kód kezelése elérhető. Lásd ezt a példát. |
Adja hozzá a -–index-url fájlt egy alapkörnyezeti YAML-fájlhoz. A Titkos kód kezelése elérhető. Lásd ezt a példát. |
Nem támogatott. | Nem támogatott. |
| VCS, például GitHub, nyers forrással | Használja a %pip install parancsot, és adja meg az adattár URL-címét a csomag neveként. Lásd ezt a példát. |
Adjon hozzá egy adattár URL-címét csomagnévként egy alapkörnyezeti YAML-fájlhoz. Lásd ezt a példát. | Válassza PyPI-t forrásként, és adja meg az adattár URL-címét csomagnévként. | Adjon hozzá egy új pypi objektumot a feladatkódtárakhoz, és adja meg az adattár URL-címét a package mezőként. |
| Privát VCS nyers forrással | Használja a %pip install parancsot, és adja meg az adattár URL-címét alapszintű hitelesítéssel a csomag neveként. A Titkos kód kezelése elérhető. Lásd ezt a példát. |
Adjon hozzá egy alapszintű hitelesítéssel rendelkező adattárat csomagnévként egy alapkörnyezeti YAML-fájlhoz. Lásd ezt a példát. | Nem támogatott. | Nem támogatott. |
| Fájl elérési útja | Használja az %pip install parancsot. Lásd ezt a példát. |
Adjon hozzá egy fájl elérési útját csomagnévként egy alapkörnyezeti YAML-fájlhoz. Lásd ezt a példát. | Válassza ki a Fájl elérési útját/ADLS forrásként. | Adjon hozzá egy új egg vagy whl objektumot a feladattárakhoz, és adja meg a fájl elérési útját mezőként package . |
| Azure Data Lake Storage | Használja %pip install együtt egy előre aláírt URL-címmel. Az Azure Data Lake Storage protokollal abfss:// elérési utak nem támogatottak. |
Adjon hozzá egy előre aláírt URL-címet csomagnévként egy alapkörnyezeti YAML-fájlhoz. Az Azure Data Lake Storage protokollal abfss:// elérési utak nem támogatottak. |
Válassza ki a Fájl elérési útját/ADLS forrásként. | Adjon hozzá egy új egg vagy whl objektumot a feladattárakhoz, és adja meg a Azure Data Lake Storage elérési utat package mezőként. |
Python könyvtár elsőbbsége
Előfordulhat, hogy felül kell bírálnia egy beépített kódtár verzióját, vagy olyan egyéni kódtárat kell létrehoznia, amely névben ütközik egy másik, a számítási erőforrásra telepített tárral. Amikor lefuttatod a import <library>-t, a nagy prioritású könyvtár importálásra kerül.
Fontos
A munkaterületfájlokban tárolt kódtárak különböző prioritásokkal rendelkeznek attól függően, hogyan adtuk hozzá őket a Python sys.path. A Databricks Git-mappa hozzáadja az aktuális munkakönyvtárat az összes többi tár előtti elérési úthoz, míg a Git-mappákon kívüli jegyzetfüzetek a többi tár telepítése után hozzáadják az aktuális munkakönyvtárat. Ha manuálisan fűzi hozzá a munkaterület-könyvtárakat az elérési úthoz, ezek mindig a legalacsonyabb elsőbbséget élvezik.
Az alábbi lista a legmagasabbtól a legalacsonyabbig sorolja a prioritást. Ebben a listában az alacsonyabb szám nagyobb elsőbbséget jelent.
- Az aktuális munkakönyvtár könyvtárai (csak Git-mappák).
- A Git-mappa gyökérkönyvtárában lévő kódtárak (csak Git-mappák).
- A jegyzetfüzet-hatókörű kódtárak (
%pip installjegyzetfüzetekben). - Számítási hatókörű könyvtárak (a felhasználói felület, a parancssori felület vagy az API használatával).
- A Databricks Runtime-ban található könyvtárak.
- Az init-szkriptekkel telepített kódtárak a beépített kódtárak előtt vagy után megoldódhatnak a telepítésük módjától függően. A Databricks nem javasolja a kódtárak init-szkriptekkel való telepítését.
- A jelenlegi munkakönyvtár könyvtárai (nem a Git mappákban).
- A munkaterület fájljai hozzáfűzve a
sys.path.