Muistiinpano
Tämän sivun käyttö edellyttää valtuutusta. Voit yrittää kirjautua sisään tai vaihtaa hakemistoa.
Tämän sivun käyttö edellyttää valtuutusta. Voit yrittää vaihtaa hakemistoa.
Fabric Runtime tarjoaa saumattoman integraation Microsoft Fabricin ekosysteemissä, tarjoten vahvan ympäristön data-insinööri- ja data-analytiikkaprojekteille, joita tukee Apache Spark.
Tässä artikkelissa esitellään Fabric Runtime 2.0 Public Preview, uusin Microsoft Fabricin big data -laskentaan suunniteltu ajonaikainen. Se korostaa keskeisiä ominaisuuksia ja komponentteja, jotka tekevät tästä julkaisusta merkittävän askeleen eteenpäin skaalautuvan analytiikan ja edistyneiden työkuormien saralla.
Fabric Runtime 2.0 sisältää seuraavat komponentit ja päivitykset, jotka on suunniteltu parantamaan datankäsittelykykyäsi:
- Apache Spark 4.0
- Käyttöjärjestelmä: Azure Linux 3.0 (Mariner 3.0)
- Java: 21
- Scala: 2.13
- Python: 3.12
- Delta-järvi: 4,0
- R: 4.5.2
Vinkki
Fabric Runtime 2.0 sisältää tuen Native Execution Enginelle, joka voi merkittävästi parantaa suorituskykyä ilman lisäkustannuksia. Voit ottaa natiivisuoritusmoottorin käyttöön ympäristötasolla, jolloin kaikki työt ja muistikirjat perivät automaattisesti parannetut suorituskykyominaisuudet.
Ota käyttöön Runtime 2.0
Voit ottaa Runtime 2.0:n käyttöön joko työtilan tasolla tai ympäristön kohdetasolla. Käytä työtilan asetusta soveltaaksesi Runtime 2.0:aa oletusarvona kaikille Spark-työkuormille työtilassasi. Vaihtoehtoisesti voit luoda ympäristökohteen Runtime 2.0:lla käytettäväksi tiettyjen muistikirjojen tai Spark-työn määritelmien kanssa, joka ohittaa työtilan oletusarvon.
Ota Runtime 2.0 käyttöön Workspace-asetuksissa
Asetetaan Runtime 2.0 oletuseksi koko työtilallesi:
Siirry Workspace-asetuksiin Fabric-työtilassasi.
Valitse Data Engineering/Science -välilehti ja valitse sitten Spark settings.
Valitse Ympäristö-välilehti .
Runtime-version pudotusvalikosta valitse 2.0 Public Preview (Spark 4.0, Delta 4.0) ja tallenna muutokset.
Runtime 2.0 on asetettu oletusajonaikaksi työtilallesi.
Ota käyttöön Runtime 2.0 Ympäristö-kohteessa
Käyttääksesi Runtime 2.0:aa tiettyjen muistikirjojen tai Spark-tehtävämääritelmien kanssa:
Luo uusi Ympäristö-kohde tai avaa olemassa oleva.
Runtime-pudotusvalikosta valitse 2.0 Public Preview (Spark 4.0, Delta 4.0) ja
Publishmuutokset.SaveSeuraavaksi voit käyttää tätä Ympäristö-esinettä sinun
NotebooktaiSpark Job Definition-merkin kanssa.
Voit nyt alkaa kokeilla Fabric Runtime 2.0:n uusimpia parannuksia ja toimintoja (Spark 4.0 ja Delta Lake 4.0).
Note
WASB-protokolla General Purpose v2 (GPv2) Azure Storage -tileille on vanhentunut. Sinun tulisi käyttää uusinta ABFS-protokollaa GPv2-tallennustileistä lukemiseen ja kirjoittamiseen.
Julkinen esiversio
Fabric Runtime 2.0:n julkinen esikatseluvaihe antaa pääsyn uusiin ominaisuuksiin ja API-rajapintoihin sekä Spark 4.0:sta että Delta Lake 4.0:sta. Esikatselu antaa sinun käyttää uusimmat Spark- ja Delta-pohjaiset parannukset heti sekä varmistaa sujuvan valmiuden ja siirtymän parannetuille muutoksille, kuten uudemmille Java-, Scala- ja Python-versioille.
Vinkki
Saat ajan tasalla olevat tiedot, yksityiskohtaisen luettelon muutoksista ja Fabric-suorituspalvelun erityisistä julkaisutiedoista tarkistamalla Spark Runtimes -julkaisut ja -päivitykset ja tilaamalla ne.
Tärkeimmät tiedot
Apache Spark 4.0
Apache Spark 4.0 merkitsee merkittävää virstanpylvästä 4.x-sarjan ensimmäisenä julkaisuna, ilmentäen vilkkaan avoimen lähdekoodin yhteisön yhteistä ponnistusta.
Tässä versiossa Spark SQL on merkittävästi rikastettu tehokkailla uusilla ominaisuuksilla, jotka on suunniteltu lisäämään SQL-työkuormien ilmaisukykyä ja monipuolisuutta, kuten VARIANT-tietotyyppien tuki, SQL-käyttäjän määrittelemät funktiot, istuntomuuttujat, putkisyntaksi ja merkkijonojen kokoaminen. PySpark sitoutuu jatkuvasti sekä toiminnalliseen laajuuteen että kehittäjäkokemukseen, tuoden mukanaan natiivin piirto-API:n, uuden Python Data Source API:n, tuen Python UDTF:ille ja yhtenäisen profiloinnin PySpark UDF:ille sekä lukuisia muita parannuksia. Strukturoitu suoratoisto kehittyy tärkeiden lisäysten myötä, jotka tarjoavat paremman hallinnan ja helpomman virheenkorjauksen, erityisesti Arbitrary State API v2:n käyttöönoton myötä joustavampaan tilanhallintaan sekä State Data Sourcen myötä helpompaan virheenkorjaukseen.
Voit tarkistaa täydellisen luettelon ja yksityiskohtaiset muutokset täältä: https://spark.apache.org/releases/spark-release-4-0-0.html.
Note
Spark 4.0:ssa SparkR on vanhentunut ja se voidaan poistaa tulevassa versiossa.
Delta Lake 4.0
Delta Lake 4.0 merkitsee yhteistä sitoutumista tehdä Delta Lakesta yhteensopiva eri formaateissa, helpompi työskennellä ja suorituskykyisempi. Delta 4.0 on merkkipaalujulkaisu, joka on täynnä tehokkaita uusia ominaisuuksia, suorituskyvyn optimointeja ja perustavanlaatuisia parannuksia avoimen datan järvenrakennusten tulevaisuudelle.
Voit tarkistaa koko listan ja yksityiskohtaiset muutokset, jotka on tehty Delta Lake 3.3:n ja 4.0:n myötä, täältä: https://github.com/delta-io/delta/releases/tag/v3.3.0. https://github.com/delta-io/delta/releases/tag/v4.0.0.
Tärkeää
Delta Lake 4.0:n erityisominaisuudet ovat kokeellisia ja toimivat vain Spark-kokemuksissa, kuten muistikirjoissa ja Spark-työmääritteluissa. Jos sinun täytyy käyttää samoja Delta Lake -taulukoita useissa Microsoft Fabricin työkuormissa, älä ota näitä ominaisuuksia käyttöön. Jos haluat tietää lisää siitä, mitkä protokollaversiot ja -ominaisuudet ovat yhteensopivia kaikissa Microsoft Fabric -käyttökokemuksissa, lue Delta Lake -taulukkomuotojen yhteentoimivuus.