Hva er datateknikk i Microsoft Fabric?
Datautvikling i Microsoft Fabric gjør det mulig for brukere å utforme, bygge og vedlikeholde infrastrukturer og systemer som gjør det mulig for organisasjonene å samle inn, lagre, behandle og analysere store mengder data.
Viktig
Microsoft Fabric er i forhåndsversjon.
Microsoft Fabric tilbyr ulike funksjoner for datateknikk for å sikre at dataene dine er lett tilgjengelige, velorganiserte og av høy kvalitet. Fra hjemmesiden for datateknikk kan du:
Opprett og administrer dataene dine ved hjelp av et lakehouse
Utforme datasamlebånd for å kopiere data til lakehouse
Bruk Spark-jobbdefinisjoner til å sende jobbgruppe/strømming til Spark-klynge
Bruke notatblokker til å skrive kode for datainntak, forberedelse og transformasjon
Lakehouse
Lakehouses er dataarkitekturer som gjør det mulig for organisasjoner å lagre og administrere strukturerte og ustrukturerte data på ett enkelt sted, ved hjelp av ulike verktøy og rammeverk for å behandle og analysere disse dataene. Disse verktøyene og rammeverkene kan omfatte SQL-baserte spørringer og analyser, i tillegg til maskinlæring og andre avanserte analyseteknikker.
Jobbdefinisjon for Apache Spark
Spark-jobbdefinisjoner er sett med instruksjoner som definerer hvordan du utfører en jobb på en Spark-klynge. Den inneholder informasjon som inndata- og utdatadatakildene, transformasjonene og konfigurasjonsinnstillingene for Spark-programmet. Med Spark-jobbdefinisjon kan du sende jobbgruppe/strømming til Spark-klyngen, bruke annen transformasjonslogikk på dataene som ligger på lakehouse sammen med mange andre ting.
Notatblokk
Notatblokker er et interaktivt databehandlingsmiljø som gjør det mulig for brukere å opprette og dele dokumenter som inneholder direkte kode, formler, visualiseringer og fortellende tekst. De tillater brukere å skrive og kjøre kode på ulike programmeringsspråk, inkludert Python, R og Scala. Du kan bruke notatblokker for datainntak, forberedelse, analyse og andre datarelaterte oppgaver.
Datasamlebånd
Datasamlebånd er en serie med trinn som kan samle inn, behandle og transformere data fra råformen til et format som du kan bruke til analyse og beslutningstaking. De er en kritisk komponent i datateknikk, da de gir en måte å flytte data fra kilden til målet på en pålitelig, skalerbar og effektiv måte.
Neste trinn
Kom i gang med datateknikkopplevelsen:
Hvis du vil lære mer om lakehouses, kan du se Hva er et lakehouse i Microsoft Fabric?
Hvis du vil komme i gang med et lakehouse, kan du se Opprette et lakehouse i Microsoft Fabric.
Hvis du vil lære mer om jobbdefinisjoner for Apache Spark, kan du se Hva er en jobbdefinisjon for Apache Spark?
Hvis du vil komme i gang med en jobbdefinisjon for Apache Spark, kan du se Hvordan du oppretter en Jobbdefinisjon for Apache Spark i Fabric.
Hvis du vil lære mer om notatblokker, kan du se Forfatter og kjøre notatblokken.
Hvis du vil komme i gang med kopieringsaktivitet for samlebånd, kan du se Hvordan du kopierer data ved hjelp av kopieringsaktivitet.
Tilbakemeldinger
Send inn og vis tilbakemelding for