Κοινή χρήση μέσω


Ορολογία microsoft Fabric

Μάθετε τους ορισμούς των όρων που χρησιμοποιούνται στο Microsoft Fabric, συμπεριλαμβανομένων των όρων που αφορούν συγκεκριμένα τα Synapse Data Warehouse, Synapse Data Engineering, Synapse Data Science, Real-Time Intelligence, Data Factory και Power BI.

Γενικοί όροι

  • Εκχωρημένοι πόροι: Οι εκχωρημένοι πόροι είναι ένα αποκλειστικό σύνολο πόρων που είναι διαθέσιμο σε μια δεδομένη στιγμή για χρήση. Οι εκχωρημένοι πόροι καθορίζουν τη δυνατότητα ενός πόρου για την εκτέλεση μιας δραστηριότητας ή την παραγωγή εξόδου. Διαφορετικά στοιχεία καταναλώνουν διαφορετικούς εκχωρημένους πόρους σε μια συγκεκριμένη στιγμή. Το Fabric προσφέρει χωρητικότητα μέσω του SKU Fabric και δοκιμών. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Τι είναι οι εκχωρημένοι πόροι;

  • Εμπειρία: Μια συλλογή δυνατοτήτων που στοχεύουν σε μια συγκεκριμένη λειτουργικότητα. Οι εμπειρίες Fabric περιλαμβάνουν την Αποθήκη δεδομένων Synapse, τη Μηχανική δεδομένων Synapse, την Επιστήμη δεδομένων Synapse, τη Ευφυΐα σε πραγματικό χρόνο, το Data Factory και το Power BI.

  • Στοιχείο: Ένα στοιχείο ένα σύνολο δυνατοτήτων μέσα σε μια εμπειρία. Οι χρήστες μπορούν να τις δημιουργούν, να τις επεξεργάζονται και να τις διαγράφουν. Κάθε τύπος στοιχείου παρέχει διαφορετικές δυνατότητες. Για παράδειγμα, η εμπειρία της Μηχανικής δεδομένων περιλαμβάνει τα στοιχεία ορισμού εργασίας lakehouse, notebook και Spark.

  • Μισθωτής: Ένας μισθωτής είναι μια μοναδική παρουσία του Fabric για έναν οργανισμό και ευθυγραμμίζεται με ένα αναγνωριστικό Microsoft Entra.

  • Χώρος εργασίας: Ένας χώρος εργασίας είναι μια συλλογή από στοιχεία που συγκεντρώνουν διαφορετικές λειτουργίες σε ένα ενιαίο περιβάλλον που έχει σχεδιαστεί για συνεργασία. Λειτουργεί ως κοντέινερ που χρησιμοποιεί εκχωρημένους πόρους για την εργασία που εκτελείται και παρέχει στοιχεία ελέγχου για το ποιος μπορεί να έχει πρόσβαση στα στοιχεία σε αυτό. Για παράδειγμα, σε έναν χώρο εργασίας, οι χρήστες δημιουργούν αναφορές, σημειωματάρια, σημασιολογικά μοντέλα κ.λπ. Για περισσότερες πληροφορίες, ανατρέξτε στο άρθρο Χώροι εργασίας.

Διαχείριση δεδομένων Synapse

  • Lakehouse: Ένα lakehouse είναι μια συλλογή από αρχεία, φακέλους και πίνακες που αντιπροσωπεύουν μια βάση δεδομένων πάνω από μια λίμνη δεδομένων που χρησιμοποιείται από τον μηχανισμό Apache Spark και τη μηχανή SQL για επεξεργασία μεγάλου όγκου δεδομένων. Ένα lakehouse περιλαμβάνει βελτιωμένες δυνατότητες για συναλλαγές ACID όταν χρησιμοποιείτε πίνακες ανοιχτού κώδικα Delta. Το στοιχείο lakehouse φιλοξενείται σε έναν μοναδικό φάκελο χώρου εργασίας στο Microsoft OneLake. Περιέχει αρχεία σε διάφορες μορφές (δομημένα και μη δομημένα) οργανωμένα σε φακέλους και υποφακέλους. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Τι είναι ένα lakehouse;

  • Σημειωματάριο: Ένα σημειωματάριο Fabric είναι ένα αλληλεπιδραστικό εργαλείο προγραμματισμού πολλών γλωσσών με εμπλουτισμένες συναρτήσεις. Οι οποίες περιλαμβάνουν κώδικα σύνταξης και επισήμανση, εκτέλεση και παρακολούθηση μιας εργασίας Spark, προβολή και απεικόνιση αποτελέσματος και συνεργασία με την ομάδα. Βοηθά τους μηχανικούς δεδομένων και τους επιστήμονες δεδομένων να εξερευνούν και να επεξεργάζονται δεδομένα και να δημιουργούν πειράματα εκμάθησης μηχανής τόσο με εμπειρία κώδικα όσο και με εμπειρία χαμηλού κώδικα. Μπορεί να μετατραπεί εύκολα σε μια δραστηριότητα διοχέτευσης για ενορχήστρωση.

  • Εφαρμογή Spark: Μια εφαρμογή Apache Spark είναι ένα πρόγραμμα που έχει συνταχθεί από έναν χρήστη χρησιμοποιώντας μία από τις γλώσσες API του Spark (Scala, Python, Spark SQL ή Java) ή γλώσσες που έχουν προστεθεί από τη Microsoft (.NET με C# ή F#). Όταν εκτελείται μια εφαρμογή, διαιρείται σε μία ή περισσότερες εργασίες Spark που εκτελούνται παράλληλα με την ταχύτερη επεξεργασία των δεδομένων. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Παρακολούθηση εφαρμογών Spark.

  • Εργασία Apache Spark: Μια εργασία Spark είναι μέρος μιας εφαρμογής Spark που εκτελείται παράλληλα με άλλες εργασίες στην εφαρμογή. Μια εργασία αποτελείται από πολλές εργασίες. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Παρακολούθηση εργασίας Spark.

  • Ορισμός εργασίας Apache Spark: Ένας ορισμός εργασίας Spark είναι ένα σύνολο παραμέτρων, που ορίζονται από τον χρήστη, που υποδεικνύει τον τρόπο εκτέλεσης μιας εφαρμογής Spark. Σας επιτρέπει να υποβάλετε εργασίες δέσμης ή ροής στο σύμπλεγμα Spark. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Τι είναι ο ορισμός εργασίας Apache Spark;

  • Σειρά V: Μια βελτιστοποίηση εγγραφής στη μορφή αρχείου parquet που επιτρέπει γρήγορη ανάγνωση και παρέχει οικονομική αποδοτικότητα και καλύτερες επιδόσεις. Όλοι οι κινητήρες Fabric γράφουν αρχεία parquet v από προεπιλογή.

Data Factory

  • Σύνδεση: Το Data Factory προσφέρει ένα πλούσιο σύνολο συνδέσεων που σας επιτρέπουν να συνδέεστε σε διαφορετικούς τύπους καταστημάτων δεδομένων. Αφού συνδεθείτε, μπορείτε να μετασχηματίζετε τα δεδομένα. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Συνδέσεις.

  • Διοχέτευση δεδομένων: Στο Data Factory, μια διοχέτευση δεδομένων χρησιμοποιείται για την ενορχήστρωση της μετακίνησης και του μετασχηματισμού δεδομένων. Αυτές οι διοχετεύσεις διαφέρουν από τις διοχετεύσεις ανάπτυξης στο Fabric. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Διοχετεύσεις στην επισκόπηση του Data Factory.

  • Dataflow Gen2: Οι ροές δεδομένων παρέχουν μια διασύνδεση χαμηλού κώδικα για την πρόσληψη δεδομένων από εκατοντάδες προελεύσεις δεδομένων και τον μετασχηματισμό των δεδομένων σας. Οι ροές δεδομένων στο Fabric αναφέρονται ως Dataflow Gen2. Το Dataflow Gen1 υπάρχει στο Power BI. Το Dataflow Gen2 προσφέρει επιπλέον δυνατότητες σε σύγκριση με τις ροές δεδομένων στο Azure Data Factory ή το Power BI. Δεν μπορείτε να κάνετε αναβάθμιση από Gen1 σε Gen2. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Ροές δεδομένων στην επισκόπηση του Data Factory.

  • Έναυσμα: Μια δυνατότητα αυτοματισμού στο Data Factory που ξεκινά διοχετεύσεις με βάση συγκεκριμένες συνθήκες, όπως χρονοδιαγράμματα ή διαθεσιμότητα δεδομένων.

Επιστήμη δεδομένων Synapse

  • Data Wrangler: Το Data Wrangler είναι ένα εργαλείο που βασίζεται σε σημειωματάριο, το οποίο παρέχει στους χρήστες μια συναρπαστική εμπειρία για τη διεξαγωγή διερευνητικής ανάλυσης δεδομένων. Η δυνατότητα συνδυάζει μια εμφάνιση δεδομένων τύπου πλέγματος με δυναμικά συνοπτικά στατιστικά στοιχεία και ένα σύνολο κοινών λειτουργιών καθαρισμού δεδομένων, όλα διαθέσιμα με μερικά επιλεγμένα εικονίδια. Κάθε λειτουργία δημιουργεί κώδικα που μπορεί να αποθηκευτεί στο σημειωματάριο ως μια νέα δέσμη ενεργειών.

  • Πείραμα: Ένα πείραμα εκμάθησης μηχανής είναι η κύρια μονάδα οργανισμού και ελέγχου για όλες τις σχετικές εκτελέσεις εκμάθησης μηχανής. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Πειράματα εκμάθησης μηχανής στο Microsoft Fabric.

  • Μοντέλο: Ένα μοντέλο εκμάθησης μηχανής είναι ένα αρχείο που έχει εκπαιδευτεί για να αναγνωρίζει συγκεκριμένους τύπους μοτίβων. Εκπαιδεύετε ένα μοντέλο σε ένα σύνολο δεδομένων και του παρέχετε έναν αλγόριθμο που χρησιμοποιεί για να αιτιολόγησει και να μάθει από αυτό το σύνολο δεδομένων. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Μοντέλο εκμάθησης μηχανής.

  • Εκτέλεση: Μια εκτέλεση αντιστοιχεί σε μία εκτέλεση κώδικα μοντέλου. Στο MLflow, η παρακολούθηση βασίζεται σε πειράματα και εκτελέσεις.

Αποθήκη δεδομένων Synapse

  • Τελικό σημείο ανάλυσης SQL: Κάθε Lakehouse διαθέτει ένα τελικό σημείο ανάλυσης SQL που επιτρέπει σε έναν χρήστη να υποβάλει ερωτήματα σε δεδομένα πίνακα δέλτα με TSQL μέσω TDS. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Τελικό σημείο ανάλυσης SQL.

  • Αποθήκη δεδομένων Synapse: Η Αποθήκη δεδομένων Synapse λειτουργεί ως μια παραδοσιακή αποθήκη δεδομένων και υποστηρίζει τις πλήρεις δυνατότητες T-SQL συναλλαγών που θα περιμένατε από μια εταιρική αποθήκη δεδομένων. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Αποθήκη δεδομένων Synapse.

Ευφυΐα σε πραγματικό χρόνο

  • Βάση δεδομένων KQL: Η βάση δεδομένων KQL περιέχει δεδομένα σε μια μορφή στην οποία μπορείτε να εκτελέσετε ερωτήματα KQL. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Υποβολή ερωτήματος σε μια βάση δεδομένων KQL.

  • Σύνολο ερωτημάτων KQL: Το σύνολο ερωτημάτων KQL είναι το στοιχείο που χρησιμοποιείται για την εκτέλεση ερωτημάτων, την προβολή αποτελεσμάτων και τον χειρισμό των αποτελεσμάτων ερωτημάτων σε δεδομένα από τη βάση δεδομένων σας Data Explorer. Το σύνολο ερωτημάτων περιλαμβάνει τις βάσεις δεδομένων και τους πίνακες, τα ερωτήματα και τα αποτελέσματα. Το σύνολο ερωτημάτων KQL σάς επιτρέπει να αποθηκεύετε ερωτήματα για μελλοντική χρήση ή να εξαγάγετε και μοιραστείτε ερωτήματα με άλλους χρήστες. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Υποβολή ερωτημάτων για δεδομένα στο σύνολο ερωτημάτων KQL

  • Ροή συμβάντων: Η δυνατότητα ροές συμβάντων Microsoft Fabric παρέχει μια κεντρική θέση στην πλατφόρμα Fabric για την καταγραφή, τον μετασχηματισμό και τη δρομολόγηση συμβάντων σε πραγματικό χρόνο σε προορισμούς με μια εμπειρία χωρίς κώδικα. Μια ροή συμβάντων αποτελείται από διάφορες προελεύσεις δεδομένων ροής, προορισμούς πρόσληψης και έναν επεξεργαστή συμβάντων όταν απαιτείται ο μετασχηματισμός. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Ροές συμβάντων Microsoft Fabric.

OneLake

  • Συντόμευση: Οι συντομεύσεις είναι ενσωματωμένες αναφορές στο OneLake που δείχνουν σε άλλες θέσεις χώρου αποθήκευσης αρχείων. Παρέχουν έναν τρόπο για να συνδεθείτε σε υπάρχοντα δεδομένα χωρίς να χρειάζεται να τα αντιγράψετε απευθείας. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Συντομεύσεις OneLake.