مسرد مصطلحات Azure Databricks الفنية

ش

قائمة التحكم بالوصول (ACL)

قائمة بالأذونات المرفقة بمساحة العمل أو نظام المجموعة أو الوظيفة أو الجدول أو التجربة. يحدد ACL المستخدمين أو عمليات النظام التي يتم منحها حق الوصول إلى الكائنات، والعمليات المسموح بها على الأصول. يحدد كل إدخال في قائمة التحكم بالوصول النموذجية موضوعا وتشغيلا. راجع قوائم التحكم بالوصول.

معاملات ACID

معاملات قاعدة البيانات التي تتم معالجتها بشكل موثوق. ACID يرمز إلى الذرية والاتساق والعزل والمتانة. راجع أفضل الممارسات للموثوقية.

الذكاء الاصطناعي (الذكاء الاصطناعي)

قدرة الكمبيوتر على تقليد السلوك البشري الذكي. راجع الذكاء الاصطناعي والتعلم الآلي على Databricks.

عامل الذكاء الاصطناعي

تطبيق ذو قدرات التفكير المعقدة التي تسمح له بإنشاء خطته الخاصة وتنفيذ المهمة وفقا لأدوات تحت تصرفه. راجع ما هو نظام الذكاء الاصطناعي المركب ووكلاء الذكاء الاصطناعي؟.

الذكاء الاصطناعي الدالات

وظائف SQL المضمنة التي تسمح لك بتطبيق الذكاء الاصطناعي على بياناتك مباشرة من SQL في Azure Databricks. راجع الذكاء الاصطناعي Functions على Azure Databricks.

ملعب الذكاء الاصطناعي

ميزة Azure Databricks حيث يمكن للمستخدمين التفاعل مع نماذج الذكاء الاصطناعي التوليدية التي يتم تقديمها في مساحة عمل Azure Databricks واختبارها ومقارنتها. راجع الدردشة مع LLMs والنموذج الأولي لتطبيقات GenAI باستخدام الذكاء الاصطناعي Playground.

الكشف عن الحالات الشاذة

التقنيات والأدوات المستخدمة لتحديد الأنماط غير العادية التي لا تتوافق مع السلوك المتوقع في مجموعات البيانات. تسهل Azure Databricks الكشف عن الحالات الشاذة من خلال قدرات التعلم الآلي ومعالجة البيانات.

Apache Spark

نظام حوسبة موزع مفتوح المصدر يستخدم لأحمال عمل البيانات الضخمة. راجع Apache Spark على Azure Databricks.

الشبكة العصبية الاصطناعية (ANN)

نظام حوسبة نمطي بعد تشغيل الخلايا العصبية في الدماغ البشري.

ذخر

كيان في مساحة عمل Azure Databricks (على سبيل المثال، عنصر أو ملف).

سجل التدقيق

سجل لأنشطة المستخدم وإجراءاته داخل بيئة Azure Databricks، وهو أمر بالغ الأهمية للأمان والتوافق والمراقبة التشغيلية. راجع مرجع سجل التشخيص.

محمل تلقائي

ميزة استيعاب البيانات التي تعالج ملفات البيانات الجديدة بشكل متزايد وفعال عند وصولها إلى التخزين السحابي دون أي إعداد إضافي. راجع ما هو المحمل التلقائي؟.

AutoML

ميزة Azure Databricks التي تبسط عملية تطبيق التعلم الآلي على مجموعات البيانات الخاصة بك من خلال العثور تلقائيا على أفضل خوارزمية وتكوين hyperparameter لك. راجع ما هو AutoML؟.

دورة حياة البيانات التلقائية

عملية تتبع وتصور تدفق البيانات تلقائيا من أصلها من خلال تحويلات مختلفة إلى شكلها النهائي، وهي ضرورية لتصحيح الأخطاء والامتثال وفهم تبعيات البيانات. يسهل Azure Databricks ذلك من خلال عمليات التكامل مع أدوات دورة حياة البيانات.

التحجيم التلقائي، أفقي

إضافة المنفذين أو إزالتهم استنادا إلى عدد المهام التي تنتظر الجدولة. يحدث هذا بشكل ديناميكي أثناء تحديث واحد.

التحجيم التلقائي، عمودي

زيادة أو تقليل حجم الجهاز (برنامج التشغيل أو المنفذ) استنادا إلى ضغط الذاكرة (أو نقصه). يحدث هذا فقط في بداية تحديث جديد.

Azure Databricks

إصدار من Databricks تم تحسينه للنظام الأساسي السحابي ل Microsoft Azure.

مضمن

معالجة الدفعات

طريقة معالجة البيانات التي تسمح لك بتحديد إرشادات صريحة لمعالجة كمية ثابتة من البيانات الثابتة وغير المتغيرة كعملية واحدة. يستخدم Azure Databricks Spark SQL أو DataFrames. راجع البث والاستيعاب التزايدي.

المعلومات المهنية (BI)

الاستراتيجيات والتقنيات التي تستخدمها المؤسسات لتحليل البيانات وإدارة معلومات الأعمال.

C

مستكشف الكتالوج

ميزة Azure Databricks التي توفر واجهة مستخدم لاستكشاف البيانات والمخططات (قواعد البيانات) والجداول والنماذج والوظائف والأصول الذكاء الاصطناعي الأخرى وإدارتها. يمكنك استخدامه للعثور على كائنات البيانات ومالكيها، وفهم علاقات البيانات عبر الجداول، وإدارة الأذونات والمشاركة. راجع ما هو مستكشف الكتالوج؟.

CICD أو CI/CD

الممارسات المشتركة للتكامل المستمر (CI) والتسليم المستمر (CD). راجع ما هو CI/CD على Azure Databricks؟.

تنظيف البيانات

البيانات التي مرت بعملية تنقية البيانات، وهي عملية الكشف عن السجلات التالفة أو غير الدقيقة (أو إزالتها) أو تصحيحها من مجموعة سجلات أو جدول أو قاعدة بيانات وتشير إلى تحديد أجزاء البيانات غير المكتملة أو غير الصحيحة أو غير الدقيقة أو غير ذات الصلة، ثم استبدال البيانات القذرة أو الخشنة أو تعديلها أو حذفها.

تنظيف الغرف

ميزة Azure Databricks التي تستخدم Delta Sharing والحوسبة بلا خادم لتوفير بيئة آمنة ومحمية للخصوصية حيث يمكن لعدة أطراف مشاركة بيانات المؤسسة الحساسة والتعاون دون الوصول المباشر إلى بيانات بعضها البعض. باستخدام Clean Rooms، يمكن للمستخدمين من حسابات Databricks الأخرى التعاون لإنشاء رؤى حول المشاريع المشتركة، مثل الحملات الإعلانية أو قرارات الاستثمار أو البحث والتطوير، دون مشاركة الوصول إلى البيانات الأساسية الحساسة. راجع ما هي غرف Azure Databricks النظيفة؟.

موفر النظام الأساسي السحابي

شركة توفر منصة حوسبة سحابية. على سبيل المثال، Microsoft Azure وAmazon Web Services (AWS) وGoogle Cloud Platform (GCP).

نظام مجموعة

مورد حساب غير خادم يستخدم في دفاتر الملاحظات والمهام وجداول Delta Live. لقد حل مصطلح الحوسبة محل نظام المجموعة في جميع أنحاء واجهة مستخدم Azure Databricks، ولكنه لا يزال يستخدم في واجهة برمجة تطبيقات المجموعات وفي بيانات التعريف.

نظام الذكاء الاصطناعي المركب

الأنظمة التي تعالج الذكاء الاصطناعي المهام من خلال الجمع بين مكونات تفاعل متعددة. في المقابل، نموذج الذكاء الاصطناعي هو نموذج إحصائي (على سبيل المثال، محول يتنبأ بالرمز المميز التالي في النص). راجع ما هو نظام الذكاء الاصطناعي المركب ووكلاء الذكاء الاصطناعي؟.

حسب

يشير إلى موارد الحوسبة، وهي عناصر البنية الأساسية، سواء كانت أجهزة أو برامج، والتي تمكن من حل المشكلات وإنشاء الحلول من خلال تلقي البيانات وتحليلها وتخزينها. الحساب.

البنية الأساسية لبرنامج ربط العمليات التجارية المستمرة

البنية الأساسية لبرنامج ربط العمليات التجارية التي تحدث جميع الجداول بشكل مستمر، مع وصول بيانات جديدة إلى الإدخال دون توقف. راجع وضع المسار المشغل مقابل وضع التدفق المستمر.

D

رسم بياني ودوري موجه (DAG)

طريقة لتمثيل التبعيات بين المهام في سير عمل أو مسار. في نموذج معالجة DAG، يتم تمثيل المهام كعقد في رسم بياني دورةي موجه، حيث تمثل الحواف التبعيات بين المهام.

كتالوج البيانات

أداة إدارة بيانات التعريف لإدارة مصادر البيانات، وتوفير معلومات حول بنية البيانات وموقعها واستخدامها. يتكامل Azure Databricks مع كتالوجات البيانات الخارجية لإدارة بيانات التعريف المحسنة.

إدارة البيانات

ممارسة إدارة توفر البيانات وسلامتها وأمانها وإمكانية استخدامها، بما في ذلك السياسات والإجراءات والتقنيات لضمان جودة البيانات والامتثال لها.

استيعاب البيانات

عملية استيراد البيانات ونقلها وتحميلها ومعالجتها من مصادر مختلفة إلى Azure Databricks للتخزين والتحليل والمعالجة.

مستودع البيانات

مستودع تخزين كبير يحتوي على كمية هائلة من البيانات الأولية بتنسيقه الأصلي حتى تكون هناك حاجة إليها.

مستودع البيانات (Data Lakehouse)

نظام إدارة البيانات الذي يجمع بين فوائد مستودعات البيانات ومستودعات البيانات. يوفر مستودع البيانات قدرات تخزين ومعالجة قابلة للتطوير للمؤسسات الحديثة التي ترغب في تجنب الأنظمة المعزولة لمعالجة أحمال العمل المختلفة، مثل التعلم الآلي (ML) والمعلومات المهنية (BI). يمكن أن يساعد مستودع البيانات في إنشاء مصدر واحد للحقيقة، والقضاء على التكاليف الزائدة عن الحاجة، وضمان حداثة البيانات. راجع ما هو مستودع البيانات؟.

البنية الأساسية لبرنامج ربط العمليات التجارية للبيانات

سلسلة من المراحل التي يتم فيها إنشاء البيانات وجمعها ومعالجتها ونقلها إلى وجهة. تسهل Databricks إنشاء وإدارة مسارات البيانات المعقدة لمعالجة البيانات الدفعية وفي الوقت الحقيقي.

خصوصية البيانات

ممارسة حماية البيانات الشخصية من الوصول غير المصرح به أو الاستخدام أو الكشف أو السرقة. تؤكد Azure Databricks على ميزات خصوصية البيانات وأمانها القوية، بما في ذلك التشفير الشامل والتحكم في الوصول المستند إلى الأدوار والامتثال للوائح حماية البيانات الرئيسية، لحماية المعلومات الحساسة وضمان إدارة البيانات.

تصور البيانات

نهج إدارة البيانات الذي يسمح للتطبيق باسترداد البيانات ومعالجتها دون الحاجة إلى تفاصيل تقنية حول البيانات، مثل كيفية تنسيقها أو مكان وجودها فعليا. يمكن أن تعمل Azure Databricks كجزء من طبقة ظاهرية البيانات من خلال توفير وصول سلس إلى البيانات وتحليلها عبر مصادر متباينة.

تخزين البيانات

يشير إلى جمع البيانات وتخزينها من مصادر متعددة بحيث يمكن الوصول إليها بسرعة للحصول على نتائج تحليلات الأعمال وإعداد التقارير. توفر بنية مستودع البيانات وDatabricks SQL إمكانات تخزين البيانات السحابية إلى مستودعات البيانات الخاصة بك. راجع ما هو تخزين البيانات على Azure Databricks؟.

Databricks

منصة تحليلات موحدة ومفتوحة لبناء البيانات والتحليلات والحلول الذكاء الاصطناعي على نطاق واسع ونشرها ومشاركتها وصيانتها على مستوى المؤسسة. يتكامل Databricks Data Intelligence Platform مع التخزين السحابي والأمان في حسابك السحابي، ويدير البنية الأساسية السحابية ويوزعها نيابة عنك. راجع ما هو Azure Databricks؟.

Databricks الذكاء الاصطناعي/BI

منتج المعلومات المهنية لتوفير فهم دلالات بياناتك، ما يتيح تحليل بيانات الخدمة الذاتية. تم بناء الذكاء الاصطناعي/BI على نظام الذكاء الاصطناعي مركب يستمد رؤى من دورة الحياة الكاملة لبياناتك عبر النظام الأساسي Databricks، بما في ذلك مسارات ETL، ودورة حياة البيانات، والاستعلامات الأخرى. راجع ما هو Databricks الذكاء الاصطناعي/BI؟.

حزم أصول Databricks (DABs)

أداة لتسهيل اعتماد أفضل ممارسات هندسة البرمجيات، بما في ذلك التحكم بالمصادر ومراجعة التعليمات البرمجية والاختبار والتكامل والتسليم المستمر (CI/CD) لبياناتك ومشاريع الذكاء الاصطناعي. تجعل الحزم من الممكن وصف موارد Azure Databricks مثل الوظائف والتدفقات ودفاتر الملاحظات كملفات مصدر. راجع ما هي حزم أصول Databricks؟.

مساعد Databricks

مبرمج مزدوج يستند إلى الذكاء الاصطناعي ووكيل دعم يجعلك أكثر كفاءة أثناء إنشاء دفاتر الملاحظات والاستعلامات ولوحات المعلومات والملفات. يمكن أن يساعدك على الإجابة بسرعة عن الأسئلة عن طريق إنشاء التعليمات البرمجية والاستعلامات وتحسينها واستكمالها وشرحها وإصلاحها. راجع ما هو مساعد Databricks؟.

Databricks CLI

واجهة سطر الأوامر ل Azure Databricks التي تمكن المستخدمين من إدارة مساحات عمل Databricks وأتمتتها ونشر المهام ودفاتر الملاحظات والمكتبات. راجع ما هو Databricks CLI؟.

Databricks Connect

مكتبة عميل تسمح للمطورين بتوصيل IDEs المفضلة لديهم ودفاتر الملاحظات والأدوات الأخرى باستخدام حساب Azure Databricks وتنفيذ تعليمة Spark البرمجية عن بعد. راجع ما هو Databricks Connect؟.

Databricks Container Services

ميزة Azure Databricks التي تتيح لك تحديد صورة Docker عند إنشاء حساب. راجع تخصيص الحاويات باستخدام Databricks Container Service.

Databricks Marketplace

منتدى مفتوح لتبادل منتجات البيانات. يجب أن يكون لدى الموفرين حساب Azure Databricks، ولكن يمكن أن يكون المستلمون أي شخص. تتضمن أصول السوق مجموعات البيانات ودفاتر ملاحظات Azure Databricks وAzure Databricks Solution Accelerators ونماذج التعلم الآلي (الذكاء الاصطناعي). عادة ما يتم توفير مجموعات البيانات ككتالوجات للبيانات الجدولية، على الرغم من أن البيانات غير الجدولية، في شكل وحدات تخزين Azure Databricks، مدعومة أيضا. راجع ما هو Databricks Marketplace؟.

وقت تشغيل Databricks

وقت تشغيل محسن لتحليلات البيانات الضخمة. يوفر Databricks أيضا وقت تشغيل Databricks التعلم الآلي الذي تم تحسينه لأحمال عمل التعلم الآلي. راجع Databricks Runtime وإصدارات ملاحظات إصدار Databricks Runtime والتوافق.

Databricks SQL (DBSQL)

جمع الخدمات التي تجلب قدرات تخزين البيانات وأدائها إلى مستودعات البيانات الموجودة لديك. يدعم Azure Databricks SQL التنسيقات المفتوحة و ANSI SQL القياسية. يسمح محرر SQL في النظام الأساسي وأدوات لوحة المعلومات لأعضاء الفريق بالتعاون مع مستخدمي Azure Databricks الآخرين مباشرة في مساحة العمل. راجع ما هو تخزين البيانات على Azure Databricks؟.

DatabricksIQ

محرك ذكاء البيانات الذي يعمل على تشغيل Databricks Platform. إنه نظام الذكاء الاصطناعي مركب يجمع بين استخدام النماذج الذكاء الاصطناعي والاسترداد والترتيب وأنظمة التخصيص لفهم دلالات بيانات مؤسستك وأنماط استخدامها. راجع الميزات التي تعمل ب DatabricksIQ.

وحدات DBUs

وحدة Databricks (DBU) هي وحدة تمت تسويتها لقوة المعالجة على منصة Databricks Lakehouse المستخدمة لأغراض القياس والتسعير. يعتمد عدد وحدات DBUs التي يستهلكها حمل العمل على مقاييس المعالجة، والتي قد تتضمن موارد الحوسبة المستخدمة ومقدار البيانات التي تمت معالجتها. راجع مفاهيم Azure Databricks.

DataFrame

بنية بيانات تنظم البيانات في جدول ثنائي الأبعاد من الصفوف والأعمدة، مثل جدول البيانات. DataFrames هي واحدة من أكثر بنيات البيانات شيوعا المستخدمة في تحليلات البيانات الحديثة لأنها طريقة مرنة وبديهية لتخزين البيانات والعمل معها. راجع البرنامج التعليمي: تحميل البيانات وتحويلها باستخدام Apache Spark DataFrames.

مجموعة البيانات

مجموعة منظمة من البيانات منظمة ومخزنة معا للتحليل أو المعالجة. عادة ما تكون البيانات في مجموعة البيانات مرتبطة بطريقة ما ويتم أخذها من مصدر واحد أو مخصصة لمشروع واحد.

Delta Lake

طبقة تخزين مفتوحة المصدر تجلب الموثوقية إلى مستودعات البيانات. يوفر Delta Lake معاملات ACID ومعالجة بيانات التعريف القابلة للتطوير وتوحيد الدفق ومعالجة البيانات المجمعة. راجع ما هو Delta Lake؟.

Delta Live Tables (DLT)

إطار تعريفي لبناء مسارات معالجة بيانات موثوقة وقابلة للصيانة وقابلة للاختبار. يمكنك تحديد التحويلات التي يجب إجراؤها على بياناتك وتدير Delta Live Tables تنسيق المهام وإدارة نظام المجموعة والمراقبة وجودة البيانات ومعالجة الأخطاء. راجع ما هي جداول Delta Live؟.

مجموعات بيانات Delta Live Tables

جداول الدفق وطرق العرض المجسدة وطرق العرض التي يتم الاحتفاظ بها كنتائج للاستعلامات التعريفية.

مشاركة دلتا

يمكنك من مشاركة البيانات والأصول الذكاء الاصطناعي في Azure Databricks مع مستخدمين من خارج مؤسستك، سواء كانوا يستخدمون Azure Databricks أم لا. يتوفر أيضا كمشروع مفتوح المصدر لمشاركة البيانات الجدولية، واستخدامه في Azure Databricks يضيف القدرة على مشاركة البيانات غير الجدولية وغير المنظمة (وحدات التخزين) ونماذج الذكاء الاصطناعي وطرق العرض والبيانات المصفاة ودفاتر الملاحظات. راجع ما المقصود بمشاركة دلتا؟.

جداول دلتا

تنسيق جدول البيانات الافتراضي في Azure Databricks وهو ميزة لإطار عمل بيانات Delta Lake مصدر مفتوح. تستخدم جداول دلتا عادة لمستودعات البيانات، حيث يتم استيعاب البيانات عبر الدفق أو على دفعات كبيرة. راجع ما هي الجداول وطرق العرض؟.

E

ETL (استخراج وتحويل وتحميل)

نهج حديث لتكامل البيانات يستخرج البيانات من المصادر، ويحملها في النظام الهدف، ثم يحولها داخل النظام الهدف. راجع تشغيل حمل عمل ETL الأول على Azure Databricks.

F

مخزن الميزات

مستودع مركزي لتخزين الميزات وإدارتها وتقديمها لنماذج التعلم الآلي. راجع هندسة الميزات وخدمتها.

تدفق

التدفق هو حافة في مسار DLT يقرأ البيانات ويحولها ويكتبها إلى وجهة.

نماذج الأساس

نماذج التعلم الآلي الكبيرة المدربة مسبقا بهدف ضبطها لفهم اللغة ومهام الجيل الأكثر تحديدا. راجع واجهات برمجة تطبيقات نموذج Databricks Foundation.

G

الذكاء الاصطناعي التوليدي

يركز نوع من الذكاء الاصطناعي على قدرة أجهزة الكمبيوتر على استخدام النماذج لإنشاء محتوى مثل الصور والنص والرمز والبيانات الاصطناعية. يتم إنشاء تطبيقات الذكاء الاصطناعي التوليدية على رأس نماذج الذكاء الاصطناعي التوليدية: نماذج اللغة الكبيرة (LLMs) والنماذج الأساسية. راجع الذكاء الاصطناعي والتعلم الآلي على Databricks.

J

مهمة

الوحدة الأساسية لجدولة أحمال عمل الإنتاج وتنسيقها على Azure Databricks. تتكون وظائف Azure Databricks من مهمة واحدة أو أكثر. راجع جدولة مهام سير العمل وتنسيقها.

L

LakeFlow Connect

يوفر موصلات مضمنة لاستيعابها من تطبيقات المؤسسة وقواعد البيانات. يتم التحكم في البنية الأساسية لبرنامج ربط العمليات التجارية الناتجة عن الاستيعاب بواسطة كتالوج Unity ويتم تشغيلها بواسطة حساب بلا خادم وجداول Delta Live. راجع LakeFlow Connect.

Lakehouse Federation

النظام الأساسي لاتحاد الاستعلامات ل Azure Databricks. يصف مصطلح اتحاد الاستعلام مجموعة من الميزات التي تمكن المستخدمين والأنظمة من تشغيل الاستعلامات مقابل مصادر بيانات متعددة دون الحاجة إلى ترحيل جميع البيانات إلى نظام موحد. يستخدم Azure Databricks كتالوج Unity لإدارة اتحاد الاستعلام. راجع ما هو Lakehouse Federation؟.

Lakehouse Monitoring

مراقبة الخصائص الإحصائية وجودة البيانات في جميع الجداول في حسابك. يمكنك أيضا استخدامه لتتبع أداء نماذج التعلم الآلي ونقاط نهاية خدمة النماذج من خلال مراقبة جداول الاستدلال التي تحتوي على مدخلات النموذج والتنبؤات. راجع مقدمة إلى Databricks Lakehouse Monitoring.

نموذج لغة كبير (LLM)

نموذج معالجة اللغة الطبيعية (NLP) مصمم لمهام مثل الإجابة عن الأسئلة المفتوحة والدردشة وتلخيص المحتوى وتنفيذ التعليمات شبه العشوائية والترجمة وإنشاء المحتوى والتعليمات البرمجية. يتم تدريب LLMs من مجموعات البيانات الضخمة باستخدام خوارزميات التعلم الآلي المتقدمة لمعرفة أنماط وهياكل اللغة البشرية. راجع نماذج اللغات الكبيرة (LLMs) على Databricks.

مكتبة

حزمة من التعليمات البرمجية المتوفرة لدفتر الملاحظات أو الوظيفة التي تعمل على نظام المجموعة. تتضمن أوقات تشغيل Databricks العديد من المكتبات، ويمكنك أيضا تحميل مكتباتك الخاصة. راجع المكتبات.

M

طريقة العرض المجسدة

طريقة عرض تم حسابها مسبقا وتخزينها بحيث يمكن الاستعلام عنها مع زمن انتقال أقل أو بشكل متكرر دون حساب متكرر. راجع استخدام طرق العرض المجسدة في Databricks SQL.

بنية الميدالية

نمط تصميم البيانات الذي يستخدم لتنظيم البيانات منطقيا في مستودع، بهدف تحسين بنية البيانات وجودتها بشكل تدريجي وتدريجي أثناء تدفقها عبر كل طبقة من البنية (من جداول الطبقة الذهبية ⇒ البرونزية ⇒ الفضية). ما هو تصميم lakehouse medallion؟.

مخزن بيانات التعريف

المكون الذي يخزن جميع معلومات البنية للجداول والأقسام المختلفة في مستودع البيانات، بما في ذلك معلومات نوع العمود والعمود، والمتسلسلات وإلغاء التسلسلات اللازمة لقراءة البيانات وكتابتها، والملفات المقابلة حيث يتم تخزين البيانات. راجع Metastores.

تدفق MLflow

نظام أساسي مفتوح المصدر لإدارة دورة حياة التعلم الآلي من طرف إلى طرف، بما في ذلك التجريب وقابلية النسخ والنشر. MLflow على Azure Databricks هي خدمة مدارة بالكامل مع وظائف إضافية لعملاء المؤسسات، ما يوفر نشرا مدارا قابلا للتطوير وآمنا ل MLflow. راجع إدارة دورة حياة التعلم الآلي باستخدام MLflow.

تدريب النموذج

عملية تدريب التعلم الآلي ونماذج التعلم العميق على Azure Databricks باستخدام العديد من المكتبات مفتوحة المصدر الشائعة. راجع تدريب نماذج الذكاء الاصطناعي وML.

الذكاء الاصطناعي الفسيفساء

الميزة التي توفر أدوات موحدة لإنشاء حلول الذكاء الاصطناعي وML ونشرها وتقييمها والتحكم فيها - من إنشاء نماذج التعلم الآلي التنبؤية إلى أحدث تطبيقات GenAI. راجع الذكاء الاصطناعي والتعلم الآلي على Databricks.

خدمة نموذج الذكاء الاصطناعي الفسيفساء

الواجهة الموحدة لنشر نماذج الذكاء الاصطناعي والتحكم فيها والاستعلام عن الاستدلال في الوقت الفعلي والدفعة. راجع خدمة النموذج مع Azure Databricks.

تدريب نموذج الفسيفساء الذكاء الاصطناعي

تسمح لك الميزة باستخدام بياناتك لتخصيص نموذج أساسي لتحسين أدائه لتطبيقك المحدد. من خلال إجراء ضبط كامل للمعلمات أو التدريب المستمر لنموذج أساسي، يمكنك تدريب النموذج الخاص بك باستخدام بيانات ووقت وموارد حساب أقل بكثير من تدريب نموذج من البداية. راجع ضبط نموذج الأساس.

البحث عن متجهات الذكاء الاصطناعي الفسيفساء

قاعدة بيانات متجهة مضمنة في Databricks Data Intelligence Platform ومتكاملة مع أدوات الحوكمة والإنتاجية الخاصة بها. راجع البحث عن متجهات الذكاء الاصطناعي الفسيفساء.

N

دفتر

واجهة ويب تفاعلية يستخدمها علماء ومهندسو البيانات لكتابة التعليمات البرمجية وتنفيذها بلغات متعددة (على سبيل المثال، Python، Scala، SQL) في نفس المستند. راجع مقدمة إلى دفاتر ملاحظات Databricks.

O

OAuth

OAuth هو معيار مفتوح لتفويض الوصول، ويستخدم عادة كطريقة لمستخدمي الإنترنت لمنح مواقع الويب أو التطبيقات حق الوصول إلى معلوماتهم على مواقع الويب الأخرى ولكن دون منحهم كلمات المرور. راجع مصادقة الوصول إلى موارد Azure Databricks.

P

اتصال الشريك

برنامج Databricks يوفر عمليات التكامل التي يحتفظ بها موردو البرامج المستقلون للاتصال بمعظم أنظمة بيانات المؤسسة. راجع ما هو اتصال شريك Databricks؟.

الرمز المميز للوصول الشخصي (PAT)

سلسلة من الأحرف المستخدمة لمصادقة مستخدم عند الوصول إلى نظام كمبيوتر بدلا من كلمة مرور. راجع مصادقة الوصول إلى موارد Azure Databricks.

فوتون

محرك استعلام متجه عالي الأداء من Databricks أصلي يقوم بتشغيل أحمال عمل SQL واستدعاءات واجهة برمجة تطبيقات DataFrame بشكل أسرع لتقليل التكلفة الإجمالية لكل حمل عمل. الفوتون متوافق مع واجهات برمجة تطبيقات Apache Spark، لذلك يعمل مع التعليمات البرمجية الموجودة لديك. راجع ما هو Photon؟.

خط انابيب

DAG من الجداول وطرق العرض وطرق العرض المجسدة والتدفقات والمتلقيات التي يتم تحديثها ببطء بترتيب تبعية يحدده النظام.

R

الجيل المعزز باسترداد (RAG)

تقنية تمكن نموذج لغة كبير (LLM) من إنشاء استجابات ثرية عن طريق زيادة مطالبة المستخدم بالبيانات الداعمة التي تم استردادها من مصدر معلومات خارجي. من خلال دمج هذه المعلومات المستردة، تمكن RAG LLM من إنشاء استجابات أكثر دقة وأعلى جودة مقارنة بعدم زيادة المطالبة بسياق إضافي. راجع أساسيات الجيل المعزز باسترداد (RAG).

S

مخطط (كتالوج Unity)

تابع كتالوج في كتالوج Unity يمكن أن يحتوي على جداول وطرق عرض ووحدات تخزين ونماذج ووظائف. المخطط هو المستوى الثاني من مساحة الاسم ثلاثية المستوى في كتالوج Unity (catalog.schema.table-etc). راجع ما هو كتالوج Unity؟.

حساب بلا خادم

الحساب الذي تديره Azure Databricks، ما يقلل من النفقات الإدارية ويوفر حسابا فوريا لتحسين إنتاجية المستخدم. راجع الاتصال بالحوسبة بلا خادم.

كيان الخدمة

هوية تم إنشاؤها للاستخدام مع الأدوات التلقائية والمهام قيد التشغيل والتطبيقات. يمكنك تقييد وصول كيان الخدمة إلى الموارد باستخدام الأذونات، بنفس الطريقة التي يستخدم بها مستخدم Azure Databricks. على عكس مستخدم Azure Databricks، فإن كيان الخدمة هو هوية واجهة برمجة التطبيقات فقط؛ لا يمكنه الوصول إلى واجهة مستخدم Azure Databricks أو Databricks CLI مباشرة. راجع إدارة كيانات الخدمة.

متلقي (مسارات)

المتلقي هو وجهة لتدفق يكتب إلى نظام خارجي (على سبيل المثال، Kafka، Kinesis، Delta).

مستودع SQL

مورد حساب يتيح لك الاستعلام عن البيانات واستكشافها على Azure Databricks. راجع الاتصال بمستودع SQL.

معالجة الدفق

طريقة معالجة البيانات التي تسمح لك بتعريف استعلام مقابل مجموعة بيانات غير مقيدة ومتزايدة باستمرار ثم معالجة البيانات على دفعات صغيرة تزايدية. تستخدم معالجة دفق Azure Databricks الدفق المنظم. راجع البث والاستيعاب التزايدي.

تدفق

يشير الدفق إلى أي محتوى وسائط - مباشر أو مسجل - (أي دفق من البيانات) يتم تسليمه إلى أجهزة الكمبيوتر والأجهزة المحمولة عبر الإنترنت ويتم تشغيله مرة أخرى في الوقت الفعلي. راجع مفاهيم الدفق المنظم.

تحليلات الدفق

عملية تحليل البيانات التي يتم إنشاؤها باستمرار بواسطة مصادر مختلفة. يدعم Azure Databricks تحليلات الدفق من خلال Structured Streaming، ما يسمح بمعالجة البيانات المباشرة وتحليلها للحصول على رؤى في الوقت الفعلي.

دفق منظم

محرك معالجة دفق قابل للتطوير ومتسامح مع الأخطاء مبني على محرك Spark SQL، ما يتيح الحسابات المعقدة باعتبارها استعلامات دفق. راجع مفاهيم الدفق المنظم.

دفق الجداول

جدول مدار يحتوي على دفق كتابة إليه.

T

جدول

يوجد جدول في مخطط ويحتوي على صفوف من البيانات. تستخدم جميع الجداول التي تم إنشاؤها في Databricks Delta Lake بشكل افتراضي. تسمى الجداول المدعومة من Delta Lake أيضا جداول Delta. راجع ما هي الجداول وطرق العرض؟.

البنية الأساسية لبرنامج ربط العمليات التجارية التي تم تشغيلها

البنية الأساسية لبرنامج ربط العمليات التجارية التي استيعاب جميع البيانات التي كانت متوفرة في بداية التحديث لكل جدول، تعمل في ترتيب التبعية ثم إنهاء. راجع وضع المسار المشغل مقابل وضع التدفق المستمر.

U

كتالوج Unity

ميزة Azure Databricks التي توفر إمكانات مركزية للتحكم في الوصول والتدقيق والنسل واكتشاف البيانات عبر مساحات عمل Azure Databricks. راجع ما هو كتالوج Unity؟.

V

قاعدة بيانات المتجهات

قاعدة بيانات محسنة لتخزين عمليات التضمين واستردادها. التضمينات هي تمثيلات رياضية للمحتوى الدلالي للبيانات، عادة ما تكون بيانات النص أو الصورة. راجع البحث عن متجهات الذكاء الاصطناعي الفسيفساء.

منظر

جدول ظاهري تم تعريفه بواسطة استعلام SQL. لا يخزن البيانات بنفسه ولكنه يوفر طريقة لتقديم البيانات من جدول واحد أو أكثر، بتنسيق أو تجريد معين. راجع ما هي طريقة العرض؟.

وحدات التخزين (كتالوج Unity)

كائنات كتالوج Unity التي تمكن الحوكمة عبر مجموعات البيانات غير الجدولية. تمثل وحدات التخزين وحدة تخزين منطقية في موقع تخزين كائن سحابي. توفر وحدات التخزين قدرات للوصول إلى الملفات وتخزينها وإدارتها وتنظيمها. راجع ما هي وحدات تخزين كتالوج Unity؟.

W

مهام سير العمل

مجموعة الأدوات التي تسمح لك بجدولة مهام معالجة البيانات وتنسيقها على Azure Databricks. يمكنك استخدام Azure Databricks Workflows لتكوين وظائف Azure Databricks. راجع جدولة مهام سير العمل وتنسيقها.

عبء العمل

مقدار إمكانية المعالجة اللازمة لتنفيذ مهمة أو مجموعة من المهام. يحدد Azure Databricks نوعين من أحمال العمل: هندسة البيانات (الوظيفة) وتحليلات البيانات (جميع الأغراض). راجع مفاهيم Azure Databricks.

workspace

بيئة تنظيمية تسمح لمستخدمي Databricks بتطوير الكائنات واستعراضها ومشاركتها مثل دفاتر الملاحظات والتجارب والاستعلامات ولوحات المعلومات. راجع التنقل في مساحة العمل.