فهم OneLake

مكتمل

OneLake هو أساس منصة التحليلات في Microsoft Fabric. يوفر طبقة تخزين موحدة واحدة حيث توجد جميع بياناتك. فهم OneLake ضروري لأنه يغير طريقة تفكيرك حول تخزين البيانات. بدلا من نسخ البيانات بين الأنظمة أو إدارة حسابات تخزين متعددة، تعمل مع موقع مركزي واحد مشترك عبر جميع أعباء عمل Fabric.

OneLake تضم جميع المستأجرين

OneLake هي بحيرة بيانات على مستوى المستأجرين مدمجة في كل بيئة Fabric. عندما تقوم مؤسستك بتفعيل Fabric، يصبح OneLake متاحا تلقائيا. لا يتطلب إعداد أو تكوين منفصل.

مع OneLake، تحصل على نسخة واحدة فقط من بياناتك. جميع أعباء عمل Fabric تقرأ وتكتب في نفس موقع التخزين. هذا النهج يقضي على المشكلة التقليدية لعزل البيانات حيث يحتفظ كل فريق أو أداة بنسخته الخاصة.

غالبا ما تنشئ بيئات التحليلات التقليدية نسخا من البيانات لفرق أو أعباء عمل مختلفة. مع OneLake، جميع أعباء العمل تقرأ من نفس الملفات الأساسية. عندما تتغير البيانات، يرى الجميع النسخة المحدثة فورا. هذا المصدر الوحيد للحقيقة يقلل من تناقضات البيانات وتكاليف التخزين.

اكتشف البيانات باستخدام كتالوج OneLake

يساعدك كتالوج OneLake على اكتشاف وتصفح أصول البيانات عبر كامل مستأجر Fabric الخاص بك. فكر فيها كجرد قابل للبحث لجميع البيانات في OneLake.

يمكنك البحث عن الأصول بالاسم، والتصفح حسب مساحة العمل أو النطاق، وعرض البيانات الوصفية مثل الوصف، المالكين، والنسب. يتيح الكتالوج العثور على البيانات ذات الصلة حتى عندما لا تعرف بالضبط مكان تخزينها.

يوفر الكتالوج أيضا قدرات حوكمة وأمن. تتكامل OneLake مع Microsoft Purview لحوكمة البيانات. يمكنك تصنيف البيانات، وتطبيق تسميات الحساسية، وتتبع سلالة البيانات. تحدد ضوابط الوصول من يمكنه قراءة أو تعديل البيانات، مما يوفر ضوابط من مستوى المؤسسات لحماية بياناتك.

أنواع البيانات في OneLake

OneLake يخزن البيانات بصيغ مفتوحة، مما يعني أن بياناتك ليست مقفلة بصيغة خاصة. يستخدم OneLake دلتا ليك كتنسيق جدول افتراضي، حيث يخزن البيانات في ملفات باركيت المفتوحة. أي أداة تفهم دلتا ليك أو باركيت يمكنها الوصول إليها، مما يمنحك مرونة في كيفية التعامل مع بياناتك. يمكن أن تكون الملفات في OneLake بأي صيغة.

يمكن أن تشمل البيانات في OneLake ما يلي:

  • الطاولات المخزنة في بيوت البحيرة أو المستودعات أو بيوت الفعاليات
  • ملفات بصيغ مختلفة (Parquet، CSV، JSON، والمزيد)
  • اختصارات تشير إلى البيانات دون نسخها فعليا
  • النماذج الدلالية لتحليلات Power BI

الاختصارات تتيح لك الرجوع إلى البيانات في مواقع خارجية مثل Azure Data Lake Storage، Amazon S3، أو موقع آخر في OneLake. البيانات تبقى في مكانها، لكن يمكنك العمل بها كما لو كانت جزءا من بيت البحيرة. تكون الاختصارات مفيدة عندما يدير فريق آخر بيانات المصدر أو عندما تتطلب سياسات الحوكمة بقاء البيانات في موقع معين.

كيف تصل البيانات إلى OneLake

يمكن الوصول إلى OneLake عبر عدة طرق استيعاب:

  • التكرار: يقوم بتكرار البيانات باستمرار من قواعد بيانات خارجية مثل SQL Server، Azure SQL Database، Azure Cosmos DB، أو Snowflake. عندما تتغير بيانات المصدر، تعكس OneLake تلك التغييرات تلقائيا.
  • خطوط الأنابيب: تنسيق حركة البيانات وتحويلها باستخدام قدرات Data Factory. يقومون بنسخ البيانات من مصادر مختلفة، وتطبيق التحويلات، وتحميلها في OneLake.
  • تدفقات البيانات: استخدم Power Query للاتصال بالمصادر، وتحويل البيانات، وتحميلها إلى OneLake. هم مألوفين لمستخدمي Excel وPower BI الذين عملوا مع Power Query.
  • البث: يتعامل مع البيانات الفورية عبر تدفقات الأحداث. تتدفق البيانات باستمرار من مصادر مثل أجهزة إنترنت الأشياء، سجلات التطبيقات، أو أحداث تدفق النقر.
  • التحميل المباشر: رفع الملفات مباشرة إلى تخزين OneLake عبر واجهة Fabric.

كيف يدعم OneLake سير عمل الذكاء الاصطناعي الخاص بك

تلعب OneLake دورا أساسيا في تمكين الذكاء الاصطناعي داخل Fabric. لتقديم رؤى ذات صلة، يحتاج وكلاء Copilot وFabric IQ إلى العثور على بياناتك وفهمها.

عندما تسأل Copilot سؤالا مثل "ما كانت اتجاهات المبيعات في الربع الماضي؟"، فإنه يبحث في كتالوج OneLake للعثور على البيانات ذات الصلة. نفس الكتالوج الذي تستخدمه للتصفح واكتشاف الأصول يدعم الدعم المدعوم بالذكاء الاصطناعي.

عندما تكون البيانات مشتتة أو موثقة بشكل ضعيف، حتى الذكاء الاصطناعي يواجه صعوبة في العثور عليها. يمكن ل Copilot أن يعيد نتائج أكثر دقة للمستهلكين عندما تحتوي بياناتك على أسماء ووصف وبيانات وصفية واضحة. يمكن لمساعدي الذكاء الاصطناعي مساعدتك بشكل أكثر فعالية عندما تكون البيانات قابلة للاكتشاف ومفهرسة بشكل جيد.