ملاحظة
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تسجيل الدخول أو تغيير الدلائل.
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تغيير الدلائل.
تقدم هذه المقالة نظرة عامة على قدرات Databricks لتحليل الرسم البياني ومقدمة لمفاهيم الرسم البياني الأساسية. وتسمى الرسوم البيانية أيضا الشبكات عادة، خاصة في سياق مجال معين من الدراسة، مثل الشبكات الاجتماعية، أو شبكات الاتصال.
الرسم البياني هو مجموعة من الرؤوس المتصلة بالحواف. غالبا ما تعرف الرؤوس أيضا باسم العقد، وتسمى الحواف بدلا من ذلك أحيانا الارتباطات أو العلاقات أو الأقواس. على سبيل المثال، تمثل الشبكات الاجتماعية الاتصالات بين الأشخاص. وتشمل الأمثلة الأخرى شبكات النقل، مثل رحلات الطيران أو القطار أو اتصالات الحافلات بين المدن وشبكات الاتصالات السلكية واللاسلكية، مثل الكابلات التي تحمل حركة مرور الإنترنت بين الخوادم. تستخدم معالجة الرسم البياني أيضا بشكل شائع في مجالات مثل الاحتيال أو الكشف عن التهديدات والتوصية بالمنتج. تستفيد العديد من مشاكل الأعمال من فهم الشبكات وتحليلها من خلال معالجة الرسم البياني، وهي قوية بشكل خاص عند دمجها مع تقنيات التحليلات الأخرى، بما في ذلك التعلم الآلي.
يوضح الرسم التخطيطي مثالا بسيطا. العقد في هذه الشبكة هي 6 بلدان في أوروبا الغربية والوسطى. تشير الخطوط أو الحواف في الرسم التخطيطي إلى أن بلدين يشتركان في حدود.
يتضمن التعلم الآلي من Databricks Runtime حزم تحليل الشبكة للمشاكل على أي نطاق. بالنسبة للشبكات الصغيرة نسبيا التي يمكن معالجتها على عقدة حساب واحدة، استخدم NetworkX. بالنسبة للشبكات الكبيرة التي تتطلب معالجة موزعة، استخدم GraphFrames. يمكنك أيضا تثبيت حزم مصدر مفتوح إضافية حسب الحاجة، أو الاتصال بالشركاء الخارجيين والأدوات لمعالجة الرسم البياني والتصور.
تصف بقية هذه المقالة مفاهيم تحليل الشبكة الأساسية وتتضمن دفتر ملاحظات يستخدم الحزمة NetworkX لتوضيح بعض هذه المفاهيم.
مفاهيم الرسم البياني وتحليل الشبكة
يصف هذا القسم بعض المفاهيم الأساسية لتحليل الشبكة.
العقد والحواف
في تحليل الشبكة، تتكون الشبكة أو الرسم البياني من مجموعة من العقد ومجموعة من الحواف أو الارتباطات التي تربط العقد. تمثل العقد الأشياء التي يتم توصيلها، مثل الأشخاص أو المدن. تمثل الحواف الاتصالات أو العلاقات بينها، مثل الأشخاص الذين عملوا معا، أو محطات القطار التي لها ارتباط مباشر بينها.
تسمى العقد أيضا الذروات أو النقاط أو الكيانات. وتسمى الحواف أيضا خطوطا أو علاقات أو ارتباطات.
الشبكات الموجهة وغير الموجهة
يمكن أن تمثل الحافة في الشبكة علاقة أحادية الاتجاه، مثل المروحة التي تتبع أحد المشاهير على شبكة اجتماعية، أو علاقة ثنائية الاتجاه، مثل زملاء العمل. إذا كان من الممكن أن تكون الحواف أحادية الاتجاه، يتم استدعاء الشبكة موجهة. إذا لم يكن للحواف اتجاه مقترن، يتم استدعاء الشبكة غير موجهة.
الحواف المرجحة
يمكن أن يكون للحواف أوزان. قد تكون أمثلة الأوزان في الشبكة هي قدرة حمل الطريق السريع أو الكبل.
درجه
درجة العقدة هي عدد الحواف التي ترتبط بها. على سبيل المثال، في الرسم التخطيطي السابق، العقدة "فرنسا" لديها درجة 4.
بالنسبة للرسوم البيانية الموجهة، فإن الدرجة هي عدد الحواف القادمة إلى العقدة، والدرجة الخارجية هي عدد الحواف التي تشير بعيدا عن العقدة.
خصائص الشبكة والعقدة
أقصر مسار
أقصر مسار هو الحد الأدنى للمسافة بين عقدتين، مع مراعاة الارتباطات الاتجاهية، واختياريا، أوزان الحافة. على سبيل المثال، في الرسم التخطيطي السابق، أقصر مسار بين العقد ألمانيا وإسبانيا هو من خلال فرنسا، لمسافة مسار 2.
مركزيه
المركزية هي طريقة لقياس أهمية العقدة في الشبكة. هناك عدة تدابير مختلفة من المركزية. تستند مركزية درجة العقدة إلى جزء العقد في شبكة اتصال تتصل بها العقدة مباشرة. مركزية العلاقة بين العقدة هي جزء أقصر المسارات في شبكة تمر عبر العقدة.
توزيع الدرجات العلمية
توزيع درجة الشبكة هو عدد العقد لكل درجة. ويوفر معلومات حول هيكل الشبكة وتنظيمها.
قطر
قطر الشبكة هو الحد الأقصى لأقصر المسارات بين أي عقدتين. القطر يعادل الحد الأقصى لشذوذ مركز العقد في الشبكة.
الكثافة
كثافة الرسم البياني هي عدد الحواف في الرسم البياني مقسوما على العدد الإجمالي للحواف المحتملة. بالنسبة إلى الرسم البياني غير المعاد معالجته، يكون إجمالي عدد الحواف المحتملة هو n(n-1)/2، حيث n هو عدد العقد. للحصول على رسم بياني موجه، تحتوي كل حافة على اتجاهين محتملين، لذا فإن إجمالي عدد الحواف المحتملة هو n(n-1).
شبكات العالم الصغير
معظم الشبكات في العالم الحقيقي غير متصلة عشوائيا، وبدلا من ذلك تعرض نوعا من الأنماط والبنى الفرعية. ومن الأمثلة على هذا النمط في الشبكات التي تشمل الأشخاص "ظاهرة العالم الصغير"، التي نلاحظ من خلالها مجموعات فرعية مرتبطة ارتباطا وثيقا ومتوسطا قصيرا لطول المسار بين أي عقدتين. هذه الأنماط شائعة جدا في الممارسة العملية، وتؤدي إلى مشكلات شائعة في معالجة الرسم البياني على نطاق واسع، مثل التكرارات الطبيعية لأنحراف البيانات للتعامل معها عند معالجة الرسوم البيانية الكبيرة.
مثال لدفتر الملاحظات
يستخدم دفتر الملاحظات المثال التالي حزمة NetworkX، المضمنة في Databricks Runtime ل ML، لتوضيح بعض مفاهيم تحليل الشبكة الأساسية.