ฐานข้อมูลกราฟคืออะไร

Note

คุณลักษณะนี้อยู่ในการแสดงตัวอย่างสาธารณะ การแสดงตัวอย่างนี้จะมีให้โดยไม่มีข้อตกลงระดับบริการ และไม่แนะนําสําหรับปริมาณงานการผลิต คุณลักษณะบางอย่างอาจไม่ได้รับการสนับสนุนหรืออาจมีความสามารถที่จํากัด สําหรับข้อมูลเพิ่มเติม โปรดดู ข้อกําหนดการใช้งานเพิ่มเติมสําหรับตัวอย่าง Microsoft Azure

ฐานข้อมูลกราฟเป็นฐานข้อมูลชนิดหนึ่งที่แสดงข้อมูลเป็นโหนด (เอนทิตี) และขอบ (ความสัมพันธ์) แทนที่จะเป็นตารางและแถว โครงสร้างนี้ทําให้ง่ายต่อการสํารวจการเชื่อมต่อและรูปแบบที่ซับซ้อนในข้อมูลของคุณ

ฐานข้อมูลกราฟชนิดที่ใช้บ่อยที่สุดจะใช้โมเดลกราฟคุณสมบัติที่มีป้ายกํากับ (LPG): เอนทิตี (โหนด) และความสัมพันธ์ (ขอบ) สามารถมีป้ายกํากับและคุณสมบัติ (คู่คีย์-ค่า) โมเดลที่ยืดหยุ่นนี้เปิดใช้งานทั้งการออกแบบที่เป็นตัวเลือก Schema และการออกแบบที่ขับเคลื่อนด้วย Schema และช่วยให้คุณแสดงความสัมพันธ์ที่ซับซ้อนได้ เนื่องจากการเชื่อมต่อถูกจัดเก็บไว้อย่างชัดเจนเป็นเอดจ์ คิวรีจึงสํารวจความสัมพันธ์โดยติดตามขอบแทนการคํานวณการรวมที่มีราคาแพงในเวลาคิวรี

Note

ตัวอย่างในบทความนี้ใช้ชุดข้อมูลกราฟตัวอย่างเครือข่ายสังคม

แนวคิดหลักของฐานข้อมูลกราฟ

ฐานข้อมูลกราฟจัดระเบียบข้อมูลออกเป็นสามองค์ประกอบพื้นฐาน:

  • โหนด แสดงถึงเอนทิตี เช่น บุคคล ผลิตภัณฑ์ หรือสถานที่ โหนดสามารถมีป้ายกํากับและคุณสมบัติที่อธิบายแอตทริบิวต์ได้ ตัวอย่างเช่น โห Person นดอาจมีคุณสมบัติ เช่น firstName, lastName, และ age.
  • ขอบ แสดงถึงวิธีการเชื่อมต่อเอนทิตี เช่น FRIENDS_WITH, PURCHASEDหรือ LOCATED_IN. Edge ยังสามารถมีคุณสมบัติและป้ายกํากับเพื่อบันทึกข้อมูลเมตาของความสัมพันธ์
  • คุณสมบัติ แนบรายละเอียดกับโหนดและขอบ (ตัวอย่างเช่น ชื่อบุคคลหรือวันที่ตั้งแต่ของขอบ)

วิธีการทํางานของความสัมพันธ์แบบสืบค้น

การสืบค้นกราฟดึงข้อมูลที่เชื่อมต่อโดยการข้ามจากโหนดเริ่มต้นไปยังเพื่อนบ้าน จากนั้นไปยังเพื่อนบ้าน และอื่นๆ ค่าใช้จ่ายของการสํารวจขึ้นอยู่กับจํานวนขอบที่สัมผัส (พื้นที่ใกล้เคียง) ไม่ใช่ขนาดรวมของชุดข้อมูล ลักษณะนี้ทําให้คําถามเกี่ยวกับเส้นทาง การเชื่อมต่อ และรูปแบบ เช่น เพื่อนของเพื่อน เส้นทางที่สั้นที่สุด หรือการพึ่งพาหลายฮ็อป เป็นธรรมชาติและมีประสิทธิภาพในการแสดงออก

ฐานข้อมูลกราฟใช้ภาษาการสืบค้นตามรูปแบบ เช่น Graph Query Language (GQL) เพื่ออธิบายการสํารวจเหล่านี้อย่างกระชับ คณะทํางานระหว่างประเทศเดียวกันกับที่ดูแล SQL (ISO/IEC 39075) กําลังสร้างมาตรฐาน GQL ซึ่งปรับการสืบค้นกราฟให้สอดคล้องกับมาตรฐานฐานข้อมูลที่กําหนดไว้

ตัวอย่าง (การจับคู่รูปแบบด้วย GQL):

MATCH (p:Person {firstName: "Annemarie"})-[:knows]->(friend)-[:likes]->(c:Comment)
RETURN c
ORDER BY c.creationDate
LIMIT 100

รูปแบบนี้อ่านเป็น: เริ่มต้นที่โหนด บุคคล สําหรับ Annemarie ติดตาม:knowsขอบไปยังโหนดเพื่อนแต่ละโหนด จากนั้นตาม:likesขอบไปยังโหนดที่เกี่ยวข้อง:Comment ส่งคืนความคิดเห็นใหม่ล่าสุด 100 รายการที่เรียงลําดับตามวันที่สร้าง

การให้เหตุผลกราฟโดยใช้ AI ช่วย (พรีวิว)

ฐานข้อมูลกราฟเหมาะอย่างยิ่งสําหรับการให้เหตุผล AI เนื่องจากเข้ารหัสความสัมพันธ์ที่โมเดลภาษาต้องการเพื่อตอบคําถามแบบหลายฮ็อปอย่างถูกต้อง ใน Microsoft Fabric Fabric Data Agent รองรับกราฟเป็นแหล่งข้อมูล ทําให้ผู้ใช้สามารถถามคําถามภาษาธรรมชาติที่ตัวแทนตอบโดยการคิวรีกราฟ สําหรับรายละเอียดเกี่ยวกับวิธีที่ NL2GQL แปลภาษาธรรมชาติเป็น GQL โปรดดูประกาศการใช้เหตุผล AI ที่ขับเคลื่อนด้วยกราฟ

โมเดลข้อมูลกราฟและความยืดหยุ่นของ Schema

โมเดลข้อมูลกราฟเป็นแบบสคีมาที่ไม่บังคับ: คุณสามารถเริ่มต้นด้วยโมเดลที่ยืดหยุ่นและทําให้เป็นทางการเมื่อเวลาผ่านไป ในกราฟใน Microsoft Fabric การเปลี่ยนแปลงโครงสร้าง เช่น การเพิ่มคุณสมบัติใหม่ การปรับเปลี่ยนป้ายชื่อ หรือการเปลี่ยนชนิดความสัมพันธ์ ในขณะนี้จําเป็นต้องนําเข้าข้อมูลใหม่ลงในแบบจําลองใหม่ วิธีการนี้ช่วยลดความจําเป็นในการทําซ้ําข้อมูล และช่วยให้ทีมรวมข้อมูลจากหลายแหล่งเข้าด้วยกันโดยไม่ต้องออกแบบใหม่ล่วงหน้า สําหรับข้อมูลเพิ่มเติมเกี่ยวกับแบบจําลองข้อมูลที่ใช้ในกราฟใน Microsoft Fabric ให้ดูที่ กราฟคุณสมบัติที่มีป้ายชื่อ

การใช้งานทั่วไปสําหรับฐานข้อมูลกราฟ

ฐานข้อมูลกราฟสอดคล้องกับโดเมนที่การเชื่อมต่อขับเคลื่อนค่า เช่น:

  • โซเชียลเน็ตเวิร์ก — สร้างแบบจําลองความสัมพันธ์ระหว่างผู้คนกับปฏิสัมพันธ์ของพวกเขา
  • กราฟความรู้ — เชื่อมต่อแนวคิด เอนทิตี และข้อเท็จจริงสําหรับการค้นหาความหมายและการให้เหตุผล
  • ระบบคําแนะนํา — สํารวจการโต้ตอบระหว่างผู้ใช้กับรายการเพื่อแสดงคําแนะนําส่วนบุคคล
  • เครือข่ายการฉ้อโกงและความเสี่ยง — ตรวจจับรูปแบบที่น่าสงสัยในบัญชี ธุรกรรม และอุปกรณ์
  • โทโพโลยีเครือข่ายและไอที — แมปการพึ่งพาระหว่างเซิร์ฟเวอร์ บริการ และส่วนประกอบโครงสร้างพื้นฐาน
  • การวิเคราะห์การพึ่งพาห่วงโซ่อุปทาน — ติดตามที่มาของส่วนประกอบและความสัมพันธ์ระหว่างซัพพลายเออร์
  • การสร้างการดึงข้อมูลแบบเสริมตามกราฟ (RAG) — ใช้โครงสร้างกราฟเป็นแหล่งความรู้สําหรับตัวแทน AI ที่ต้องการการให้เหตุผลแบบหลายฮ็อปพร้อมคําตอบที่อธิบายได้และมีพื้นฐาน

ในสถานการณ์เหล่านี้ คําถามจะเกี่ยวกับเรกคอร์ดเดี่ยวน้อยลง และมากกว่าเกี่ยวกับจํานวนเอนทิตีที่เกี่ยวข้องและโต้ตอบในหลายฮ็อป

เมื่อใดที่ควรพิจารณาฐานข้อมูลกราฟ

ฐานข้อมูลกราฟเหมาะอย่างยิ่งเมื่อความสัมพันธ์ขับเคลื่อนคําถามหลักที่คุณต้องตอบ เลือกฐานข้อมูลกราฟเมื่อ:

  • คําถามหลักของคุณเกี่ยวข้องกับเส้นทาง ละแวกใกล้เคียง และรูปแบบในข้อมูลที่เชื่อมต่อ
  • จํานวนฮ็อพเป็นตัวแปรหรือไม่ทราบล่วงหน้า
  • คุณต้องรวมและนําทางความสัมพันธ์ในชุดข้อมูลที่แตกต่างกัน

หากคุณถามคําถามประเภทนี้เป็นประจํา แบบจําลองกราฟก็เหมาะสมอย่างยิ่ง

กราฟใน Microsoft Fabric เปรียบเทียบกับฐานข้อมูลกราฟแบบสแตนด์อโลนอย่างไร

การแสดงข้อมูลของคุณเป็นกราฟและจัดเก็บไว้ในฐานข้อมูลกราฟแบบสแตนด์อโลนแยกต่างหากมักจะแนะนํา ETL (แยก แปลง โหลด) และค่าใช้จ่ายด้านการกํากับดูแล ในทางตรงกันข้าม กราฟใน Microsoft Fabric ทํางานโดยตรงบน OneLake ซึ่งช่วยลดหรือขจัดความจําเป็นในการใช้ไปป์ไลน์ ETL แยกต่างหากและการทําซ้ําข้อมูล พิจารณาการแลกเปลี่ยนเหล่านี้:

  • การเคลื่อนย้ายและการทําซ้ําข้อมูล: โดยทั่วไปแล้วฐานข้อมูลกราฟแบบสแตนด์อโลนจําเป็นต้องแยก แปลง และโหลดข้อมูลไปยังที่จัดเก็บแยกต่างหาก ซึ่งจะเพิ่มความซับซ้อนและอาจนําไปสู่ชุดข้อมูลที่ซ้ํากัน กราฟทํางานบน OneLake เพื่อให้คุณสามารถสร้างแบบจําลองและคิวรีข้อมูลที่เชื่อมต่อได้โดยไม่ต้องย้าย
  • ต้นทุนการดําเนินงาน: สแต็กกราฟแบบสแตนด์อโลนทํางานเป็นคลัสเตอร์หรือบริการแยกต่างหาก และมักจะมีค่าบริการความจุที่ไม่ได้ใช้งาน ในกราฟ ปริมาณงานจะใช้หน่วยความจุรวม (CU) ที่มีการลดขนาดอัตโนมัติและตัววัดแบบรวมศูนย์ ซึ่งช่วยลดความยุ่งยากในการดําเนินงานและสามารถลดต้นทุนได้
  • ความสามารถในการปรับขนาด: ฐานข้อมูลกราฟแบบสแตนด์อโลนบางฐานข้อมูลขึ้นอยู่กับการปรับขนาดหรือการจัดกลุ่มเฉพาะผู้ขาย กราฟได้รับการออกแบบมาสําหรับกราฟขนาดใหญ่และใช้การแบ่งส่วนข้อมูลแบบขยายขนาดระหว่างผู้ปฏิบัติงานหลายคนเพื่อจัดการกับปริมาณงานข้อมูลขนาดใหญ่อย่างมีประสิทธิภาพ
  • เครื่องมือและทักษะ: ระบบกราฟเฉพาะผู้ขายอาจต้องใช้ภาษาเฉพาะและเฟรมเวิร์กการวิเคราะห์แยกต่างหาก การสืบค้นตามมาตรฐาน (GQL) อัลกอริธึมการวิเคราะห์กราฟในตัว การรวม BI และ AI รวมถึง Fabric Data Agent รองรับ การสืบค้นกราฟภาษาธรรมชาติ (พรีวิว) และเครื่องมือสํารวจแบบใช้โค้ดต่ํา/ไม่มีโค้ด ความสามารถเหล่านี้ช่วยให้ชุดผู้ใช้ที่กว้างขึ้นสามารถทํางานกับข้อมูลที่เชื่อมต่อได้
  • การกํากับดูแลและความปลอดภัย: การปรับใช้กราฟแยกต่างหากจําเป็นต้องมีการตั้งค่าการกํากับดูแลและความปลอดภัยที่เป็นอิสระ Graph ใช้การกํากับดูแล OneLake สายข้อมูล และการควบคุมการเข้าถึงตามบทบาทของพื้นที่ทํางาน (RBAC) เพื่อให้การปฏิบัติตามข้อกําหนด การตรวจสอบ และสิทธิ์ยังคงสอดคล้องกับส่วนที่เหลือของสภาพแวดล้อม Fabric ของคุณ