שימוש ב- SQL Server 2022 כרכזת נתונים שהשאילתתה קבצים גיבוי/שחזור לספקי אחסון אובייקטים
- 10 דקות
SQL Server 2022 מספק יכולות וירטואליזציית נתונים כדי לגשת לנתונים המאוחסנים בטבלאות פרקט ודלתא במקורות כגון Azure Blob Storage, Azure Data Lake Storage וספקי אחסון אובייקטים תואמים של S3. בנוסף, SQL Server 2022 משפר יכולות גיבוי ושחזור מרחוק על-ידי תמיכה בספקי אחסון אובייקטים תואמי S3.
וירטואליזצית נתונים ב- SQL Server
Polybase, שהוצג לראשונה ב- SQL Server 2016, תומך בגישה לנתונים מחוץ ל- SQL Server באמצעות משפטי Transact-SQL (T-SQL), כגון OPENROWSET ו- CREATE EXTERNAL TABLE. מושג זה נקרא נתונים, מאחר שהמשתמשים יכולים לגשת לנתונים מחוץ ל- SQL Server מבלי להעביר את הנתונים ל- SQL Server. SQL Server 2019 הוסיף תמיכה עבור וירטואליזצית נתונים באמצעות מנהלי התקנים של קישוריות מסד נתונים פתוחה (ODBC). גישה זו לנתונים משתמשת בתוכנה הנקראת שירותי Polybase. SQL Server 2022 מוסיף תמיכה במנגנון מסד הנתונים באמצעות ממשקי REST API כדי לגשת לנתונים ב- Azure Blob Storage, Azure Data Lake Storage וספקי אחסון אובייקטים תואמי S3.
האיור הבא מציג את היקף התמיכה המלא של וירטואליזצית נתונים ב- SQL Server 2022.
וירטואליזצית נתונים עם מחברי REST API
וירטואליזצית נתונים של SQL Server 2022 כוללת כעת גישה למחברי מקורות נתונים חדשים באמצעות ממשקי REST API המוכללים במנגנון SQL Server. מחברים חדשים אלה של מקורות נתונים משמשים לעתים קרובות לתמיכה בערכה גדולה של קבצים כדי לבנות אגם נתונים. SQL Server יכול כעת לשמש כרכזת נתונים לבצע שאילתה על קבצים באגם נתונים מבלי להעביר את הנתונים.
מחברי REST API
המחברים החדשים הבאים נתמכים באמצעות REST API:
אחסון Azure Blob
באמצעות מחבר מקור הנתונים,
abs
, באפשרותך לגשת לקבצים המאוחסנים בגורמים מכילים של Azure Blob Storage. Azure Blob Storage הוא מדרגי, זמין במיוחד, יתיר, חסכוני עם אחסון ברמה, מאובטח וממוטב עבור אגמי נתונים. לקבלת מידע נוסף, ראה נתונים באמצעות Azure Blob Storage.Azure Data Lake Storage
באמצעות מחבר מקור הנתונים , באפשרותך
adls
לגשת לקבצים המאוחסנים ב- Azure Data Lake Storage (ADLS). ADLS מבוסס על Azure Blob Storage ומספק סמנטיקה של מערכת קבצים, אבטחה ברמת הקובץ וקנה מידה. כל היכולות האלה מתבססות על אחסון Azure Blob המספקים עלות נמוכה, גישה ברמה גבוהה, אבטחה גבוהה, זמינות גבוהה ועמידות. לקבלת מידע נוסף, ראה נתונים באמצעות Azure Data Lake Storage.ספקי אחסון אובייקטים תואמי S3
באמצעות מחבר מקור הנתונים s3, באפשרותך לגשת לקבצים המאוחסנים באחסון אובייקטים תואם S3. S3 הוא כעת פרוטוקול אחסון אובייקטים פופולרי הנתמך על-ידי ספקים רבים, הן בעננים והן באופן מקומי. אחסון אובייקטים S3 מציע קנה מידה, עלות נמוכה יותר, התפלגות גיאוגרפית והובלת נתונים מהימנה. לקבלת מידע נוסף, ראה נתונים עם ספקי אחסון אובייקטים תואמי S3.
שימוש ב- T-SQL עבור וירטואליזצית נתונים
T-SQL מספק את המשפטים הבאים לתמיכה וירטואליזצית נתונים עם מחברי REST API:
OPENROWSET
משפט ה- T-SQL OPENROWSET מאפשר לך לגשת לכל מחבר נתונים ad-hoc של נתוני REST API, שבו אתה מספק מידע אודות אופן ההתחברות למקור הנתונים, לקובץ או לתיקיה הספציפיים.
יצירת טבלה חיצונית
באפשרותך להשתמש במשפט T-SQL CREATE EXTERNAL TABLE ליצירת טבלה וירטואלית הממפה לקבצים בכל מחבר נתונים של API של REST. לאחר מכן תוכל לגשת לטבלה החיצונית בדיוק כמו בטבלת SQL Server, למעט הנתונים המאוחסנים במקור הנתונים המרוחק. המטה-נתונים של הטבלה החיצונית מאוחסנים בטבלאות מערכת של SQL Server.
ליצור טבלה חיצונית כטבלת בחירה
יכולת חדשה ב- SQL Server 2022 היא ליצור טבלה חיצונית המבוססת על שאילתה מטבלת SQL Server קיימת (או טבלה חיצונית אחרת) המכונה גם CREATE EXTERNAL TABLE AS SELECT. תוצאת השאילתה היא טבלה חיצונית חדשה וקבצים הנוצרים במקור הנתונים המרוחק בהתבסס על התוצאות של משפט SELECT. באפשרותך להשתמש בשיטה זו כדי לייצא נתונים של SQL Server לקבצים במקור נתונים מרוחק.
תמיכה חדשה בתבנית קובץ מקורית
SQL Server מאפשר לך ליצור תבנית קובץ להגדרת המבנה של קובץ במקור נתונים מרוחק. לדוגמה, באפשרותך להשתמש בתבניות קובץ כדי להגדיר מבנה של קובץ JSON, מאחר ש- JSON אינו תבנית קובץ הנתמכת במקור. SQL Server 2022 מזהה כעת תבניות קובץ מקוריות פרקט וטבלאות דלתא.
פרקט
פרקט הוא תבנית קובץ בינארית של קוד פתוח עם הסכימה המוכללת בקובץ. קבצי פרקט משתמשים בתבנית אחסון טורית שהופכת אותם ליעילים לדחיסה ולאחזור. לקבלת מידע נוסף ודוגמאות, ראה פרקט וירטואליזציה באחסון אובייקטים תואם S3 עם PolyBase.
דלתא של
Delta lake הוא ארכיטקטורת אחסון של קוד פתוח המשתמשת בטבלאות דלתא. טבלאות דלתא הן קבצים המבוססים על פרקט, אך מציעות גם תמיכה בסיסית בטרנזקציות ובלוגים. לקבלת מידע נוסף אודות אופן השימוש בטבלאות דלתא עם Azure Data Lake Storage, ראה Virtualize delta table עם PolyBase.
גיבוי ושחזור עם ספקי אחסון אובייקטים תואמי S3
SQL Server 2022 מרחיב את גיבוי ל- URL ו- שחזור מכתובות URL משפטי T-SQL כדי לתמוך לספקי אחסון אובייקטים תואמי S3. רוב אפשרויות הגיבוי והשחזור זמינות באמצעות יכולת חדשה זו. לקבלת מידע נוסף, ראה SQL Server בכתובת URL עבור אחסון אובייקטים תואם S3.
לקבלת רשימה של ספקי אחסון אובייקטים תואמי S3 נפוצים, ראה ספקי אחסון אובייקטים תואמי S3.