חילוץ מידע ממסמכים

הושלם

עצה

עיין בכרטיסייה טקסט ותמונות לפרטים נוספים!

תהליכי העסק של היום תלויים במידה רבה בנתונים הכלולים במסמכים כמו טפסים, קבלות וחשבוניות. עיבוד ידני עלול לגרום לעיכובים ושגיאות, מה שהופך את אוטומציה של חילוץ נתונים לחשובה מתמיד.

איך עובד Azure Content Understanding

Azure Content Understanding פועל לפי תהליך חילוץ מונחה מודל, שבו תוכן לא מובנה נבלע, מנותח ומוחזר כנתונים מובנים.

  1. קליטת תוכן: אתה מגיש תוכן ל-Azure Content Understanding.

  2. ניתוח מבוסס בינה מלאכותית: השירות משתמש בשילוב של: זיהוי תווים אופטי (OCR), זיהוי דיבור, הבנת שפה טבעית ומודלים רב-מודליים של בינה מלאכותית לניתוח התוכן.

  3. פלט מובנה: השירות מחזיר תוצאות מובנות (למשל, ב-JSON) התואמות למודל שלך — מה שמקל על אחסון, חיפוש או שילוב הנתונים במערכות המשך הדרך.

הערה

JSON (JavaScript Object Notation) הוא פורמט נתונים מבוסס טקסט המשמש לאחסון והחלפת נתונים מובנים בין מערכות. קל לבני אדם לקרוא ולכתוב, וקל למכונות לפענח וליצור.

להבין סכמות

OCR (זיהוי תווים אופטי) מאפשר למחשב 'לקרוא' טקסט מתמונות, כגון מסמכים סרוקים, תמונות של קבלות או תמונות מדפים מודפסים, ולהפוך את הטקסט לטקסט דיגיטלי שניתן לעריכה ולחיפוש. OCR בסיסי עוזר לזהות טקסט מודפס, מתמקד בחילוץ טקסט, ואינו מבין משמעות, הקשר או יחסים בין מילים.

יכולות ניתוח המסמכים של Azure Content Understanding חורגות מעבר לחילוץ טקסט פשוט מבוסס OCR, וכוללות חילוץ מבוסס סכמה של שדות וערכיהם. הגישה המונחית סכימה היא זו שמבדילה את Azure Content Understanding משירותי OCR או תמלול בסיסיים.

סכימה מתארת איזה מידע אתה רוצה לחלץואיך המידע הזה צריך להיות מובנה. כשאתה מגדיר סכמה, אתה מציין שדות לחלץ. סכימה מפרטת את השדות או הישויות הספציפיות שחשובות לך.

לדוגמה, נניח שאתה מגדיר סכימה הכוללת את השדות המשותפים שנמצאים בדרך כלל בחשבונית, כגון:

  • שם ספק
  • מספר חשבונית
  • תאריך חשבונית
  • שם הלקוח
  • כתובת מותאמת אישית
  • פריטים - הפריטים שהוזמנו, שכל אחד מהם כולל:
    • תיאור פריט
    • מחיר ליחידה
    • כמות שהוזמנו
    • סכום פריט שורה
  • סכום ביניים של חשבונית
  • מס
  • דמי משלוח
  • סכום חשבונית

נניח שעליך לחלץ מידע זה מהחשבונית הבאה:

צילום של חשבונית.

Azure Content Understanding יכול להחיל את סכמת החשבונית על החשבונית ולזהות את השדות המתאימים, גם כאשר הם מסומנים בשמות שונים (או לא מסומנים כלל). הניתוח המתוצא מפיק תוצאה כגון זו:

צילום של חשבונית שנותחה עם שדות שזוהו מסומנים.

הסכימה גם מגדירה את מבנה השדה. סכמות תומכות בשדות מובנים ומקוננים, לא רק טקסט שטוח. לדוגמה:

  • Items הוא אוסף
  • לכל פריט יש description, unit price, quantity, ו line total

זיהוי שדות מובנים מאפשר ל-Azure Content Understanding להבין קשרים בין ערכים, דבר ש-OCR לבדו אינו יכול לעשות.

בדוגמת החשבונית, עבור כל שדה שזוהה, ניתן לחלץ ערכים מקוננים:

  • שם ספק: מחזורי הרפתקה עובדת
  • מספר חשבונית: 1234
  • תאריך חשבונית: 07/03/2025
  • שם לקוח: ג'ון סמית'
  • כתובת מותאמת אישית: רחוב ריבר 123, מרשטאון, אנגליה, GL1 234
  • פריטים:
    • פריט 1:
      • תיאור פריט: אופני מירוץ "38 (אדום)
      • מחיר ליחידה: 1299.00
      • כמות שהוזמנו: 1
      • סך הכל פריט שורה: 1299.00
    • פריט 2:
      • תיאור פריט: קסדת רכיבה על אופניים (שחור)
      • מחיר ליחידה: 25.99
      • כמות שהוזמנו: 1
      • סך הכל פריט שורה: 25.99
    • פריט 3:
      • תיאור פריט: חולצת רכיבה על אופניים (L)
      • מחיר ליחידה: 42.50
      • כמות שהוזמנו: 2
      • סך הכל פריט שורה: 85.00
  • סכום ביניים של חשבונית: 1409.99
  • מס' מס' 140.99
  • דמי משלוח: 35.00
  • סך חשבונית: 1585.98

Azure Content Understanding מחלץ משמעות צפויה, לא רק תוויות. סכמות מיושמות באופן סמנטי, כלומר:

  • ניתן להפיק שדות גם אם התוויות שונות
  • ניתן להפיק שדות גם אם חסרות תוויות

לדוגמה, חשבונית מס' ( Invoice No.), Invoice #, או מספר ללא תווית יכולים כולם למפות אם InvoiceNumber האנלייזר קובע שהם מייצגים את אותו מושג.

הבנת אנלייזרים

אנלייזר הוא יחידה ב-Azure Content Understanding שלוקחת קלט, מיישמת ניתוח בינה מלאכותית ומייצרת תוצאות מובנות. אנלייזרים מיישמים באופן עקבי את אותה לוגיקת חילוץ על כל תוכן נכנס. לאחר ההגדרה, המנתח מבטיח שהסכימה תשתמש שוב ושוב בכל בקשת ניתוח. אנלייזרים גם מפיקים תוצאות JSON צפויות. התוצאות המובנות מקלות על העיבוד במורד הזרם (אחסון, חיפוש, אוטומציה).

Azure Content Understanding מציעה אנלייזרים מוכנים לתרחישים נפוצים ותומכת באנלייזרים מותאמים אישית לצרכים שלך. ברמה גבוהה:

  1. אתה בוחר או יוצר אנלייזר.
  2. האנלייזר כולל סכימה שמגדירה שדות ומבנה.
  3. אתה מגיש תוכן לניתוח
  4. השירות מיישם את הסכמה
  5. אתה מקבל תוצאות JSON מובנות התואמות את הסכימה

שימוש בהבנת תוכן Azure בפורטל Foundry

הערה

פורטל Foundry כולל ממשק משתמש קלאסי (UI) וממשק משתמש חדש .

לאחר שיצרת משאב Microsoft Foundry, תוכל להשתמש בממשק פורטל Foundry new Foundry כדי לבדוק Azure Content Understanding. פורטל Foundry מספק דוגמאות תוכן ומאפשר להעלות חומר משלך לניתוח.

ניתן להשתמש בממשק הוויזואלי כדי לבחור מסמך מקור ולחלץ שדות מידע ברירת מחדל. לדוגמה, כשאתה מנסה את Azure Content Understanding על תמונה של מסמך, השירות מחזיר את טקסט המסמך ופרטי פריסת הטקסט.

צילום מסך של פורטל Foundry החדש עם מסמך מנותח באמצעות הבנת תוכן Azure.

מנתחי Azure Content Understanding מזהים ערכי טקסט במסמכים וממפים אותם לשדות ספציפיים. לדוגמה, בהינתן חשבונית, השירות מחזיר את השדות (כמו כתובת הספק) ואת הנתונים בשדות (כמו 123 רחוב 456).

צילום מסך של פורטל Foundry החדש עם חשבונית שנותחה באמצעות Azure Content Understanding.

בפורטל Foundry ניתן גם לצפות בתוצאות ה-JSON של העיבוד.

צילום מסך של פורטל ה-Foundry החדש עם תוצאת JSON של חשבונית שנותחה באמצעות Azure Content Understanding.

בניית אפליקציית לקוח עם Azure Content Understanding

אתה יכול להשתמש ב-API של Content Understanding כדי לבנות אפליקציית לקוח קלה שמחלצת נתונים באופן תכנותי.

הערה

יישום לקוח הוא תוכנה שרצה על מכשיר המשתמש ומבקשת שירותים או נתונים ממערכת אחרת, בדרך כלל שרת, דרך רשת. הלקוח הוא החלק באפליקציה שהמשתמשים מתקשרים איתו, בעוד שהשרת עושה את העבודה הכבדה מאחורי הקלעים. יישומים יכולים לבקש נתונים או פעולות משירות ולקבל תגובה מובנית באמצעות API.

כשאתה משתמש ב-API של Content Understanding, תוכל לבחור אנלייזר מוכן מראש או ליצור אנלייזר מותאם אישית. אנלייזרים מוכנים כוללים: prebuilt-invoice, prebuilt-imageSearch, prebuilt-audioSearch, ו- prebuilt-videoSearch. כשאתה מגיש תוכן לניתוח לאנליסט, הניתוח הוא אסינכרוני, כלומר אתה מקבל את התוצאה מאוחר יותר כשהיא מוכנה. מכיוון שהניתוח אסינכרוני, צריך לסאל את כתובת ה-URL של Operation-Location (או analyzerResults) עד שהמשימה תצליח.

שימוש ב-Azure Content Understanding Python SDK

בואו נבחן את תהליך השימוש ב-Python SDK לניתוח חשבונית מכתובת URL.

  1. התקן את Azure Content Understanding Python SDK.
python -m pip install azure-ai-contentunderstanding
  1. זהה את נקודת הקצה של משאב Foundry ואת מפתח ה-API או את מזהה Microsoft Entra שלך. נקודת הסיום שלך בדרך כלל נראית כך: https://<your-resource-name>.services.ai.azure.com/

  2. צור והפעיל את קוד יישום הלקוח. זהו analzyer_id מזהה של האנלייזר המוקדם מראש. אתה יכול למצוא כאן רשימה של ערכי מזהה אנלייזר מוכנים מראש.

import os
from azure.ai.contentunderstanding import ContentUnderstandingClient
from azure.core.credentials import AzureKeyCredential

endpoint = os.environ["FOUNDRY_ENDPOINT"]
key = os.environ["FOUNDRY_KEY"]

client = ContentUnderstandingClient(endpoint=endpoint, credential=AzureKeyCredential(key))

# 1) start analysis with analyzer id + inputs
analyzer_id = "prebuilt-invoice"
inputs = [
    {"url": "https://github.com/Azure-Samples/azure-ai-content-understanding-python/raw/refs/heads/main/data/invoice.pdf"}
]

# 2) wait for the Long Running Operation (LRO) to complete
poller = client.begin_analyze(analyzer_id=analyzer_id, inputs=inputs)  # starts LRO
result = poller.result()  # waits for completion (polling handled by SDK)

# 3) read structured fields + markdown
# The result typically includes extracted "fields" and "markdown" per input content item.
for content in result.contents:
    print(content.markdown)
    print(content.fields)

הפלט המתקבל הוא JSON שמציג את ה-markdown שהופק, השדות, הנתונים בשדות וציון האמון. לדוגמה:

{
	"status": "Succeeded",
	"result": {
		"analyzerId": "prebuilt-invoice",
		"apiVersion": "2025-05-01-preview",
		"contents": [
			{
				"markdown": "# INVOICE\n\nCONTOSO LTD.\n\nContoso Headquarters\n123 456th St\nNew York, NY, 10001\n\nINVOICE: INV-100\n\nINVOICE DATE: 11/15/2019\n\nDUE DATE: 12/15/2019\n\nCUSTOMER NAME: MICROSOFT CORPORATION\n",
				"fields": {
					"CustomerName": {
						"type": "string",
						"valueString": "MICROSOFT CORPORATION",
						"confidence": 0.95,
					},
					"InvoiceDate": {
						"type": "date",
						"valueDate": "2019-11-15",
						"confidence": 0.994,
					}
                }
            }
        ]
    }
}

לאחר מכן, למד כיצד להשתמש במנתחי הבנת תוכן Azure כדי להפיק נתונים מובנים מאודיו ווידאו.