מהו Azure Document Intelligence?
עצה
עיין בכרטיסייה טקסט ותמונות לפרטים נוספים!
Azure Document Intelligence הוא שירות בינה מלאכותית מבוסס ענן ב-Microsoft Foundry המשתמש במודלים של OCR ולמידה עמוקה לחילוץ טקסט, זוגות מפתח-ערך, סימני בחירה וטבלאות מתוך מסמכים.
OCR לוכד מבנה מסמך על-ידי יצירת תיבות תוחמות סביב אובייקטים שזוהו בתמונה. המיקומים של התיבות המתוחמות מתועדים כנקודות ציון ביחס לשאר הדף. Azure Document Intelligence מחזיר נתוני תיבות הגבול ומידע נוסף בפורמט JSON מובנה ששומר על הקשרים מהמסמך המקורי.
כדי לבנות מודל חילוץ מסמכים מדויק מאפס נדרש מומחיות בלמידה עמוקה, כמויות גדולות של מחשוב וזמני הכשרה ארוכים. Azure Document Intelligence מספק מודלים בסיסיים שכבר אומנו על אלפי דוגמאות טפסים, כך שתוכל להשיג חילוץ נתונים בדיוק גבוה במאמץ מינימלי.
רכיבי שירותי מודיעין במסמכים
Azure Document Intelligence מורכב משלוש קטגוריות של מודלים:
מודלים לניתוח מסמכים: חילוץ טקסט, מבנה, טבלאות וסימני בחירה ממסמכים. מודל הקריאה מחלץ טקסט ומזהה שפות, בעוד שמודל הפריסה מוסיף חילוץ טבלה ומבנה. תחקור את הדגמים הללו לעומק ביחידת Use Prebuilt Models .
מודלים מוכנים מראש: חילוץ מידע מסוגי מסמכים נפוצים — כגון חשבוניות, קבלות, טפסי מס, מסמכי זיהוי ועוד — ללא צורך בהכשרה. תראה את הרשימה המלאה של הדגמים המוכנים מראש ביחידת Use Prebuilt Models .
מודלים מותאמים אישית: חילוץ נתונים מטפסים הספציפיים לעסק שלך באמצעות מערכי נתונים מתויגים משלך. האפשרויות כוללות מודלים מותאמים אישית (מהירים וחסכוניים לפריסות קבועות), מודלים עצביים מותאמים אישית (דיוק גבוה יותר לפריסות משתנות), מודלים מורכבים ומסווגים מותאמים אישית. תלמד על אימון ושימוש במודלים מותאמים אישית ביחידת Train ו-Wear Models .
שירותי מודיעין למסמכי גישה
ניתן לגשת ל-Azure Document Intelligence בכמה דרכים:
- REST API: מתקשר ישירות לשירות באמצעות בקשות HTTP.
- SDKs לספריית לקוחות: השתמשו ב-SDKs לפייתון, C#, Java ו-JavaScript.
- Document Intelligence Studio: כלי מקוון לחקירה, בדיקה ובניית פתרונות אינטליגנציה ויזואלית.
- פורטל Microsoft Foundry: שילוב Document Intelligence עם כלים אחרים של Foundry.
עצה
התרגיל של מודול זה מתמקד ב-SDK של פייתון. כל שפה יכולה להשתמש בשירותים REST המשמשים כברירת מחדל.
צור משאב למודיעין מסמכים
כדי להשתמש ב-Azure Document Intelligence, אתה צריך משאב Azure. באפשרותך להשתמש באחת מהאפשרויות הבאות:
- משאב Foundry: מנוי רב-שירותי שמספק גישה למספר שירותי בינה מלאכותית תחת נקודת קצה ומפתח אחד.
- משאב Azure Document Intelligence: משאב שירות יחיד המשמש רק עם Document Intelligence.
הערה
צור משאב Foundry אם אתה מתכנן לגשת למספר כלים של Foundry תחת נקודת קצה ומפתח אחד. לגישה ל-Document Intelligence בלבד, צרו משאב ייעודי ל-Document Intelligence.
דרישות קלט
Azure Document Intelligence פועל במסמכי קלט העומדים בדרישות הבאות:
- הפורמט חייב להיות JPEG, PNG, BMP, PDF (טקסט או סרוק), או TIFF. מודל הקריאה מקבל גם פורמטים של קבצי Microsoft Office.
- גודל הקובץ חייב להיות פחות מ-500 MB לשכבה הסטנדרטית ו-4MB לשכבה החינמית.
- ממדי התמונה חייבים להיות בין 50 x 50 פיקסלים לבין 10,000 x 10,000 פיקסלים.
- מסמכי PDF חייבים להיות במידות קטנות מ-17 על 17 אינץ' (גודל נייר A3).
- מסמכי PDF אינם מוגנים בסיסמה.