השתמש במודלים מוכנים מראש
עצה
עיין בכרטיסייה טקסט ותמונות לפרטים נוספים!
מודלים מוכנים מראש ב-Azure Document Intelligence מאפשרים לך לחלץ נתונים מסוגי טפסים נפוצים מבלי לאמן מודלים משלך. מיקרוסופט מאמנת את המודלים הללו על מספר רב של מסמכי דוגמה, כך שתוכלו לצפות לתוצאות מדויקות ואמינות עבור סוגי מסמכים סטנדרטיים.
מודלים לניתוח מסמכים
לפני שבוחנים את המודלים המוכנים המוקדמים לתחום, חשוב להבין את מודלי ניתוח המסמכים שמבססים אותם.
מודל קריאה
מודל הקריאה מחלץ טקסט מודפס וכתוב ביד ממסמכים ותמונות. הוא מזהה את שפת כל שורת טקסט ומסווג האם הטקסט כתוב בכתב יד או מודפס. מודל הקריאה משמש כבסיס לחילוץ טקסט בכל מודלי Document Intelligence האחרים.
עבור קבצי PDF או TIFF מרובי עמודים, ניתן להשתמש בפרמטר pages שבבקשה שלך כדי להגדיר טווח עמודים לניתוח.
מודל הקריאה אידיאלי כאשר רוצים לחלץ מילים ושורות ממסמכים ללא מבנה קבוע או צפוי.
מודל הפריסה
מודל הפריסה מרחיב את תהליך חילוץ הטקסט של מודל הקריאה עם זיהוי סימני בחירה, טבלאות ומידע על מבנה המסמך. הוא גם תומך בתכונה אופציונלית keyValuePairs לחילוץ זוגות מפתח-ערך.
כשאתה מדגיטל מסמך, הוא יכול להיות בזווית, או לטבלאות יש מבנים מורכבים עם תאים ממוזגים או שורות לא שלמות. מודל הפריסה יכול להתמודד עם הקשיים הללו. כל תא טבלה מחולק עם התוכן שלו, מיקום תיבת הגבול ואינדקסי השורות/עמודות.
סימני בחירה (תיבות סימון וכפתורי רדיו) מופקים עם תיבת הגבול שלהם, רמת הביטחון, והאם הם נבחרו.
הערה
מודל המסמך הכללי היה זמין בגרסאות מוקדמות יותר של Document Intelligence, אך בוטל בגרסה המקורית2023-10-31-preview. הפונקציונליות שלו ליצירת זוג מפתח-ערך וישות שולבה במודל הפריסה ובתכונות נוספות.
מודלים מוכנים מראש לסוגי מסמכים ספציפיים
Azure Document Intelligence כולל מודלים מוכנים מראש שאומנו על סוגי מסמכים ספציפיים. המודלים המוכנים הבאים הם כמה דוגמאות הזמינות לחילוץ שדות ממסמכי עסק נפוצים:
מסמכים פיננסיים ומשפטיים
| מודל | תיאור |
|---|---|
| חשבונית | מחלץ את שם הלקוח, פרטי הספק, מספר הזמנת רכש, חשבונית ותאריכי תשלום, כתובות חיוב ומשלוח, פריטי שורה וסך הכוללים. |
| קבלה | מחלץ פרטי סוחר, תאריך ושעת העסקה, פריטי שורה וסך הכוללים. תומך בעיבוד קבלות מלון בעמוד אחד. |
| דוח בנק | מחלץ מידע על חשבון, יתרות התחלה וסיום, ופרטי עסקאות. |
| צ'ק | מחלץ את המקבל, סכום, תאריך ומידע רלוונטי נוסף. |
| תלוש שכר | חילוץ משכורות, שעות, הידוקים, תשלום נטו ושדות מקטע תשלום נפוצים אחרים. |
| כרטיס אשראי | מחלץ מידע על כרטיסי תשלום. |
| חוזה | מוציא הסכמה ופרטי צדדים. |
מסמכי מס בארה"ב
| מודל | תיאור |
|---|---|
| מס מאוחד בארה"ב | מודל יחיד שמחלץ מכל סוג טופס מס אמריקאי נתמך. |
| W-2 | מחלץ את פרטי הפיצוי החייבים במס. |
| 1098 ווריאציות | גובה ריבית משכנתא ופרטים קשורים. |
| 1099 וגרסאות | מפיקה הכנסה ממקורות שונים. |
| 1040 והווריאציות | מחלץ פרטי דוחות מס הכנסה אישיים. |
מסמכי משכנתא בארה"ב
| מודל | תיאור |
|---|---|
| 1003 (URLA) | אוסף פרטי בקשת הלוואה. |
| 1004 (URAR) | מפיק מידע מהערכות שווי נכסים. |
| 1005 | מחלץ מידע על אימות תעסוקה. |
| 1008 | מחלץ פרטי העברת הלוואה. |
| גילוי סגירה | מוציא את תנאי הסגירה הסופיים. |
מסמכי זיהוי אישיים
| מודל | תיאור |
|---|---|
| מסמך זיהוי | מחלץ פרטים מרישיונות נהיגה אמריקאיים, תעודות זהות ורישיונות נהיגה של האיחוד האירופי, ודרכונים בינלאומיים. כולל שמות, תאריכי לידה, מספרי מסמכים ותמויות או הגבלות. |
| כרטיס ביטוח בריאות | מחלץ שדות משותפים מכרטיסי ביטוח בריאות בארה"ב. |
| תעודת נישואין | אוסף מידע נישואין מאושר. |
חשוב
מודל מסמכי הזיהוי מחלץ מידע אישי המכוסה על ידי חוקי הגנת המידע ברוב תחומי השיפוט. ודא שיש לך את רשות האדם לאחסן את הנתונים שלו ושאתה עומד בכל הדרישות החוקיות הרלוונטיות.
תכונות של מודלים שנבנו מראש
מודלים מוכנים מראש נועדו לחלץ סוגים שונים של נתונים ממסמכים. תכונות אלה כוללות:
- חילוץ טקסט: כל המודלים המוכנים מראש מחלצים שורות ומילים מטקסט בכתב יד ומודפס.
- זוגות מפתח-ערך: קטעי טקסט שמזהים תווית ותגובתה. לדוגמה, משקלו-31 ק"ג.
- סימני בחירה: תיבות סימון וכפתורי רדיו, כולל האם הם נבחרו או לא.
- טבלאות: נתונים בתאים, כולל מספר העמודות והשורות, כותרות עמודות ושורות, ותאים ממוזגים.
-
שדות: מודלים שאומנו לסוג טופס מסוים מזהים סט קבוע של שדות. לדוגמה, מודל החשבונית מחלץ
CustomerNameו-InvoiceTotal.
מתי להשתמש בדגמים מוכנים מראש לעומת דגמים מותאמים אישית
דגמים מוכנים מראש מכסים את סוגי המסמכים הנפוצים ביותר. אם יש לך סוג צורה ייחודי או ספציפי לתעשייה, ייתכן שתקבל תוצאות מדויקות יותר עם דגם מותאם אישית. עם זאת, מודלים מותאמים אישית דורשים זמן ונתוני דגימות כדי להכשיר. תמיד בדוק אם קיים מודל מוכן לתרחיש שלך לפני שאתה משקיע בפיתוח מודלים מותאמים אישית.