שתף באמצעות


מודל שנבנה מראש לזיהוי טקסט

המודל המובנה מראש לזיהוי טקסט מחלץ מילים ממסמכים ותמונות לזרמי תווים הניתנים לקריאה במכונה. הוא משתמש בזיהוי תווים אופטי (OCR) מתקדם כדי לזהות טקסט מודפס וטקסט בכתב יד בתמונות.

המודל מעבד תמונות וקבצי מסמכים כדי לחלץ שורות של טקסט מודפס או טקסט בכתב יד.

השתמש ב- Power Apps

המודל המובנה מראש של זיהוי טקסט זמין ב- Power Apps על ידי שימוש ברכיב לזיהוי טקסט. מידע נוסף: שימוש ברכיב לזיהוי טקסט ב- Power Apps

השתמש ב- Power Automate

למידע על אופן השימוש במודל זה ב- Power Automate, ראה שימוש במודל המובנה מראש לזיהוי טקסט ב- Power Automate.

שפה, פורמט וגודל שנתמכים

הקבצים שאתה יכול לסרוק עם מודל זיהוי הטקסט חייבים להיות בעלי מאפיינים אלה:

  • שפה לטקסט מודפס: אפריקאנס, אלבנית, אנגיקה (דבנאגירי), ערבית, אסטורית, אוודהי-הינדי (דוואנגירי), אזרביג'נית (לטינית), באגלית, באסקית, בלארוסית (קירילית), בלארוסית (לטינית), בהוג'פורי-הינדי (דוואנגירי), ביסלמה, בודו (דוואנאגירי), בוסנית (לטינית), בראג'בה, ברטון, בולגרית, בונדלית, בוריאט (קירילית), קטלאנית, סבואנו, צ'אמלינג, צ'מורו, צ'אטיסגארי (דוואנגירי), סינית (פשוטה), סינית (מסורתית), קורנית, קורסיקנית, קרים טטרית (לטינית), קרואטית, צ'כית, דנית, דארי, דימאל (דוואנאגירי), דוגרי (דוואנאגירי), הולנדית, אנגלית, ארזיה (קירילית), אסטונית, פארואית, פיג'ית, פיליפינית, פינית, צרפתית, פריולית, גאגאוזית (לטינית), גליצית, גרמנית, ז'ילברטזית, גונדי (דוואנגירי), גרינלנדית, גורונג (דוואנגירי), קריאולית האיטית, חלבי (דוואנאגירי), האני, הריאנווי, הוואי, הינדי, המונג דאו (לטינית), הו (דוואנאגירי), הונגרית, איסלנדית, אינארי סאמי, אינדונזית, אינטרלינגואה, אינוקטיטוט (לטינית), אירית, איטלקית, יפנית, ג'אונסארי (דוואנגירי), ג'אונרית, קבוורדיאנו, קאצ'ין (לטינית), קנגרי (דוואנאגירי), קרצ'אי-בלקר, קארה-קלפאק (קירילית), קארה-קלפאק (לטינית), קשובית, קזחית (קירילית), קזחית (לטינית), חאלינג, חאסי, קיצ'ה, קוריאנית, קורקו, קוריאק, קוסראית, קומיקית (קירילית), כורדית (ערבית), כורדית (לטינית), קורוך. (דוואנאגירי), קירגיזית (קירילית), לקוטה, לטינית, ליטאית, סורבית תחתית, לולה סאמי, לוקסמבורגית, מהאסו פאהארי (דוואנאגירי), מלאית (לטינית), מלטזית, מלטו (דוואנגירי), מנקסית, מאורית, מראטית, מונגולית (קירילית ), מונטנגרית (קירילית), מונטנגרית (לטינית), נפוליטנית, נפאלית, ניאואית, נוגיית, צפון סאמי (לטינית), נורווגית, אוקסיטנית, אוסטית, פשטו, פרסית, פולנית, פורטוגזית, פנג'אבית (ערבית), ריפוארית, רומנית, רומאנית, רוסית, סאדרי (דבנגירי), סמואנית (לטינית), סנסקריט (דוואנגרי), סנטלי (דבנגירי), סקוטית, גאלית סקוטית, סרבית (לטינית), שרפה (דבנגירי), סירמאורי (דוואנגירי), סקולט סמי, סלובקית, סלובנית, סומלית (ערבית), דרום סאמי, ספרדית, סוואהילית (לטינית), שוודית, טג'יקית (קירילית), טטרית (לטינית), טטום, תנגמי, טונגנית, טורקית, טורקמנית (לטינית), טובאן, סורבית עילית, אורדו, אויגורית (ערבית), אוזבקית (ערבית), אוזבקית (קירילית), אוזבקית (לטינית), וולאפוק, וולסר, וולשית, מערבית פריזית, יוקטק מאיה, ג'ואנג, זולו
  • שפה לטקסט בכתב יד: אנגלית, סינית (פשוטה), צרפתית, גרמנית, איטלקית, יפנית, קוריאנית, פורטוגזית, ספרדית
  • פורמט:
    • JPG
    • PNG
    • BMP
    • PDF
  • גודל: מקסימום 20 MB
  • עבור מסמכי PDF, רק 2,000 העמודים הראשונים מעובדים.

פלט של המודל

אם מזוהה מסמך, המודל לזיהוי טקסט מוציא את המידע הבא:

  • תוצאות: רשימה של שורות שחולצו מטקסט הקלט.
  • טקסט: מחרוזות המכילות את שורת הטקסט שזוהתה.
  • BoundingBox: ארבעה ערכים שמייצגים את התיבה התוחמת, המתוארים באמצעות המיקום העליון והשמאלי עם עם הרוחב והגובה שלה.

מגבלות

פעולה מגבלה תקופת חידוש
קריאות לזיהוי טקסט (לכל סביבה) 480 60 שניות

למידע נוסף‬

אימון: זיהוי טקסט באמצעות AI Builder (מודול)