שתף באמצעות


יצירת מחלץ ב- Microsoft Syntex

חל על: - עיבוד מסמכים לא רשום



לפני או אחרי יצירת מודל מסווג כדי להפוך זיהוי וסיווג לאוטומטיים של סוגי מסמכים ספציפיים, באפשרותך לבחור להוסיף חילוצים למודל שלך כדי למשוך מידע ספציפי ממסמכים אלה. לדוגמה, ייתכן שתרצה שהמודל שלך המזהה לא רק את כל מסמכי חידוש החוזים שנוספו לספריית המסמכים, אלא גם יציג את תאריך ההתחלה של השירות עבור כל מסמך כערך עמודה בספריית המסמכים.

עליך ליצור מחלץ עבור כל ישות במסמך שברצונך לחלץ. בדוגמה שלנו, אנו רוצים לחלץ את תאריך ההתחלה של השירותעבור כל מסמך חידוש חוזה המזוהה על-ידי המודל. אנחנו רוצים לראות תצוגה בספריית המסמכים של כל מסמכי חידוש החוזים, עם עמודה המציגה את ערך תאריך ההתחלה של השירות של כל מסמך.

הערה

כדי ליצור מחלץ, עליך להשתמש באותם קבצים שהעלית קודם לכן כדי לתרגל את מסווג.

תן שם למחלץ שלך

  1. מתוך דף הבית של המודל, האריח צור והדריך את המחלץ , בחר מחלץ תרגול.

  2. במסך מחלץ ישות חדשה , הקלד את שם המחלץ בשדה שם מחלץ חדש. לדוגמה, תן לו את שם תאריך ההתחלה של השירות אם ברצונך לחלץ את תאריך ההתחלה של השירות מכל מסמך של חידוש חוזה. באפשרותך גם לבחור לעשות שימוש חוזר בעמודה שנוצרה בעבר (לדוגמה, עמודת מטה-נתונים מנוהלים).

    כברירת מחדל, סוג העמודה הוא שורת טקסט בודדת. אם ברצונך לשנות את סוג העמודה, בחר הגדרות מתקדמות>סוג עמודה ולאחר מכן בחר את הסוג שבו ברצונך להשתמש.

    צילום מסך של החלק 'הגדרות מתקדמות' בלוח 'מחלץ ישות חדשה' המציג את האפשרות 'סוג עמודה'.

    הערה

    עבור חילוצים עם סוג העמודה שורת טקסט בודדת, מגבלת התווים המרבית היא 255. כל התווים שתבחר חורגים מהמגבלה ייחתכו. כדי לבחור יותר מ- 255 תווים, בחר בסוג העמודה שורות מרובות של טקסט בעת יצירת המחלץ.

    כברירת מחדל, עמודות טקסט מרובות נוצרות עם מגבלה על כמות הטקסט שניתן להוסיף. במקרה זה, טקסט שחולץ עשוי להיראות חתוך. במקרה כזה, ניתן להשתמש בהגדרת העמודה אפשר אורך בלתי מוגבל בספריות מסמכים כדי להסיר את המגבלה.

  3. לאחר שתסיים, בחר צור.

הוספת תווית

השלב הבא הוא להוסיף תווית לישות שברצונך לחלץ בקובצי ההדרכה לדוגמה שלך.

יצירת המחלץ פותחת את דף המחלץ. כאן תראה רשימה של הקבצים לדוגמה, כאשר הקובץ הראשון ברשימה מוצג במציג.

  1. מהצופה, בחר את הנתונים שברצונך לחלץ מהקבצים. לדוגמה, אם ברצונך לחלץ את תאריך שירות ההתחלה, עליך לסמן את ערך התאריך בקובץ הראשון (יום שני, 14 באוקטובר 2022). ולאחר מכן בחר שמור. אתה אמור לראות את תצוגת הערך מהקובץ ברשימה דוגמאות עם תוויות, תחת העמודה תווית.

  2. בחר הקובץ הבא כדי לשמור אוטומטית ולפתוח את הקובץ הבא ברשימה במציג. לחלופין , בחר שמור ולאחר מכן בחר קובץ אחר מהרשימה דוגמאות עם תוויות .

  3. במציג, חזור על שלבים 1 ו- 2 ולאחר מכן חזור על פעולה זו עד ששמרת את התווית בכל חמשת הקבצים.

    הגדרות מתקדמות.

לאחר הוספת תווית לחמישה קבצים, מוצגת כרזת הודעה המודיעה לך לעבור להדרכה. באפשרותך לבחור להוסיף יותר תוויות למסמכים או להתקדם להדרכה.

השתמש ב'חיפוש' כדי לחפש בקובץ שלך

באפשרותך להשתמש בתכונה ' חיפוש' כדי לחפש ישות במסמך שברצונך להוסיף לה תווית.

חפש בקובץ.

התכונה 'חיפוש' שימושית אם אתה מחפש במסמך גדול או אם קיימים מופעים מרובים של הישות במסמך. אם אתה מוצא מופעים מרובים, באפשרותך לבחור את המופע הדרוש בתוצאות החיפוש כדי לעבור למיקום זה במציג כדי להוסיף לו תווית.

הוסף הסבר

לדוגמה, אנו עשויים ליצור הסבר המספק רמז לגבי תבנית הישות עצמה וריאציות שייתכן שיש לה במסמכים לדוגמה. לדוגמה, ערך תאריך יכול להיות בכמה תבניות שונות, כגון:

  • 10/14/2022
  • ה-14 באוקטובר 2022
  • יום שני, 14 באוקטובר 2022

כדי לסייע בזיהוי תאריך ההתחלה של השירות, באפשרותך ליצור הסבר תבנית.

  1. במקטע הסבר, בחר חדש והקלד שם (לדוגמה, תאריך).
  2. עבור סוג, בחר רשימת תבניות.
  3. עבור ערך, ספק את וריאציית התאריך כפי שהן מופיעות בקבצים לדוגמה. לדוגמה, אם יש לך תבניות תאריך המופיעות כ- 00/0/0000, הזן וריאציות המופיעות במסמכים שלך, כגון:
    • 0/0/0000
    • 0/00/0000
    • 00/0/0000
    • 00/00/0000
  4. לחץ שמור.

הערה

לקבלת מידע נוסף אודות סוגי הסברים, ראה סוגי הסברים.

שימוש בספריית ההסברים

ליצירת הסברים עבור פריטים כגון תאריכים, קל יותר להשתמש בספריית ההסברים מאשר להזין את כל הווריאציות באופן ידני. ספריית ההסברים היא ערכה של ביטויים בנויים מראש והסברים של תבניות. הספריה מנסה לספק את כל התבניות עבור צירופי מילים נפוצים או רשימות תבניות, כגון תאריכים, מספרי טלפון, מיקודים ורשימות רבות אחרות.

עבור הדוגמה 'תאריך התחלה של שירות', יעיל יותר להשתמש בהסבר המוכלל מראש עבור ' תאריך' בספריית ההסברים:

  1. במקטע הסבר , בחר חדש ולאחר מכן בחר מספריית ההסברים מתוך.

  2. מספריית ההסברים, בחר תאריך. באפשרותך להציג את כל הווריאציות של התאריך המזוהים.

  3. בחר הוסף.

    ספריית הסברים.

  4. בדף יצירת הסבר, פרטי תאריך מספריית ההסבר ממלאים את השדות באופן אוטומטי. לחץ שמור.

    תאריך.

תרגל את המודל

שמירת ההסבר שלך מתחילה בהדרכה. אם במודל שלך יש מספיק מידע כדי לחלץ את הנתונים מקבצים לדוגמה עם התווית, תראה כל קובץ עם התווית התאם.

להתאים.

אם ההסבר אינו כולל מספיק מידע כדי למצוא את הנתונים שברצונך לחלץ, כל קובץ יהיה עם תווית אי-התאמה. באפשרותך לבחור קבצים לא תואמים כדי לראות מידע נוסף אודות הסיבה לאי-התאמה.

הוסף הסבר נוסף

לעתים קרובות, אי-ההתאמה מעידה על כך שההסבר שסיפקנו לא סיפקנו די מידע כדי לחלץ את ערך תאריך ההתחלה של השירות כך שיתאים לקבצים שלנו עם התווית. ייתכן שיהיה עליך לערוך אותו, או להוסיף הסבר נוסף.

לדוגמה, שים לב שתאריך שירות ההתחלה של מחרוזת הטקסט מופיע תמיד לפני הערך הממשי. כדי לסייע בזיהוי תאריך ההתחלה של השירות, עליך ליצור הסבר בנושא צירוף מילים.

  1. במקטע הסבר, בחר חדש ולאחר מכן הקלד שם (לדוגמה, מחרוזת קידומת).

  2. עבור הסוג, בחר רשימת צירופי מילים.

  3. השתמש בתאריך ההתחלה של השירות כערך.

  4. לחץ שמור.

    מחרוזת קידומת.

תרגול המודל שוב

שמירת ההסבר מתחילה את ההדרכה שוב, הפעם באמצעות שני ההסברים בדוגמה. אם למודל שלך יש מספיק מידע כדי לחלץ את הנתונים מקבצים לדוגמה עם התווית, תראה כל קובץ עם התווית התאם.

אם אתה מקבל שוב אי-התאמה בקבצים המסומנים בתווית, ייתכן שתצטרך ליצור הסבר נוסף כדי לספק למודל מידע נוסף כדי לזהות את סוג המסמך, או לשקול לבצע שינויים בקבצים הקיימים שלך.

בדוק את הדגם שלך

אם אתה מקבל התאמה בקבצים לדוגמה עם התווית, כעת באפשרותך לבדוק את המודל על הקבצים הנותרים לדוגמה ללא תווית. שלב זה הוא אופציונלי, אך שימושי להעריך את ה"כושר" או המוכנות של המודל לפני השימוש בו, על-ידי בדיקתו בקבצים שהמודל לא ראה קודם לכן.

  1. בדף הבית של המודל, בחר את הכרטיסיה בדיקה. פעולה זו תפעיל את המודל בקבצים לדוגמה ללא תבליטים.

  2. ברשימה בדוק קבצים , הקבצים לדוגמה שלך מוצגים כדי להראות אם למודל יש אפשרות לחלץ את המידע הדרוש לך. השתמש במידע זה כדי לקבוע את יעילות סיווגך בזיהוי המסמכים שלך.

    בדוק את הקבצים שלך.

מיקוד נוסף של מחלץ

אם יש לך ישויות כפולות וברצונך לחלץ ערך אחד בלבד או מספר מסוים של ערכים, באפשרותך להגדיר כלל כדי לציין כיצד ברצונך לעבד אותו. כדי להוסיף כלל כדי למקד מידע שחולץ, בצע את הפעולות הבאות:

  1. בדף הבית של המודל, במקטע מחלץ ישות, בחר את המחלץ שברצונך למקד ולאחר מכן בחר מקד מידע שחולץ.

    צילום מסך של המקטע 'מחלץ ישות' המציג את האפשרות 'מקד מידע שחולץ' מסומנת.

  2. בדף מקד מידע שחולץ , בחר אחד מהחוקים הבאים:

    • שמירת אחד או יותר מהערכים הראשונים
    • שמירת אחד או יותר מהערכים האחרונים
    • הסרת ערכים כפולים
    • שמירת אחת או יותר מהשורות הראשונות
    • שמירת אחת או יותר מהשורות הבאות

    צילום מסך של הדף 'מקד מידע שחולץ' המציג את אפשרויות הכללים.

  3. הזן את מספר השורות או הערכים שבהם ברצונך להשתמש ולאחר מכן בחר מקד.

  4. אם ברצונך לערוך כלל על-ידי שינוי מספר השורות או הערכים, בחר את המחלץ שברצונך לערוך, בחר מקד מידע שחולץ , שנה את המספר ולאחר מכן בחר שמור.

  5. בעת בדיקת המחלץ, תוכל לראות את העידון בעמודה תוצאת מיקוד של הרשימה Test Files.

    הרשימה 'בדוק קבצים' מציגה את עמודת התוצאה 'מיקוד'.

  6. אם ברצונך למחוק כלל עידון במחלץ, בחר את המחלץ ממנו ברצונך להסיר את הכלל, בחר מקד מידע שחולץ ולאחר מכן בחר מחק.

למידע נוסף

יצירת מסווג

סוגי הסבר

מינוף טקסונומיה של מאגר מונחים בעת יצירת מחלץ

מצב נגישות של Syntex