透過標記您上傳的文件,您可以教 AI Builder 模型來提取您指定的欄位和資料表。
若要開始標記,請選取右邊面板上的其中一個集合。
標記欄位
若要標記欄位,請在您感興趣的欄位繪製一個矩形,並選取其對應的欄位名稱。
您隨時可以調整大小以調整您的選取範圍。
如果某個欄位在一行結束而在另一行開始,則可以使用繼續標記選項對其進行標記。
您也可以使用 Windows 中的 Control 鍵或 macOS 中的 Command ⌘ 鍵一次標記多個單字。 您可以使用 Shift 鍵選擇第一個單字和最後一個單字來標記兩者之間的所有單字。
當您將滑鼠懸停在文件中的單字上時,可能會出現淺藍色方塊。 這些方塊表示您可以在這些單字周圍繪出矩形來選取欄位。
僅適用於自訂發票模型
您可以透過重繪現有的周框方塊來覆寫預設欄位的行為。
文件中未自動偵測到的發票預設欄位會標示為「不在文件中」。 您可以將此變更為可在文件中找到,並手動標記它 (如果有的話)。
標記時,選擇自訂可顯示您新增的未標記欄位清單,選擇預設可顯示標記為「在文件中可用」的未標記預設欄位。
標記表格
在您感興趣文件中的資料表周圍繪製矩形,然後選取其對應的資料表名稱。 右側面板的內容會變更。
在資料列分隔符號之間按一下滑鼠左鍵來繪製資料列。
按 Ctrl + 按滑鼠左鍵來繪製資料行。
設定資料列和資料欄後,透過選擇標題欄並將其對應到所需的資料欄來指派要提取的標題。
資料表擷取方式的預覽會顯示在右側面板上。
如果資料表的標題帶有標籤,請選擇忽略第一列,這樣資料表的標題就不會被提取為資料表內容。
下列動畫會說明此程序:
或者,透過選擇螢幕頂部的分隔資料列和資料欄來定義資料表的資料列和資料欄。
使用進階標記模式
進階標記模式可讓您在儲存格層級為資料表加上標籤。 將此模式用於複雜資料表,例如:
- 無法使用方格進行標記的傾斜資料表。
- 當您需要擷取巢狀項目時,例如儲存格中的項目。
給定以下範例中的資料表,要提取單價,請在選擇要提取的資訊步驟中將其定義為單獨的資料欄。 您將描述、單價、數量和金額分別定義為資料表的一列,並使用進階標記模式對其進行相應的標記。
您可以在預設模式下開始進行標記,以快速擷取所有的資料列和資料行。 然後切換至進階模式以調整每個儲存格並標記巢狀項目。
資料表中的巢狀項目
您可以透過將巢狀項目定義為資料行來標記資料列中的巢狀項目。 給定以下範例中的資料表,為了提取單價,請在本文前面的選擇要提取的資訊步驟中將其定義為單獨的資料欄。 將描述、單價、數量和金額分別定義為資料表的資料行,然後相應地標記它們。
多頁資料表
如果資料表跨多個頁面,請確定已在所有頁面上標記此資料表。 在完成一頁上的資料表的標記後,選擇此表在下一頁繼續並繼續標記下一頁。 透過這樣做,您可以讓模型知道資料表可以跨越多頁。
標記完包含該資料表的所有頁面後,選擇完成即可將該資料表標記為已完全標記。
您可以標記包含合併儲存格、巢狀項目、邊框或無邊框、或咖啡漬等意外元素的複雜資料表,如下例所示。
小費
最佳做法是,確定您已上傳包含預期變化的訓練文件。 例如,包含的樣本,其整個資料表都在單一頁面,以及其資料表跨兩個或更多頁面。
標記核取方塊
若要標記核取方塊,請在您感興趣擷取的核取方塊繪製一個矩形,並選取其對應的核取方塊名稱。
如果文件品質較低,則 AI Builder 可能無法偵測到該核取方塊。 如果您無法標記核取方塊,請執行以下操作:
- 在右側面板上,選取要擷取核取方塊旁的三個點。
- 選取無法在文件中使用。
AI Builder 支援偵測和擷取核取方塊和選項按鈕等選項標記,併透過不同的標記來指示是否已標記選項。
欄位、核取方塊或資料表不在文件中或不在集合中
如果欄位、核取方塊或資料表未出現在您為訓練而上傳的某個文件或集合中,請在欄位、核取方塊或資料表右側的面板上選擇不可在文件中使用或不可在集合中使用。
標記所有集合的文件
您上傳的所有文件均可供您標記。 如果您建立了多個集合,請標記所有集合中的所有文件。
如果您的文件中不能加上欄位,請前往此文件無法載入欄位來尋找可能的解決方案。