如何針對自訂文字分類使用自動標籤

標記程序是在準備資料集時的重要部分。 由於此程式需要大量時間和精力,因此您可以使用自動標籤功能,以您想要將其分類的類別自動標記檔。 您目前可以使用 GPT 模型,根據模型啟動自動標記作業,您可以在其中立即觸發自動標籤作業,而不需要任何先前的模型定型。 這項功能可節省手動標記檔的時間和精力。

必要條件

在您可以搭配 GPT 使用自動標籤之前,您需要:


觸發自動標籤作業

當您使用 GPT 觸發自動標籤作業時,系統會根據使用量向您收取 Azure OpenAI 資源的費用。 系統會向您收取自動標記每個檔中權杖數目的估計費用。 如需不同模型每個權杖定價的詳細明細,請參閱 Azure OpenAI 定價頁面

  1. 從左側導覽功能表中,選取 [資料標籤]。

  2. 選取頁面右側 [活動] 窗格底下的 [ 自動標籤 ] 按鈕。

    顯示如何從活動窗格觸發自動標記作業的螢幕擷取畫面。

  3. 選擇 [使用 GPT 自動標籤],然後選取 [下一步]。

    顯示自動套用標籤之模型選擇的螢幕擷取畫面。

  4. 選擇您的 Azure OpenAI 資源和部署。 您必須 建立 Azure OpenAI 資源並部署模型 ,才能繼續進行。

    顯示如何選擇 OpenAI 資源和部署的螢幕擷取畫面

  5. 選取您想要包含在自動標籤作業中的類別。 根據預設,會選取所有類別。 對於類別具有描述性名稱,並建議針對每個類別包含範例,以 GPT 達到良好的品質標籤。

    螢幕擷取畫面,顯示要包含在自動標記作業中的標籤。

  6. 選擇要自動標記的文件。 建議您從篩選條件中選擇未標記的文件。

    注意

    • 如果檔已自動加上標籤,但此標籤已經是使用者定義的,則只會使用使用者定義的標籤。
    • 您可以按一下文件名稱來檢視文件。

    顯示自動標記作業應該包含哪些文件的螢幕擷取畫面。

  7. 選取 [啟動作業 ] 以觸發自動標籤作業。 您應該導向至自動標籤頁面,其中顯示起始的自動標籤作業。 根據您包含的檔數目而定,自動標記作業可能需要幾秒鐘到幾分鐘的時間。

    螢幕擷取畫面顯示了自動標記作業的檢閱畫面。


檢閱已自動標記的文件

當自動標籤作業完成時,您可以在 Language Studio 的 [ 資料標籤 ] 頁面中看到輸出檔案。 選取 [檢閱具有自動標記的文件],以檢視已套用已自動標記篩選條件的文件。

顯示自動標記檔的螢幕擷取畫面

已自動分類的檔已以紫色醒目提示的活動窗格中建議標籤。 每個建議標籤都有兩個選取器 (核取記號和取消圖示) ,可讓您接受或拒絕自動標籤。

接受標籤之後,紫色色彩會變更為預設藍色,且標籤會包含在任何進一步的模型定型中,成為使用者定義的標籤。

接受或拒絕自動標記檔的標籤之後,請選取 [ 儲存標籤 ] 以套用變更。

注意

  • 建議您先驗證自動加上標籤的檔,再接受檔。
  • 當您定型模型時,會刪除所有不接受的標籤。

顯示如何接受和拒絕自動標記檔的螢幕擷取畫面。

下一步