共用方式為


快速入門:自訂摘要 (預覽)

使用本文開始建立自訂摘要專案,您可在其中定型除了摘要之外的自訂模型。 模型是定型以用來執行特定工作的人工智慧軟體。 在此系統中,模型會從匯入的資料學習,藉此摘要說明文字並且定型。

在本文中,我們會使用 Language Studio 來示自訂摘要的重要概念。 例如,我們將建置自訂摘要模型,以從簡短的出院記錄中擷取設施或治療地點。

必要條件

建立新的 Azure AI 語言資源和 Azure 儲存體帳戶

使用自訂摘要之前,您必須建立 Azure AI 語言資源,因為此資源提供建立專案和開始訓練模型必要的認證。 您也需要 Azure 儲存體帳戶,然後在此帳戶上傳用來組建模型的資料集。

重要

若要快速開始使用,建議您使用本文中提供的步驟來建立新的 Azure AI 語言資源。 使用本文中的步驟將可讓您以更輕鬆的方式,同時建立語言資源與儲存體帳戶。

從 Azure 入口網站建立新的資源

  1. 移至 Azure 入口網站以建立新的 Azure AI 語言資源。

  2. 在出現的視窗中,從自訂功能中選取此服務。 選取畫面底部的 [繼續建立您的資源]。

    螢幕擷取畫面顯示 Azure 入口網站中的自訂文字分類自訂具名實體辨識。

  3. 使用下列詳細資料建立語言資源。

    名稱 描述
    訂用帳戶 您的 Azure 訂閱。
    資源群組 將包含您資源的資源群組。 您可以使用現有群組或建立新的群組。
    區域 語言資源的區域。 例如,「美國西部 2」。
    名稱 您的資源名稱。
    定價層 語言資源的定價層。 您可使用免費 (F0) 層來試用服務。

    注意

    如果您收到訊息指出「您的登入帳戶不是所選儲存體帳戶資源群組的擁有者」,您的帳戶必須先在資源群組上指派擁有者角色,才能建立語言資源。 請連絡您的 Azure 訂閱擁有者以取得協助。

  4. 在此服務的區段中,選取現有儲存體帳戶,或選取 [新增儲存體帳戶]。 這些值可協助您開始使用,但不一定是您想要在生產環境中使用的儲存體帳戶值。 若要避免在建置專案期間延遲,請連線至與語言資源位於相同區域中的儲存體帳戶。

    儲存體帳戶值 建議值
    儲存體帳戶名稱 任何名稱
    Storage account type 標準 LRS
  5. 請確定已核取負責任 AI 通知。 選取頁面底部的 [檢閱 + 建立] 按鈕,然後選取 [建立]

下載範例資料

如果您需要範例資料,我們針對文字摘要交談摘要案例提供了一些範例資料,以達到本快速入門的目的。

將範例資料上傳至 Blob 容器

  1. 找出要上傳至儲存體帳戶的檔案

  2. Azure 入口網站中,瀏覽至您建立的儲存體帳戶,然後加以選取。

  3. 在您的儲存體帳戶中,從左側功能表中 [資料儲存體] 的下方選取 [容器]。 在出現的畫面中,選取 [+ 容器]。 為容器指定名稱 example-data,並保留預設的公用存取層級

    螢幕擷取畫面顯示儲存體帳戶的主要頁面。

  4. 建立容器之後,請加以選取。 然後選取 [上傳] 按鈕,以選取您稍早下載的 .txt.json 檔案。

    螢幕擷取畫面顯示將檔案上傳至儲存體帳戶的按鈕。

建立自訂摘要專案

設定好資源和儲存體帳戶之後,請建立新的自訂摘要專案。 專案是一個工作區域,用於根據您的資料建置自訂 ML 模型。 您的專案只能由您和具有要使用的語言資源存取權的其他人員存取。

  1. 登入 Language Studio。 隨即出現一個視窗,讓您選取訂用帳戶和語言資源。 選取您在上一個步驟中建立的語言資源。

  2. 選取您想要在 Language Studio 中使用的功能。

  3. 從專案頁面頂端的功能表中選取 [建立新專案]。 建立專案可讓您標示資料、定型、評估、改善以及部署模型。

    專案建立頁面的螢幕擷取畫面。

  4. 輸入專案資訊,包括名稱、描述以及您專案中檔案的語言。 如果您使用範例資料集,請選取 [英文]。 您之後無法變更專案名稱。 選取下一個

    提示

    您的資料集不需要完全採用相同的語言。 您可以有多個文件,每個文件都有不同的支援語言。 如果資料集包含不同語言的文件,或者如果您預期在執行階段使用不同語言的文字,請在您輸入專案的基本資訊時,選取 [啟用多語言資料集] 選項。 您稍後可以從 [專案設定] 頁面啟用此選項。

  5. 選取 [建立新專案] 之後,隨即會出現一個視窗,讓您連線您的儲存體帳戶。 如果您已連線儲存體帳戶,您會看到該儲存體帳戶已連線。 如果沒有,請從出現的下拉式清單中選擇儲存體帳戶,然後選取 [連線儲存體帳戶];這會為您的儲存體帳戶設定必要角色。 如果您在該儲存體帳戶上未獲指派為擁有者身分,此步驟可能會傳回錯誤。

    注意

    • 您只需要針對您使用的每個新資源執行此步驟一次。
    • 此程序無法復原,如果您將儲存體帳戶連線到語言資源,之後就無法中斷連線。
    • 您只能將語言資源連線到一個儲存體帳戶。
  6. 選取您已上傳資料集的容器。

  7. 如果您已經標示資料,請確定其遵循支援的格式,然後選取 [是,我的檔案已加上標籤,而且我已設定 JSON 標籤檔案的格式],然後從下拉式功能表中選取標籤檔案。 選取 [下一步]。 如果您使用快速入門中的資料集,則不需要檢閱 JSON 標籤檔案的格式設定。

  8. 檢閱您輸入的資料,然後選取 [建立專案]

定型您的模型

建立專案之後,請繼續開始定型模型。

若要從 Language Studio 內開始定型模型:

  1. 從左側功能表中,選取 [定型工作]

  2. 從頂端功能表中選取 [開始定型作業]

  3. 選取 [定型新模型],然後在文字方塊中輸入模型名稱。 您也可以藉由選取此選項來覆寫現有的模型,然後從下拉式功能表中選擇您想要覆寫的模型。 覆寫定型的模型是無法復原的,但在您部署新模型之前,不會影響已部署的模型。

    建立新定型作業

  4. 系統預設會根據指定的百分比,將已標示的資料分割為訓練集或測試集。 如果您的測試集中有文件,就可以手動分割訓練與測試資料。

  5. 選取 [定型] 按鈕。

  6. 如果您從清單中選取 [定型作業識別碼],則會顯示側邊窗格,您可以在其中檢查此作業的 [定型進度]、[作業狀態] 和其他詳細資料。

    注意

    • 只有成功完成的定型作業才會產生模型。
    • 定型可能需要幾分鐘到數小時的時間,以標記的資料大小而定。
    • 您一次只能執行一個定型作業。 除非執行中的作業完成,否則無法在同一個專案內啟動其他定型作業。

部署模型

一般來說,在定型模型之後,您可以檢閱其評估詳細資料,並視需要加以改善。 在本快速入門中,您只需要部署您的模型,使其可供您在 Language Studio 中試用。

若要從 Language Studio 內部署您的模型:

  1. 從左側功能表中,選取 [部署模型]

  2. 選取 [新增部署] 以啟動新的部署作業。

    螢幕擷取畫面顯示部署按鈕

  3. 選取 [建立新的部署] 以建立新的部署,並從下方的下拉式清單中指派定型的模型。 您也可以選取此選項來覆寫現有的部署,然後從下方的下拉式清單中,選取您想要為其指派的定型模型。

    注意

    覆寫現有的部署不需要變更預測 API 呼叫,但您取得的結果將會以新指派的模型為基礎。

    螢幕擷取畫面顯示部署畫面

  4. 選取 [部署] 以啟動部署作業。

  5. 部署成功之後,在其旁邊會出現到期日。 部署到期表示部署的模型無法再用於預測,通常發生於定型組態到期的十二個月後。

測試您的模型

在本快速入門中,您將使用 Language Studio 提交自訂摘要工作,並將結果視覺化。 在稍早下載的範例資料集中,您可以找到一些可在此步驟中使用的測試文件。

若要從 Language Studio 內測試已部署的模型:

  1. 從左側功能表中,選取 [測試部署]

  2. 選取您要測試的部署。 您只能測試指派給部署的模型。

  3. 針對多語系專案,從語言下拉式清單中,選取您要測試的文字語言。

  4. 從下拉式清單選取您要查詢/測試的部署。

  5. 您可以輸入想在要求中提交的文字,或上傳要使用的 .txt 檔案。

  6. 選取頂端功能表中的 [執行測試]。

  7. 在 [結果] 索引標籤中,您可以看到來自您文字的已擷取實體及實體的類型。 您也可以在 [JSON] 索引標籤下檢視 JSON 回應。

螢幕擷取畫面顯示模型測試結果。

清除資源

當您不再需要專案時,可以使用 Language Studio 來刪除您的專案。 選取您在頂端所使用的功能,然後選取您要刪除的專案。 選取頂端功能表中的 [刪除] 以刪除專案。

下一步