快速入門:自訂摘要 (預覽)
使用本文開始建立自訂摘要專案,您可在其中定型除了摘要之外的自訂模型。 模型是定型以用來執行特定工作的人工智慧軟體。 在此系統中,模型會從匯入的資料學習,藉此摘要說明文字並且定型。
在本文中,我們會使用 Language Studio 來示自訂摘要的重要概念。 例如,我們將建置自訂摘要模型,以從簡短的出院記錄中擷取設施或治療地點。
必要條件
- Azure 訂用帳戶 - 建立免費帳戶
建立新的 Azure AI 語言資源和 Azure 儲存體帳戶
使用自訂摘要之前,您必須建立 Azure AI 語言資源,因為此資源提供建立專案和開始訓練模型必要的認證。 您也需要 Azure 儲存體帳戶,然後在此帳戶上傳用來組建模型的資料集。
重要
若要快速開始使用,建議您使用本文中提供的步驟來建立新的 Azure AI 語言資源。 使用本文中的步驟將可讓您以更輕鬆的方式,同時建立語言資源與儲存體帳戶。
從 Azure 入口網站建立新的資源
移至 Azure 入口網站以建立新的 Azure AI 語言資源。
在出現的視窗中,從自訂功能中選取此服務。 選取畫面底部的 [繼續建立您的資源]。
使用下列詳細資料建立語言資源。
名稱 描述 訂用帳戶 您的 Azure 訂閱。 資源群組 將包含您資源的資源群組。 您可以使用現有群組或建立新的群組。 區域 語言資源的區域。 例如,「美國西部 2」。 名稱 您的資源名稱。 定價層 語言資源的定價層。 您可使用免費 (F0) 層來試用服務。 注意
如果您收到訊息指出「您的登入帳戶不是所選儲存體帳戶資源群組的擁有者」,您的帳戶必須先在資源群組上指派擁有者角色,才能建立語言資源。 請連絡您的 Azure 訂閱擁有者以取得協助。
在此服務的區段中,選取現有儲存體帳戶,或選取 [新增儲存體帳戶]。 這些值可協助您開始使用,但不一定是您想要在生產環境中使用的儲存體帳戶值。 若要避免在建置專案期間延遲,請連線至與語言資源位於相同區域中的儲存體帳戶。
儲存體帳戶值 建議值 儲存體帳戶名稱 任何名稱 Storage account type 標準 LRS 請確定已核取負責任 AI 通知。 選取頁面底部的 [檢閱 + 建立] 按鈕,然後選取 [建立]。
下載範例資料
如果您需要範例資料,我們針對文字摘要和交談摘要案例提供了一些範例資料,以達到本快速入門的目的。
將範例資料上傳至 Blob 容器
找出要上傳至儲存體帳戶的檔案
在 Azure 入口網站中,瀏覽至您建立的儲存體帳戶,然後加以選取。
在您的儲存體帳戶中,從左側功能表中 [資料儲存體] 的下方選取 [容器]。 在出現的畫面中,選取 [+ 容器]。 為容器指定名稱 example-data,並保留預設的公用存取層級。
建立容器之後,請加以選取。 然後選取 [上傳] 按鈕,以選取您稍早下載的
.txt
和.json
檔案。
建立自訂摘要專案
設定好資源和儲存體帳戶之後,請建立新的自訂摘要專案。 專案是一個工作區域,用於根據您的資料建置自訂 ML 模型。 您的專案只能由您和具有要使用的語言資源存取權的其他人員存取。
登入 Language Studio。 隨即出現一個視窗,讓您選取訂用帳戶和語言資源。 選取您在上一個步驟中建立的語言資源。
選取您想要在 Language Studio 中使用的功能。
從專案頁面頂端的功能表中選取 [建立新專案]。 建立專案可讓您標示資料、定型、評估、改善以及部署模型。
輸入專案資訊,包括名稱、描述以及您專案中檔案的語言。 如果您使用範例資料集,請選取 [英文]。 您之後無法變更專案名稱。 選取下一個
提示
您的資料集不需要完全採用相同的語言。 您可以有多個文件,每個文件都有不同的支援語言。 如果資料集包含不同語言的文件,或者如果您預期在執行階段使用不同語言的文字,請在您輸入專案的基本資訊時,選取 [啟用多語言資料集] 選項。 您稍後可以從 [專案設定] 頁面啟用此選項。
選取 [建立新專案] 之後,隨即會出現一個視窗,讓您連線您的儲存體帳戶。 如果您已連線儲存體帳戶,您會看到該儲存體帳戶已連線。 如果沒有,請從出現的下拉式清單中選擇儲存體帳戶,然後選取 [連線儲存體帳戶];這會為您的儲存體帳戶設定必要角色。 如果您在該儲存體帳戶上未獲指派為擁有者身分,此步驟可能會傳回錯誤。
注意
- 您只需要針對您使用的每個新資源執行此步驟一次。
- 此程序無法復原,如果您將儲存體帳戶連線到語言資源,之後就無法中斷連線。
- 您只能將語言資源連線到一個儲存體帳戶。
選取您已上傳資料集的容器。
如果您已經標示資料,請確定其遵循支援的格式,然後選取 [是,我的檔案已加上標籤,而且我已設定 JSON 標籤檔案的格式],然後從下拉式功能表中選取標籤檔案。 選取 [下一步]。 如果您使用快速入門中的資料集,則不需要檢閱 JSON 標籤檔案的格式設定。
檢閱您輸入的資料,然後選取 [建立專案]。
定型您的模型
建立專案之後,請繼續開始定型模型。
若要從 Language Studio 內開始定型模型:
從左側功能表中,選取 [定型工作]。
從頂端功能表中選取 [開始定型作業]。
選取 [定型新模型],然後在文字方塊中輸入模型名稱。 您也可以藉由選取此選項來覆寫現有的模型,然後從下拉式功能表中選擇您想要覆寫的模型。 覆寫定型的模型是無法復原的,但在您部署新模型之前,不會影響已部署的模型。
系統預設會根據指定的百分比,將已標示的資料分割為訓練集或測試集。 如果您的測試集中有文件,就可以手動分割訓練與測試資料。
選取 [定型] 按鈕。
如果您從清單中選取 [定型作業識別碼],則會顯示側邊窗格,您可以在其中檢查此作業的 [定型進度]、[作業狀態] 和其他詳細資料。
注意
- 只有成功完成的定型作業才會產生模型。
- 定型可能需要幾分鐘到數小時的時間,以標記的資料大小而定。
- 您一次只能執行一個定型作業。 除非執行中的作業完成,否則無法在同一個專案內啟動其他定型作業。
部署模型
一般來說,在定型模型之後,您可以檢閱其評估詳細資料,並視需要加以改善。 在本快速入門中,您只需要部署您的模型,使其可供您在 Language Studio 中試用。
若要從 Language Studio 內部署您的模型:
從左側功能表中,選取 [部署模型]。
選取 [新增部署] 以啟動新的部署作業。
選取 [建立新的部署] 以建立新的部署,並從下方的下拉式清單中指派定型的模型。 您也可以選取此選項來覆寫現有的部署,然後從下方的下拉式清單中,選取您想要為其指派的定型模型。
注意
覆寫現有的部署不需要變更預測 API 呼叫,但您取得的結果將會以新指派的模型為基礎。
選取 [部署] 以啟動部署作業。
部署成功之後,在其旁邊會出現到期日。 部署到期表示部署的模型無法再用於預測,通常發生於定型組態到期的十二個月後。
測試您的模型
在本快速入門中,您將使用 Language Studio 提交自訂摘要工作,並將結果視覺化。 在稍早下載的範例資料集中,您可以找到一些可在此步驟中使用的測試文件。
若要從 Language Studio 內測試已部署的模型:
從左側功能表中,選取 [測試部署]。
選取您要測試的部署。 您只能測試指派給部署的模型。
針對多語系專案,從語言下拉式清單中,選取您要測試的文字語言。
從下拉式清單選取您要查詢/測試的部署。
您可以輸入想在要求中提交的文字,或上傳要使用的
.txt
檔案。選取頂端功能表中的 [執行測試]。
在 [結果] 索引標籤中,您可以看到來自您文字的已擷取實體及實體的類型。 您也可以在 [JSON] 索引標籤下檢視 JSON 回應。
清除資源
當您不再需要專案時,可以使用 Language Studio 來刪除您的專案。 選取您在頂端所使用的功能,然後選取您要刪除的專案。 選取頂端功能表中的 [刪除] 以刪除專案。