用於健康醫療領域的自訂文字分析語言支援

發行項
09/03/2024

使用本文了解用於健康醫療領域的自訂文字分析目前支援的語言。

多語系選項

透過用於健康醫療領域的自訂文字分析，您可以使用一種語言來訓練模型，並使用它從文件擷取其他語言的實體。這項功能可讓您不用針對每個語言建置個別專案，而是將資料集合併在單一專案中，讓您輕鬆地將專案調整為多種語言。您可以完全使用英文文件訓練專案，並用下列語言查詢：法文、德文、義大利文及其他語言。您可以在專案建立流程中或稍後透過專案設定啟用多語言選項。

您不應為每種語言新增相同數量的文件。您應該以一種語言建立大部分的專案，並只在您觀察到效能不佳的語言中新增一些文件。如果您建立的專案主要是英文版，並以法文、德文和西班牙文開始測試，您可能會發現德文的執行結果不如他兩種語言。在該案例下，請考慮在德文中新增 5% 的原始英文文件、定型新模型，然後再以德文進行測試。在 Language Studio 的資料標記頁面中，您可以選取要新增文件的語言。您應該會看到德文查詢得到更好的結果。您新增的標記文件愈多，得到更好結果的可能性就越高。當您以其他語言加入資料時，不應預期會對其他語言造成負面影響。

多語系專案不支援希伯來文。如果專案的主要語言是希伯來文，您將無法使用其他語言中新增訓練資料，或使用其他語言查詢模型。同樣地，如果專案的主要語言不是希伯來文，您將無法使用希伯來文新增訓練資料，或使用希伯來文查詢模型。

語言支援

用於健康醫療領域的自訂文字分析支援下列語言的 .txt 個檔案：

語言	語言代碼
英語	`en`
法文	`fr`
德文	`de`
西班牙文	`es`
義大利文	`it`
葡萄牙文 (葡萄牙)	`pt-pt`
Hebrew	`he`

共用方式為

用於健康醫療領域的自訂文字分析語言支援

多語系選項

語言支援

下一步

意見反應

其他資源