用於健康醫療領域的自訂文字分析語言支援
使用本文了解用於健康醫療領域的自訂文字分析目前支援的語言。
多語系選項
透過用於健康醫療領域的自訂文字分析,您可以使用一種語言來訓練模型,並使用它從文件擷取其他語言的實體。 這項功能可讓您不用針對每個語言建置個別專案,而是將資料集合併在單一專案中,讓您輕鬆地將專案調整為多種語言。 您可以完全使用英文文件訓練專案,並用下列語言查詢:法文、德文、義大利文及其他語言。 您可以在專案建立流程中或稍後透過專案設定啟用多語言選項。
您不應為每種語言新增相同數量的文件。 您應該以一種語言建立大部分的專案,並只在您觀察到效能不佳的語言中新增一些文件。 如果您建立的專案主要是英文版,並以法文、德文和西班牙文開始測試,您可能會發現德文的執行結果不如他兩種語言。 在該案例下,請考慮在德文中新增 5% 的原始英文文件、定型新模型,然後再以德文進行測試。 在 Language Studio 的資料標記頁面中,您可以選取要新增文件的語言。 您應該會看到德文查詢得到更好的結果。 您新增的標記文件愈多,得到更好結果的可能性就越高。 當您以其他語言加入資料時,不應預期會對其他語言造成負面影響。
多語系專案不支援希伯來文。 如果專案的主要語言是希伯來文,您將無法使用其他語言中新增訓練資料,或使用其他語言查詢模型。 同樣地,如果專案的主要語言不是希伯來文,您將無法使用希伯來文新增訓練資料,或使用希伯來文查詢模型。
語言支援
用於健康醫療領域的自訂文字分析支援下列語言的 .txt
個檔案:
語言 | 語言代碼 |
---|---|
英語 | en |
法文 | fr |
德文 | de |
西班牙文 | es |
義大利文 | it |
葡萄牙文 (葡萄牙) | pt-pt |
Hebrew | he |