共用方式為


用於健康醫療領域的自訂文字分析語言支援

使用本文了解用於健康醫療領域的自訂文字分析目前支援的語言。

多語系選項

透過用於健康醫療領域的自訂文字分析,您可以使用一種語言來訓練模型,並使用它從文件擷取其他語言的實體。 這項功能可讓您不用針對每個語言建置個別專案,而是將資料集合併在單一專案中,讓您輕鬆地將專案調整為多種語言。 您可以完全使用英文文件訓練專案,並用下列語言查詢:法文、德文、義大利文及其他語言。 您可以在專案建立流程中或稍後透過專案設定啟用多語言選項。

您不應為每種語言新增相同數量的文件。 您應該以一種語言建立大部分的專案,並只在您觀察到效能不佳的語言中新增一些文件。 如果您建立的專案主要是英文版,並以法文、德文和西班牙文開始測試,您可能會發現德文的執行結果不如他兩種語言。 在該案例下,請考慮在德文中新增 5% 的原始英文文件、定型新模型,然後再以德文進行測試。 在 Language Studio 的資料標記頁面中,您可以選取要新增文件的語言。 您應該會看到德文查詢得到更好的結果。 您新增的標記文件愈多,得到更好結果的可能性就越高。 當您以其他語言加入資料時,不應預期會對其他語言造成負面影響。

多語系專案不支援希伯來文。 如果專案的主要語言是希伯來文,您將無法使用其他語言中新增訓練資料,或使用其他語言查詢模型。 同樣地,如果專案的主要語言不是希伯來文,您將無法使用希伯來文新增訓練資料,或使用希伯來文查詢模型。

語言支援

用於健康醫療領域的自訂文字分析支援下列語言的 .txt 個檔案:

語言 語言代碼
英語 en
法文 fr
德文 de
西班牙文 es
義大利文 it
葡萄牙文 (葡萄牙) pt-pt
Hebrew he

下一步