類神經字典
類神經字典是 動態字典 和 片語字典 功能的延伸。 動態和片語字典都可讓您藉由為特定詞彙或片語提供自己的翻譯,來自訂翻譯輸出。 類神經字典可讓機器翻譯模型同時調整字詞和上下文,來改善包含一或多個詞彙翻譯的句子之翻譯品質。
類神經字典主要功能
相較於依賴確切尋找和取代方法的片語字典,翻譯精確度會更高。
讓包含一或多個詞彙翻譯的句子翻譯更流暢。
整體高詞彙翻譯的精確度。
可有效處理動詞、形容詞和名詞片語的類神經片語修正。 來源和目標必須具有相同的詞類 (語法) 標籤。
下表列出標準與類神經片語修正之間的差異:
標準片語修正 | 類神經片語修正 |
---|---|
這是個確切尋找和取代的作業。 要求的翻譯會以完全相同的格式出現在輸出中。 | 要求的翻譯可以轉換或變更大小寫。 |
要求的翻譯會假設為確切的翻譯。 | 要求的翻譯預計是詞元 (詞基) 形式。 |
只有當來源元件以完全相同 (沒有差異) 的形式出現在文字中時,才會套用片語。 | 只有當來源元件以完全相同 (沒有差異) 的形式出現在文字中時,才會套用片語。 |
可以可靠地用於複製。 | 無法可靠地用於複製。 |
搭配名詞使用最有效率。 | 可有效地搭配名詞、動詞、形容詞和名詞片語。 |
支援的語言
下表列出目前支援的類神經字典語言組:
來源 | Target |
---|---|
簡體中文 (zh-cn ) |
英文 (en-us ) |
英文 (en-us ) |
簡體中文 (zh-cn ) |
英文 (en-us ) |
法文 (fr-fr ) |
英文 (en-us ) |
德文 (de-de ) |
英文 (en-us ) |
義大利文 (it-it ) |
英文 (en-us ) |
日文 (ja-jp ) |
英文 (en-us ) |
韓文 (ko-kr ) |
英文 (en-us ) |
波蘭文 (pl-pl ) |
英文 (en-us ) |
俄文 (ru-ru ) |
英文 (en-us ) |
西班牙文 (es-es ) |
英文 (en-us ) |
瑞典文 (sv-se ) |
法文 (fr-fr ) |
英文 (en-us ) |
德文 (de-de ) |
英文 (en-us ) |
義大利文 (it-it ) |
英文 (en-us ) |
日文 (ja-jp ) |
英文 (en-us ) |
韓文 (ko-kr ) |
英文 (en-us ) |
波蘭文 (pl-pl ) |
英文 (en-us ) |
俄文 (ru-ru ) |
英文 (en-us ) |
西班牙文 (es-es ) |
英文 (en-us ) |
瑞典文 (sv-se ) |
英文 (en-us ) |
啟用類神經字典
可使用 自訂翻譯工具 平台搭配所有 支援語言 的片語字典來使用類神經字典。 需要完整 (或僅限字典) 自訂模型重新定型,才能啟用類神經字典。
指引與建議
只有在透過完全區分大小寫的相符專案找到來源元素時,才會套用片語字典中的輸入。 此動作適用於硬式和類神經片語修正。
使用類神經片語修正字典時,爲了確保一致地套用片語字典輸入,請考慮以各種形式新增帶有片語輸入的來源。
例如,如果您想要確定「solution」已翻譯為 「alternativeywa」(英文單字「alternative」的波蘭文翻譯),您也可以在
solution _ alternatywa
旁新增下列輸入:Solution _ alternatywa
、solutions _ alternatywy
、Solutions _ alternatywy
。
如果您使用片語字典來確保特定單字或片語將「按原樣」從輸入文字複製到輸出翻譯,請考慮強制執行逐字字典以取得更大的一致性。 類神經片語字典並不能保證「按原樣」複製,因為它可能會轉換單字或變更大小寫。 不過,它可以複製具名實體和縮略字。
類神經片語修正不適用於包含至少下列其中一個元素的句子: 表情符號、表情貼圖、URL、社交媒體識別碼、程式碼識別碼、數學符號或長數字序列,例如十六進位。
不常發生 (小於 0.1%),類神經片語修正不會顧及動態字典註釋或片語字典輸入,而且要求的翻譯不會出現在輸出翻譯中。
避免將一般或常用單字或片語的翻譯新增至片語字典。
下一步
若要深入了解,請從 自訂翻譯工具初學者指南 開始使用。