什麼是大型語言模型（LLM）？

2 分鐘

大型語言模型（LLM）是一種類神經網路架構，可以處理和產生對話式文字、撰寫程式代碼、抽象資訊、回答問題，以及以無數種方式處理文字。 LLM 已透過大量的文字資料訓練，並可產生類似真人所用的文字，處理各種工作。 GPT 是 LLM 的類型。

由於來自數十億個語言範例的廣泛訓練，包括書籍、文章和網站，LLM 可以執行各種自然語言工作，例如：

分類： LLM 可以根據意義和內容，將預先定義的標籤或類別，例如：正面、負面、垃圾郵件、非垃圾郵件、新聞或意見，指派給文本。 LLM 甚至可以識別文字的情感。
綜述： LLM 可以從文字中擷取最重要的相關信息，例如新聞文章、產品評論和研究論文。然後，它可以撰寫簡潔和連貫的摘要。
譯本： LLM 可以在各種語言之間翻譯文字，同時保留原始文字的內容和結構。
內容產生： LLM 可以從指定的輸入或提示中建立新的和原始文字，例如故事、詩歌、笑話、標語和標題。 LLM 也可以以 HTML、CSS、JavaScript 和 Python 等語言產生程式代碼。

意見反應

此頁面對您有幫助嗎？