什麼是大型語言模型 (LLM)?
大型語言模型 (LLM) 是一種類神經網路架構,可以處理和產生對話式文字、撰寫程式代碼、抽象資訊、回答問題,以及以無數種方式處理文字。 LLM 已透過大量的文字資料訓練,並可產生類似真人所用的文字,處理各種工作。 GPT 是 LLM 的類型。
由於來自數十億個語言範例的廣泛訓練,包括書籍、文章和網站,LLM 可以執行各種自然語言工作,例如:
- 分類: LLM 可以根據意義和內容,將預先定義的標籤或類別,例如:正面、負面、垃圾郵件、非垃圾郵件、新聞或意見,指派給文本。 LLM 甚至可以識別文字的情感。
- 綜述: LLM 可以從文字中擷取最重要的相關信息,例如新聞文章、產品評論和研究論文。 然後,它可以撰寫簡潔和連貫的摘要。
- 譯本: LLM 可以在各種語言之間翻譯文字,同時保留原始文字的內容和結構。
- 內容產生: LLM 可以從指定的輸入或提示中建立新的和原始文字,例如故事、詩歌、笑話、標語和標題。 LLM 也可以以 HTML、CSS、JavaScript 和 Python 等語言產生程式代碼。