總結

已完成

Azure Language 是一項基於雲端的自然語言處理(NLP)服務,提供如關鍵字擷取、實體識別、個人識別資訊(PII)偵測等文字洞察。 透過 azure_ai 延伸模組,適用於 PostgreSQL 的 Azure 資料庫彈性伺服器便可使用此服務,該服務提供使用者定義的函式,可存取 SQL 內的語言 API。

關鍵片語擷取會辨識輸入文字的主要主題或主要概念。 使用其將文件製作為主題式摘要,而不是散文或句子。

實體辨識可識別地點、人員、數量等等。 使用其依照所討論的實體為文件編製索引,或從非結構化文字識別表單輸入欄位,例如地址或名稱。

個人識別資訊(PII)偵測會從輸入文字中識別並編輯或刪除PII。 使用它從文字中清除敏感性資訊,例如信用卡號碼、社會安全號碼、電話號碼等。

透過這些工具,企業可以依關鍵詞或模式比對來處理文字。 該方法容易出錯,需要手動努力列出可識別的主題和模式。 此邏輯通常不會在 SQL 中實作,因此必須在用戶端應用程式之間重複,因而造成進一步的風險。

當企業將文字處理延後給 Azure 語言時,他們就能自動從文字中收集洞見。 語言服務會封裝由 Azure 開發人員維護及偵錯的複雜自然語言處理演算法。 此服務可讓企業開發人員專注於從文字取得的見解,而非專注於取得見解的流程之上。

參考資料