簡介

已完成

Azure Language 是一項基於雲端的自然語言處理(NLP)服務。 它可讓使用者使用關鍵片語擷取、實體辨識、個人標識資訊 (PII) 偵測等功能來瞭解和分析文字。 在此了解更多:什麼是 Azure 語言?

適用於 PostgreSQL 的 Azure 資料庫彈性伺服器 azure_ai 延伸模組,整合資料庫與 Azure 語言服務。 它提供使用者定義的函式來存取 SQL 中的語言 API。 此存取可讓您直接從資料庫中擷取文字的深入解析,而不需在用戶端應用程式中撰寫自然語言處理程序代碼。

範例案例

請考慮提供休假清單的公司。 公司的行銷小組希望藉由識別最熱門清單中的關鍵片語,並突出顯示哪些企業、景點和地點,以更好地理解客戶偏好。 此外,公司的資訊安全性小組想要掃描個人標識資訊的清單(PII),以確保安全性和隱私權。

學習目標

為了完成我們的三個任務,你可以利用擴充 azure_ai 功能將 Azure Database for PostgreSQL 的彈性伺服器與 Azure Language 整合。 首先,您會從清單描述中擷取關鍵片語,並將其儲存在資料庫中,讓數據科學小組能夠分析出現在最受歡迎的清單中。 然後,您可以擷取並儲存具名實體,以達到相同的目的。 最後,您會將所有 PII 清單加上旗標,並儲存經刪除的文本。

主要目標是了解如何使用 azure_ai PostgreSQL 擴充功能來存取這些 Azure 語言服務:關鍵字擷取、實體識別與個人識別資訊(PII)偵測。 您將瞭解如何在 SQL 中存取這些 API,並將結果資料儲存在資料行中。

設定:開啟和授權 azure_ai

此學習路徑會使用 azure_ai 延伸模組。 有一些步驟可以安裝和設定它。 您必須將它新增至允許清單,如 如何使用PostgreSQL擴充功能中所述。 然後,執行此 SQL 查詢來安裝擴充功能:

CREATE EXTENSION azure_ai;

如果您想要移除擴充功能,請使用:

DROP EXTENSION azure_ai;

安裝擴充功能會建立下列三個架構:

  • azure_ai:儲存組態數據和函式的主要架構。
  • azure_openai:與 OpenAI 相關的函式和複合類型。
  • azure_cognitive:與 Azure 認知服務相關的函式和複合類型。

我們的工作使用 Azure 認知服務。 啟用設定azure_ai擴充功能之後,您可以將它與 Azure 認知服務整合,以存取 SQL 的關鍵片語擷取。

如果您還沒有語言資源,請在 Azure 入口網站中 建立語言資源 。 擁有語言資源之後,請移至 [資源管理 > 金鑰] 和 [端點 ],以取得 Azure 認知服務的密鑰和端點。

接下來,執行此 SQL 來授權 Azure Database for PostgreSQL 彈性伺服器的 azure_ai 擴充功能。

select azure_ai.set_setting('azure_cognitive.endpoint','https://<endpoint>.cognitiveservices.azure.com');
select azure_ai.set_setting('azure_cognitive.subscription_key', '<API Key>');
-- the region setting is only required for the translate function
select azure_ai.set_setting('azure_cognitive.region', '');

如需詳細資訊,請參閱 Azure 認知服務檔