本節中的教學課程介紹核心功能,並引導您瞭解使用 Azure Databricks 平臺的基本概念。
如需在線訓練資源的相關信息,請參閱 取得免費的 Databricks 訓練。
如果您沒有 Azure Databricks 帳戶, 請註冊免費試用。
教學 | 說明 |
---|---|
查詢和視覺化數據 | 使用 Databricks Notebook 查詢使用 SQL、Python、Scala 和 R 儲存在 Unity 目錄中的範例數據,然後將筆記本中的查詢結果可視化。 |
從筆記本匯入 CSV 數據並將其可視化 | 使用 Databricks 筆記本,使用 Python、Scala 和 R,從包含嬰兒名稱數據的 https://health.data.ny.gov CSV 檔案匯入 Unity 目錄磁碟區中的數據。您也會瞭解如何修改資料行名稱、將數據可視化,以及儲存至數據表。 |
建立資料表 | 使用 Unity 目錄數據控管模型在 Databricks 中建立數據表並授與許可權。 |
使用 Lakeflow 宣告式管線建置 ETL 管線 | 使用 Lakeflow 宣告式管線和自動載入器,建立及部署數據協調流程的 ETL (擷取、轉換和載入) 管線。 |
使用 Apache Spark 建置 ETL 管線 | 使用 Apache Spark™ 開發及部署您的第一個 ETL(抽取、轉換和載入)管線,用於資料編排。 |
定型和部署 ML 模型 | 使用 Databricks 上的 scikit-learn 連結庫建置機器學習分類模型,以預測葡萄酒是否被視為「高品質」。 本教學課程也說明如何使用 MLflow 來追蹤模型開發程式,以及使用 Hyperopt 來自動化超參數微調。 |
使用無程式代碼查詢 LLM 和原型 AI 代理程式 | 使用 AI 遊樂場來查詢大型語言模型 (LLM),並並比較結果、建立工具呼叫 AI 代理程式原型,並將代理程式匯出至程式代碼。 |
教學 | 詳細資訊 |
---|---|
查詢和視覺化數據 | 使用 Databricks Notebook 查詢使用 SQL、Python、Scala 和 R 儲存在 Unity 目錄中的範例數據,然後將筆記本中的查詢結果可視化。 |
從筆記本匯入 CSV 數據並將其可視化 | 使用 Databricks 筆記本,使用 Python、Scala 和 R,從包含嬰兒名稱數據的 https://health.data.ny.gov CSV 檔案匯入 Unity 目錄磁碟區中的數據。您也會瞭解如何修改資料行名稱、將數據可視化,以及儲存至數據表。 |
建立資料表 | 使用 Unity 目錄數據控管模型在 Databricks 中建立數據表並授與許可權。 |
使用 Lakeflow 宣告式管線建置 ETL 管線 | 使用 Lakeflow 宣告式管線和自動載入器,建立及部署數據協調流程的 ETL (擷取、轉換和載入) 管線。 |
使用 Apache Spark 建置 ETL 管線 | 使用 Apache Spark™ 開發及部署您的第一個 ETL(抽取、轉換和載入)管線,用於資料編排。 |
定型和部署 ML 模型 | 使用 Databricks 上的 scikit-learn 連結庫建置機器學習分類模型,以預測葡萄酒是否被視為「高品質」。 本教學課程也說明如何使用 MLflow 來追蹤模型開發程式,以及使用 Hyperopt 來自動化超參數微調。 |
使用無程式代碼查詢 LLM 和原型 AI 代理程式 | 使用 AI 遊樂場來查詢大型語言模型 (LLM),並並比較結果、建立工具呼叫 AI 代理程式原型,並將代理程式匯出至程式代碼。 |
線上到 Azure Data Lake Storage | 使用 OAuth 2.0 搭配 Microsoft Entra ID 服務主體,從 Azure Databricks 連線到 Azure Data Lake Storage。 |
取得協助
- 如果您有設定 Azure Databricks 並需要即時協助的任何問題,請傳送電子郵件 onboarding-help@databricks.com。
- 如果您的組織沒有 Azure Databricks 支援訂用帳戶,或您不是公司支援訂用帳戶的授權聯繫人,您可以從 Databricks 社群取得解答。