偵錯對應資料流

已完成

在建立對應資料流的過程中,您可以透過互動方式監看資料轉換的執行情形,以便對其偵錯。 若要使用此功能,必須先啟用「資料流程偵錯」功能。

Starting Data Flow Debug

按一下 [偵錯] 就會佈建與對應資料流轉換互動所需的 Spark 叢集。 開啟 [偵錯] 時,系統會提示您選取在環境中使用所需的 Integration Runtime。 如果您選取 [AutoResolveIntegrationRuntime],則具有八個核心的叢集將有 60 分鐘的存留時間值。

注意

叢集通常需要 5-7 分鐘的時間來啟動。 啟用此模式並執行 Spark 叢集後,您就可以逐步建立您的資料流程,並在執行各個轉換階段時檢視資料。

[資料預覽] 索引標籤可在偵錯模式中使用,可讓您在管線的每個階段檢視資料。 您可以在每次轉換之後檢視資料。 資料預覽器也可讓您對資料採取動作 (例如查看資料的描述性統計資料),也可以讓您修改資料。

Data Previewer

最後,您可以使用偵錯設定來控制資料預覽器中傳回的資料列數目。

注意

建議您限制資料列數目,以傳回足夠的數目讓您確認資料是否正確。 資料集愈大,傳回結果所花的時間就越長。 您也可以使用 [偵錯] 設定來指定應在管線執行期間使用的任何參數值。