データ ソースの概要
Dynamics 365 Customer Insights - Data を構成するには、まず処理するソース データを取り込みます。 Customer Insights - Data は、幅広いソースに接続してデータを取り込むための、数種類のデータ コネクタを提供します。
この記事では、データ取り込みのパフォーマンスに影響するオプションについて説明します。
Delta 形式
Delta データ形式は、Customer Insights – Data で使用するネイティブ処理形式です。 ソースデータを Delta 形式で提供できる場合、多くの利点があります。
- Customer Insights - Dataによる効率性の向上: Delta 形式は Customer Insights - Data が内部的に使用します。
- より高速なデータ インジェスト: Delta 形式は優れた圧縮を提供し、より高速なデータ転送を実現します。
- 統合の迅速化: Delta タイム トラベル機能 を使用すると、Customer Insights – Data は変更されたデータのみを統合します。 データ セット全体が再処理されるわけではありません。 増分統合の場合、統合へのデータ入力はすべて Delta 形式である必要があります。
- データ破損の問題が少ない: Delta 形式は、コンマ区切り値 (CSV) 形式などの古い形式によって引き起こされる破損したパーティションと一般的なデータ破損の問題を軽減します。
- より信頼性の高いデータ管理設計: Delta 形式では、マニフェスト、スキーマ、パーティション ファイルを手動で更新する必要がありません。
- より高いデータ有効性: Delta 形式は、Spark でアトミック性、一貫性、独立性、永続性 (ACID) トランザクションと独立性レベルを提供します。
次のコネクタで Delta 形式を使用できます。
Delta は、Databricks Lakehouse Platform のデータとテーブルを格納する基盤である Delta Lake で導入された用語です。 Delta Lake は、ビッグデータのワークロードに ACID (原子性、一貫性、分離、耐久性) トランザクションをもたらすオープンソースのストレージ レイヤーです。 詳細については、Delta Lake のドキュメントページ を参照してください。
データ ソース 添付またはインポート
データの取り込み方法を決定する際に重要なのは、データ コネクタがデータに添付するか、データのコピーを作成するかです。 Customer Insights - Data を使用する場合は、データに接続するコネクタを使用することをお勧めします。 このようにして、データを処理するときにデータに直接アクセスされます。 データをコピーするコネクタを使用すると、データの更新時に遅延が発生する場合があります。
次のデータ コネクタがデータに接続されます:
- Azure Data Lake Storage Delta テーブル
- Azure Data Lake Storage Common Data Model テーブル
- Microsoft Dataverse
- Azure Synapse Analytics (プレビュー)
データに接続するコネクタを使用できない場合は、Power Query コネクタ のいずれかを使用してデータをコピーします。 Power Query は、データを変換するための便利な方法を提供します。
データ プロファイル
データが取り込まれると、Customer Insights – Data はいくつかの基本的なデータ プロファイリングを実行します。 たとえば、列で繰り返される値の頻度をプロファイルします。 プロファイル データを使用すると、データを理解し、問題に対処できます。 たとえば、FullName
列でマッチングしている場合、データ プロファイリングによって、既定値の 名前を入力してください が 10,000 行に表示されていることを検出できます。 したがって、この値で一致すると、一致してはならない 10,000 行が一致します。 Azure データレイク、Delta テーブル、または Azure Synapse データソースを追加すると、より多くの列に対してデータ プロファイリングを有効にできます。
データを取り込んだ後、データ プロファイリングの結果を表示します。
データ>テーブルに移動し、テーブルを選択します。 次に、フィールド (
DateOfBirth
など) の行の 概要 列で、概要 アイコンを選択します。詳細を確認して、エラーや欠損値がないか確認します。
データ ソース ページ
データ ソース ページには、データソースが 2 つのセクションにリストされています。
- 自分の管理対象: 自分が作成して管理する Microsoft Power Platform データフローです。 他のユーザーは、これらのデータフローのみを表示できます。 編集、更新、削除はできません。
- 他のユーザーの管理対象: 他の管理者が作成した Microsoft Power Platform データフロー。 これらのデータフローは閲覧のみ可能です。 このセクションには各データフローの所有者が表示され、何かサポートが必要な場合にサポートに連絡することができます。
注意
他のユーザーは、すべてのテーブルを表示、使用できます。 各データソースはそれを作成したユーザーが所有しますが、Customer Insights - Data のすべてのユーザーは、データ取り込みの結果得られるすべてのテーブルを使用できます。