Web ページからデータを抽出する

完了

Web フォームおよびコンポーネントの処理に加えて、デスクトップ用 Power Automate では、Web ページからデータおよび詳細を抽出できます。 Power Automate デスクトップを使用して Web ページからデータを抽出すると、表、テキスト、他の詳細などの情報を Web サイトから直接収集する処理を自動化できます。 このプロセスは、Web スクレイピングとも呼ばれ、データ収集タスクの効率化に役立ちます。

Web ページに関する情報を抽出するには、Web ページの詳細を取得するアクションを使用します。 このアクションを使用すると、タイトル、メタデータ キーワード、説明など、Web ページに関する記述的な詳細を取得できます。 アクションのプロパティでは、ブラウザーのインスタンスと取得する情報を指定する必要があります。

Web ページの詳細を取得するアクションのスクリーンショット。

Web ページ全体ではなく、特定の要素に関する詳細を取得するには、Web ページの要素の詳細を取得するアクションを使用します。 このアクションには、ブラウザーのインスタンスと、要素を説明する UI 要素が必要です。

Web ページの要素の詳細を取得するアクションのスクリーンショット。

Web ページからスクリーンショットを取得するには、Web ページのスクリーンショットを撮るアクションを使用します。 このアクションをデプロイすることにより、Web ページ全体または特定の要素のスクリーンショットを撮ることができます。 このアクションは、撮影したスクリーンショットをクリップボードまたはファイルに保存します。

Web ページのスクリーンショットを撮るアクションのスクリーンショット。

高度なデータの抽出

業務手順においては、テーブルとリストのフォームで表示される Web データを抽出するのが一般的です。 Power Automate デスクトップを使用すると、Web ページからデータを抽出するアクションを使用して、これらの手順を自動化できます。

他の Web アクションと同様に、Web ページからデータを抽出するアクションは、データの抽出元のページを含むブラウザー インスタンスを必要とします。

Web ページからデータを抽出するアクションのスクリーンショット。

抽出したデータは、変数または新しく生成した Microsoft Excel スプレッドシートに保存できます。 抽出されたデータは、選択肢に応じて次のいずれかの形式で使用できます。

  • 単一値 - 値はテキストとして保存されます。 アクションでは、このデータ フォームを使用して、製品名などの単一の値を抽出します。

  • 選択した (複数の) 値 - 値はリストに保存されます。 このアクションでは、このデータ フォームを使用して、製品価格などの複数の値を抽出します。

  • リスト - このアクションは、このデータ フォームを使用して、使用可能なすべての製品名など、複数のレジストリから単一の値を抽出します。

  • テーブル - このアクションは、このデータ フォームを使用して、使用可能なすべての製品名や価格など、複数のレジストリから複数の値を抽出します。

抽出するデータを指定するには、ブラウザー ウィンドウを起動し、Web ページからデータを抽出するを開き、ライブ Web ヘルパー ダイアログが表示されるまで待機します。

プラットフォームで、ライブ Web ヘルパー ダイアログが表示されたら、目的の要素を右クリックし、要素の値を抽出を選択して、抽出するプロパティを選択します。

抽出された単一の値のスクリーンショット。

複数のページにまたがってデータを展開するには、Web サイトのページャー ボタンを右クリックして、ページャーとして要素を設定を選択します。

CSS セレクターを手動で変更する場合は、詳細設定 オプションを選択します。 手動セレクター編集を使用すると、自動選択がニーズを満たしていない場合に複雑なセレクターを作成できます。

ライブ Web ヘルパーの詳細設定のスクリーンショット。

選択した内容を破棄するには、ライブ Web ヘルパー ダイアログのリセット ボタンをクリックします。

最後に、一時停止リセットの両方のボタン オプションを使用できます。 一時停止すると記録が停止し、リセットすると既存のすべての記録がクリアされます。 個々のアクションをクリアするには、その横にあるごみ箱のアイコンをクリックします。

ライブ Web ヘルパー ダイアログのスクリーンショット。

Web ページからのデータ抽出を自動化することにより、大量の情報をすばやく効率的に、最小限の手作業で収集できます。