通过提供示例获取网页数据

通过从网页获取数据,用户可以轻松地从网页中提取数据。 通常情况下,提取有序表比较容易,但网页上的数据并不在有序表中。 即使数据是结构化数据且一致,从此类页面获取数据也可能会很困难。

有一种解决方案。 使用按示例从 Web 获取数据功能,实际上可以通过在连接器对话框中提供一个或多个示例来显示要提取的 Power Query 数据。 Power Query 收集页面上与示例匹配的其他数据。 使用此解决方案,可以从网页提取所有类型的数据,包括在表中找到的数据和其他非表数据。

Get data from web by example.

注意

图像中列示的价格仅用作示例。

使用通过示例从 Web 获取数据

在连接器选择中选择 Web 选项,然后选择连接以继续。

在“从 Web”中,输入想要从中提取数据的网页的 URL 。 在本文中,我们将使用 Microsoft Store 网页,并展示此连接器的工作原理。

如果想要按照说明操作,可以使用本文中所用的 Microsoft Store URL

      https://www.microsoft.com/store/top-paid/games/xbox?category=classics

Web dialog.

选择确定时,将转到导航器对话框,其中显示任何从网页中自动检测到的表。 在下图所示的情况下,找不到任何表。 选择“使用示例添加表”提供示例 。

Navigator window.

使用示例添加表显示一个交互式窗口,可以在其中预览网页内容。 输入要提取的数据的示例值。

在此示例中,你将提取页面上每个游戏的名称价格。 可以通过从页面中为每列指定几个示例来实现。 输入示例时,Power Query 使用智能数据提取算法提取符合示例条目模式的数据 。

data by example.

注意

建议的值仅含长度小于或等于 128 个字符的值。

对从网页中提取的数据感到满意后,选择确定转到 Power Query 编辑器。 然后,可以应用更多转换或调整数据,例如将此数据与其他数据源合并。

applying more transformations.

另请参阅