Расширенный скребок (независимый издатель)
Расширенный API веб-скребка с поворотом IP-адресов из 170+ стран.
Этот соединитель доступен в следующих продуктах и регионах:
| Услуга | Class | Регионы |
|---|---|---|
| Copilot Studio | Премия | Все регионы Power Automate , кроме следующих: - Правительство США (GCC) - Правительство США (GCC High) — Облако Китая, управляемое 21Vianet - Министерство обороны США (DoD) |
| Логические приложения | Стандарт | Все регионы Logic Apps , кроме следующих: — Регионы Azure для государственных организаций — Регионы Azure Для Китая - Министерство обороны США (DoD) |
| Power Apps | Премия | Все регионы Power Apps , кроме следующих: - Правительство США (GCC) - Правительство США (GCC High) — Облако Китая, управляемое 21Vianet - Министерство обороны США (DoD) |
| Power Automate | Премия | Все регионы Power Automate , кроме следующих: - Правительство США (GCC) - Правительство США (GCC High) — Облако Китая, управляемое 21Vianet - Министерство обороны США (DoD) |
| Контакт | |
|---|---|
| Имя | Трой Тейлор |
| URL | https://www.hitachisolutions.com |
| Адрес электронной почты | ttaylor@hitachisolutions.com |
| Метаданные соединителя | |
|---|---|
| Publisher | Трой Тейлор, Решения Похасти |
| Веб-сайт | https://apilayer.com/marketplace/description/adv_scraper-api |
| Политика конфиденциальности | https://www.ideracorp.com/Legal/APILayer/PrivacyStatement |
| Категории | Веб-сайт |
Создание подключения
Соединитель поддерживает следующие типы проверки подлинности:
| По умолчанию | Параметры для создания подключения. | Все регионы | Недоступен для совместного использования |
По умолчанию
Применимо: все регионы
Параметры для создания подключения.
Это недоступно для общего доступа. Если приложение power предоставляется другому пользователю, пользователю будет предложено явно создать новое подключение.
| Имя | Тип | Description | Обязательно |
|---|---|---|---|
| Ключ API | securestring | Ключ API для этого API | True |
Ограничения регулирования
| Имя | Вызовы | Период обновления |
|---|---|---|
| Вызовы API для каждого подключения | 100 | 60 секунд |
Действия
| Очистка удаленного URL-адреса |
Отмените удаленный URL-адрес с необязательным запросом из страны, отрисовки, селектора CSS и времени ожидания. |
| Скребка страницы формы |
Скребите удаленную страницу, содержащую HTML-форму. |
Очистка удаленного URL-адреса
Отмените удаленный URL-адрес с необязательным запросом из страны, отрисовки, селектора CSS и времени ожидания.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
URL
|
url | True | string |
URL-адрес для слома. |
|
Страна
|
country | string |
Необязательный 2 символьный код страны, если вы хотите извлечь из IP-адреса определенной страны. |
|
|
Render
|
render | boolean |
Логическое значение, указывающее, следует ли отображать удаленную страницу. Если вы хотите сломать изображения, JSON-файлы, PDF-файлы или XML-каналы, необходимо задать для этого значение false. |
|
|
Selector
|
selector | string |
Селектор CSS. Ex: a.navbar-brand. |
|
|
Таймаут
|
timeout | integer |
Время ожидания в секундах, прежде чем скребок возвращает результат. Минимальное значение: 5, максимум: 45. |
Возвращаемое значение
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Селектор данных
|
data-selector | array of string |
Выбранные данные. |
|
Страна
|
options.country | string |
Запрашиваемая страна. |
|
Render
|
options.render | boolean |
Выполняется ли отрисовка. |
|
Selector
|
options.selector | string |
Запрошенный селектор. |
|
Таймаут
|
options.timeout | integer |
Запрошено время ожидания. |
|
Заголовок страницы
|
page_title | string |
Заголовок страницы. |
|
URL-адрес результата
|
result_url | string |
URL-адрес результата. |
|
URL
|
url | string |
Запрошенный URL-адрес. |
Скребка страницы формы
Скребите удаленную страницу, содержащую HTML-форму.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
URL
|
url | True | string |
URL-адрес для слома. |
|
Страна
|
country | string |
Необязательный 2 символьный код страны, если вы хотите извлечь из IP-адреса определенной страны. |
|
|
Render
|
render | boolean |
Логическое значение, указывающее, следует ли отображать удаленную страницу. Если вы хотите сломать изображения, JSON-файлы, PDF-файлы или XML-каналы, необходимо задать для этого значение false. |
|
|
Selector
|
selector | string |
Селектор CSS. Ex: a.navbar-brand. |
|
|
Таймаут
|
timeout | integer |
Время ожидания в секундах, прежде чем скребок возвращает результат. Минимальное значение: 5, максимум: 45. |
|
|
Тело
|
body | True | string |
Записи формы. |
Возвращаемое значение
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Селектор данных
|
data-selector | array of string |
Выбранные данные. |
|
Страна
|
options.country | string |
Запрашиваемая страна. |
|
Render
|
options.render | boolean |
Выполняется ли отрисовка. |
|
Selector
|
options.selector | string |
Запрошенный селектор. |
|
Таймаут
|
options.timeout | integer |
Запрошено время ожидания. |
|
Заголовок страницы
|
page_title | string |
Заголовок страницы. |
|
Рефератор
|
request_headers.Referer | string |
Рефератор. |
|
URL-адрес результата.
|
result_url | string |
URL-адрес результата |
|
Запрошенный URL-адрес.
|
url | string |
URL |