Condividi tramite


Scraper avanzato (server di pubblicazione indipendente)

Un'API avanzata per lo scraper Web con indirizzi IP rotanti provenienti da oltre 170 paesi.

Questo connettore è disponibile nei prodotti e nelle aree seguenti:

Servizio Class Regions
Copilot Studio Di alta qualità Tutte le aree di Power Automate , ad eccezione delle seguenti:
     - Governo degli Stati Uniti (GCC)
     - Us Government (GCC High)
     - China Cloud gestito da 21Vianet
     - Dipartimento della Difesa degli Stati Uniti (DoD)
App per la logica Normale Tutte le aree di App per la logica , ad eccezione delle seguenti:
     - Aree di Azure per enti pubblici
     - Aree di Azure Cina
     - Dipartimento della Difesa degli Stati Uniti (DoD)
Power Apps Di alta qualità Tutte le aree di Power Apps , ad eccezione dei seguenti:
     - Governo degli Stati Uniti (GCC)
     - Us Government (GCC High)
     - China Cloud gestito da 21Vianet
     - Dipartimento della Difesa degli Stati Uniti (DoD)
Power Automate Di alta qualità Tutte le aree di Power Automate , ad eccezione delle seguenti:
     - Governo degli Stati Uniti (GCC)
     - Us Government (GCC High)
     - China Cloud gestito da 21Vianet
     - Dipartimento della Difesa degli Stati Uniti (DoD)
Contatto
Nome Troy Taylor
URL https://www.hitachisolutions.com
Email ttaylor@hitachisolutions.com
Metadati del connettore
Editore Troy Taylor, Hitachi Solutions
Sito web https://apilayer.com/marketplace/description/adv_scraper-api
Informativa sulla privacy https://www.ideracorp.com/Legal/APILayer/PrivacyStatement
Categorie Sito web

Creazione di una connessione

Il connettore supporta i tipi di autenticazione seguenti:

Predefinita Parametri per la creazione della connessione. Tutte le aree geografiche Non condivisibile

Predefinito

Applicabile: tutte le aree

Parametri per la creazione della connessione.

Questa non è una connessione condivisibile. Se l'app power viene condivisa con un altro utente, verrà richiesto a un altro utente di creare una nuova connessione in modo esplicito.

Nome TIPO Description Obbligatorio
Chiave API securestring Chiave API per questa API Vero

Limiti per la limitazione delle richieste

Nome Chiamate Periodo di rinnovo
Chiamate API per connessione 100 60 secondi

Azioni

Raschiare un URL remoto

Raschiare un URL remoto, con richiesta facoltativa da paese, rendering, selettore CSS e timeout.

Raschiare una pagina del modulo

Raschiare una pagina remota contenente un modulo HTML.

Raschiare un URL remoto

Raschiare un URL remoto, con richiesta facoltativa da paese, rendering, selettore CSS e timeout.

Parametri

Nome Chiave Necessario Tipo Descrizione
URL
url True string

Indirizzo URL da raschiare.

Paese
country string

Un codice paese facoltativo di 2 caratteri se si vuole evitare da un indirizzo IP di un paese specifico.

Render
render boolean

Valore booleano che indica se eseguire il rendering della pagina remota. Se si desidera raschiare immagini, file JSON, file PDF o feed XML, è necessario impostarlo su false.

Selector
selector string

Selettore CSS. Ad esempio: a.navbar-brand.

Interruzione temporanea
timeout integer

Timeout in secondi prima che lo scraper restituisca un risultato. Valore minimo: 5, max: 45.

Restituisce

Nome Percorso Tipo Descrizione
Selettore dati
data-selector array of string

Dati selezionati.

Paese
options.country string

Paese richiesto.

Render
options.render boolean

Se ne viene eseguito il rendering.

Selector
options.selector string

Selettore richiesto.

Interruzione temporanea
options.timeout integer

Timeout richiesto.

Titolo pagina
page_title string

Titolo della pagina.

URL risultato
result_url string

Indirizzo URL del risultato.

URL
url string

Indirizzo URL richiesto.

Raschiare una pagina del modulo

Raschiare una pagina remota contenente un modulo HTML.

Parametri

Nome Chiave Necessario Tipo Descrizione
URL
url True string

Indirizzo URL da raschiare.

Paese
country string

Un codice paese facoltativo di 2 caratteri se si vuole evitare da un indirizzo IP di un paese specifico.

Render
render boolean

Valore booleano che indica se eseguire il rendering della pagina remota. Se si desidera raschiare immagini, file JSON, file PDF o feed XML, è necessario impostarlo su false.

Selector
selector string

Selettore CSS. Ad esempio: a.navbar-brand.

Interruzione temporanea
timeout integer

Timeout in secondi prima che lo scraper restituisca un risultato. Valore minimo: 5, max: 45.

Corpo
body True string

Voci del modulo.

Restituisce

Nome Percorso Tipo Descrizione
Selettore dati
data-selector array of string

Dati selezionati.

Paese
options.country string

Paese richiesto.

Render
options.render boolean

Se ne viene eseguito il rendering.

Selector
options.selector string

Selettore richiesto.

Interruzione temporanea
options.timeout integer

Timeout richiesto.

Titolo pagina
page_title string

Titolo della pagina.

Referer
request_headers.Referer string

Referer.

Indirizzo URL del risultato.
result_url string

URL risultato

Indirizzo URL richiesto.
url string

URL