Scraper avanzato (server di pubblicazione indipendente)
Un'API avanzata per lo scraper Web con indirizzi IP rotanti provenienti da oltre 170 paesi.
Questo connettore è disponibile nei prodotti e nelle aree seguenti:
| Servizio | Class | Regions |
|---|---|---|
| Copilot Studio | Di alta qualità | Tutte le aree di Power Automate , ad eccezione delle seguenti: - Governo degli Stati Uniti (GCC) - Us Government (GCC High) - China Cloud gestito da 21Vianet - Dipartimento della Difesa degli Stati Uniti (DoD) |
| App per la logica | Normale | Tutte le aree di App per la logica , ad eccezione delle seguenti: - Aree di Azure per enti pubblici - Aree di Azure Cina - Dipartimento della Difesa degli Stati Uniti (DoD) |
| Power Apps | Di alta qualità | Tutte le aree di Power Apps , ad eccezione dei seguenti: - Governo degli Stati Uniti (GCC) - Us Government (GCC High) - China Cloud gestito da 21Vianet - Dipartimento della Difesa degli Stati Uniti (DoD) |
| Power Automate | Di alta qualità | Tutte le aree di Power Automate , ad eccezione delle seguenti: - Governo degli Stati Uniti (GCC) - Us Government (GCC High) - China Cloud gestito da 21Vianet - Dipartimento della Difesa degli Stati Uniti (DoD) |
| Contatto | |
|---|---|
| Nome | Troy Taylor |
| URL | https://www.hitachisolutions.com |
| ttaylor@hitachisolutions.com |
| Metadati del connettore | |
|---|---|
| Editore | Troy Taylor, Hitachi Solutions |
| Sito web | https://apilayer.com/marketplace/description/adv_scraper-api |
| Informativa sulla privacy | https://www.ideracorp.com/Legal/APILayer/PrivacyStatement |
| Categorie | Sito web |
Creazione di una connessione
Il connettore supporta i tipi di autenticazione seguenti:
| Predefinita | Parametri per la creazione della connessione. | Tutte le aree geografiche | Non condivisibile |
Predefinito
Applicabile: tutte le aree
Parametri per la creazione della connessione.
Questa non è una connessione condivisibile. Se l'app power viene condivisa con un altro utente, verrà richiesto a un altro utente di creare una nuova connessione in modo esplicito.
| Nome | TIPO | Description | Obbligatorio |
|---|---|---|---|
| Chiave API | securestring | Chiave API per questa API | Vero |
Limiti per la limitazione delle richieste
| Nome | Chiamate | Periodo di rinnovo |
|---|---|---|
| Chiamate API per connessione | 100 | 60 secondi |
Azioni
| Raschiare un URL remoto |
Raschiare un URL remoto, con richiesta facoltativa da paese, rendering, selettore CSS e timeout. |
| Raschiare una pagina del modulo |
Raschiare una pagina remota contenente un modulo HTML. |
Raschiare un URL remoto
Raschiare un URL remoto, con richiesta facoltativa da paese, rendering, selettore CSS e timeout.
Parametri
| Nome | Chiave | Necessario | Tipo | Descrizione |
|---|---|---|---|---|
|
URL
|
url | True | string |
Indirizzo URL da raschiare. |
|
Paese
|
country | string |
Un codice paese facoltativo di 2 caratteri se si vuole evitare da un indirizzo IP di un paese specifico. |
|
|
Render
|
render | boolean |
Valore booleano che indica se eseguire il rendering della pagina remota. Se si desidera raschiare immagini, file JSON, file PDF o feed XML, è necessario impostarlo su false. |
|
|
Selector
|
selector | string |
Selettore CSS. Ad esempio: a.navbar-brand. |
|
|
Interruzione temporanea
|
timeout | integer |
Timeout in secondi prima che lo scraper restituisca un risultato. Valore minimo: 5, max: 45. |
Restituisce
| Nome | Percorso | Tipo | Descrizione |
|---|---|---|---|
|
Selettore dati
|
data-selector | array of string |
Dati selezionati. |
|
Paese
|
options.country | string |
Paese richiesto. |
|
Render
|
options.render | boolean |
Se ne viene eseguito il rendering. |
|
Selector
|
options.selector | string |
Selettore richiesto. |
|
Interruzione temporanea
|
options.timeout | integer |
Timeout richiesto. |
|
Titolo pagina
|
page_title | string |
Titolo della pagina. |
|
URL risultato
|
result_url | string |
Indirizzo URL del risultato. |
|
URL
|
url | string |
Indirizzo URL richiesto. |
Raschiare una pagina del modulo
Raschiare una pagina remota contenente un modulo HTML.
Parametri
| Nome | Chiave | Necessario | Tipo | Descrizione |
|---|---|---|---|---|
|
URL
|
url | True | string |
Indirizzo URL da raschiare. |
|
Paese
|
country | string |
Un codice paese facoltativo di 2 caratteri se si vuole evitare da un indirizzo IP di un paese specifico. |
|
|
Render
|
render | boolean |
Valore booleano che indica se eseguire il rendering della pagina remota. Se si desidera raschiare immagini, file JSON, file PDF o feed XML, è necessario impostarlo su false. |
|
|
Selector
|
selector | string |
Selettore CSS. Ad esempio: a.navbar-brand. |
|
|
Interruzione temporanea
|
timeout | integer |
Timeout in secondi prima che lo scraper restituisca un risultato. Valore minimo: 5, max: 45. |
|
|
Corpo
|
body | True | string |
Voci del modulo. |
Restituisce
| Nome | Percorso | Tipo | Descrizione |
|---|---|---|---|
|
Selettore dati
|
data-selector | array of string |
Dati selezionati. |
|
Paese
|
options.country | string |
Paese richiesto. |
|
Render
|
options.render | boolean |
Se ne viene eseguito il rendering. |
|
Selector
|
options.selector | string |
Selettore richiesto. |
|
Interruzione temporanea
|
options.timeout | integer |
Timeout richiesto. |
|
Titolo pagina
|
page_title | string |
Titolo della pagina. |
|
Referer
|
request_headers.Referer | string |
Referer. |
|
Indirizzo URL del risultato.
|
result_url | string |
URL risultato |
|
Indirizzo URL richiesto.
|
url | string |
URL |