Partager via


Analyseur HTML MiniSoup (éditeur indépendant) (préversion)

Bibliothèque d’analyse HTML légère inspirée de Beautiful Soup, offrant des fonctionnalités d’analyse et d’extraction d’éléments HTML

Ce connecteur est disponible dans les produits et régions suivants :

Service classe Régions
Copilot Studio Premium Toutes les régions Power Automate , à l’exception des éléments suivants :
     - Us Government (GCC)
     - Us Government (GCC High)
     - China Cloud géré par 21Vianet
     - Us Department of Defense (DoD)
Applications logiques Norme Toutes les régions Logic Apps , à l’exception des suivantes :
     - Régions Azure Government
     - Régions Azure Chine
     - Us Department of Defense (DoD)
Power Apps Premium Toutes les régions Power Apps , à l’exception des suivantes :
     - Us Government (GCC)
     - Us Government (GCC High)
     - China Cloud géré par 21Vianet
     - Us Department of Defense (DoD)
Power Automate Premium Toutes les régions Power Automate , à l’exception des éléments suivants :
     - Us Government (GCC)
     - Us Government (GCC High)
     - China Cloud géré par 21Vianet
     - Us Department of Defense (DoD)
Contact
Nom Prise en charge de MiniSoup
URL https://github.com/DEmodoriGatsuO/MiniSoup
Messagerie électronique demodori.gatsuo@gmail.com
Métadonnées du connecteur
Éditeur Shogo Shindo
Site internet https://github.com/DEmodoriGatsuO/MiniSoup
Politique de confidentialité https://github.com/DEmodoriGatsuO/MiniSoup/blob/main/PRIVACY.md
Catégories Données; Site internet

Limitations

Nom Appels Période de renouvellement
Appels d’API par connexion 100 60 secondes

Actions

Analyser la table HTML

Analyse une table HTML en données structurées avec des en-têtes et des lignes

Extraire des valeurs à partir d’éléments HTML

Extrait des valeurs d’attribut spécifiques à partir d’éléments HTML correspondant au sélecteur fourni

Rechercher tous les éléments correspondants

Recherche tous les éléments HTML correspondant au nom de balise et aux attributs facultatifs spécifiés

Récupérer du contenu HTML

Récupère du contenu HTML à partir d’une URL spécifiée

Sélectionner des éléments HTML

Sélectionne les éléments HTML correspondant au sélecteur fourni

Analyser la table HTML

Analyse une table HTML en données structurées avec des en-têtes et des lignes

Paramètres

Nom Clé Obligatoire Type Description
html
html True string

Contenu HTML contenant le tableau

table_selector
table_selector string

Sélecteur CSS pour localiser l’élément de table HTML

header_rows_exist
header_rows_exist boolean

Indique si la table comporte des lignes d’en-tête

Retours

Nom Chemin d’accès Type Description
success
success boolean

Indique si l’opération a réussi

headers
data.Headers array of string

En-têtes de colonne extraits de la table

Rows
data.Rows array of array

Lignes de tableau, chacune contenant un tableau de valeurs de cellule

items
data.Rows array of string

Extraire des valeurs à partir d’éléments HTML

Extrait des valeurs d’attribut spécifiques à partir d’éléments HTML correspondant au sélecteur fourni

Paramètres

Nom Clé Obligatoire Type Description
html
html True string

Contenu HTML à analyser

sélecteur
selector True string

Sélecteur CSS ou XPath pour le ciblage d’éléments

attribute
attribute True string

Attribut à extraire des éléments sélectionnés. Utilisez « text » pour le texte interne, « html » pour le code HTML interne ou un nom d’attribut spécifique

selector_type
selector_type string

Type de sélecteur à utiliser

Retours

Nom Chemin d’accès Type Description
success
success boolean

Indique si l’opération a réussi

values
values array of string

Tableau de valeurs extraites des éléments correspondants

count
count integer

Nombre de valeurs extraites

Rechercher tous les éléments correspondants

Recherche tous les éléments HTML correspondant au nom de balise et aux attributs facultatifs spécifiés

Paramètres

Nom Clé Obligatoire Type Description
html
html True string

Contenu HTML à analyser

tag_name
tag_name True string

Nom de balise HTML à rechercher

pièce d'identité
id string

Filtrer par ID d’élément

classe
class string

Filtrer par classe d’élément

Retours

Nom Chemin d’accès Type Description
success
success boolean

Indique si l’opération a réussi

Éléments
elements array of HtmlElement

Tableau d’éléments HTML qui correspondent au nom et aux attributs de balise spécifiés

count
count integer

Nombre d’éléments trouvés

Récupérer du contenu HTML

Récupère du contenu HTML à partir d’une URL spécifiée

Paramètres

Nom Clé Obligatoire Type Description
URL
url True string

URL d’extraction du contenu HTML à partir de

Retours

Nom Chemin d’accès Type Description
success
success boolean

Indique si l’opération a réussi

html
html string

Contenu HTML récupéré à partir de l’URL spécifiée

Sélectionner des éléments HTML

Sélectionne les éléments HTML correspondant au sélecteur fourni

Paramètres

Nom Clé Obligatoire Type Description
html
html True string

Contenu HTML à analyser

sélecteur
selector True string

Sélecteur CSS ou XPath pour le ciblage d’éléments

selector_type
selector_type string

Type de sélecteur à utiliser

Retours

Nom Chemin d’accès Type Description
success
success boolean

Indique si l’opération a réussi

Éléments
elements array of HtmlElement

Tableau d’éléments HTML qui correspondent au sélecteur spécifié

count
count integer

Nombre d’éléments trouvés

Définitions

HtmlElement

Représente un élément HTML avec ses propriétés et ses attributs

Nom Chemin d’accès Type Description
tag
tag string

Nom de balise HTML de l’élément (par exemple, 'div', 'span', 'a')

outerHtml
outerHtml string

Code HTML complet de l’élément, y compris l’élément lui-même

innerHtml
innerHtml string

Contenu HTML à l’intérieur de l’élément, qui peut inclure d’autres éléments

innerText
innerText string

Contenu texte à l’intérieur de l’élément avec toutes les balises HTML supprimées

attributes
attributes object

Tous les attributs de l’élément en tant que paires nom-valeur

isSelfClosing
isSelfClosing boolean

Indique si l’élément est une balise de fermeture automatique (par exemple, ,
)