Dela via


MiniSoup HTML Parser (Oberoende utgivare) (förhandsversion)

Ett enkelt HTML-parsningsbibliotek inspirerat av Beautiful Soup, som ger funktioner för HTML-elementanalys och extrahering

Den här anslutningsappen är tillgänglig i följande produkter och regioner:

Tjänster Class Regioner
Copilot Studio Premie Alla Power Automate-regioner utom följande:
     - Amerikanska myndigheter (GCC)
     - Amerikanska myndigheter (GCC High)
     – China Cloud drivs av 21Vianet
     - US Department of Defense (DoD)
Logiska appar Norm Alla Logic Apps-regioner utom följande:
     – Azure Government-regioner
     – Regioner i Azure Kina
     - US Department of Defense (DoD)
Power Apps Premie Alla Power Apps-regioner utom följande:
     - Amerikanska myndigheter (GCC)
     - Amerikanska myndigheter (GCC High)
     – China Cloud drivs av 21Vianet
     - US Department of Defense (DoD)
Power Automate Premie Alla Power Automate-regioner utom följande:
     - Amerikanska myndigheter (GCC)
     - Amerikanska myndigheter (GCC High)
     – China Cloud drivs av 21Vianet
     - US Department of Defense (DoD)
Kontakt
Namn Stöd för MiniSoup
URL https://github.com/DEmodoriGatsuO/MiniSoup
E-postmeddelande demodori.gatsuo@gmail.com
Metadata för anslutningsprogram
Utgivare Shogo Shindo
Webbplats https://github.com/DEmodoriGatsuO/MiniSoup
Sekretesspolicy https://github.com/DEmodoriGatsuO/MiniSoup/blob/main/PRIVACY.md
Kategorier Data; Webbplats

Begränsningsgränser

Name Anrop Förnyelseperiod
API-anrop per anslutning 100 60 sekunder

Åtgärder

Extrahera värden från HTML-element

Extraherar specifika attributvärden från HTML-element som matchar den angivna väljaren

Hitta alla matchande element

Hittar alla HTML-element som matchar det angivna taggnamnet och valfria attribut

Hämta HTML-innehåll

Hämtar HTML-innehåll från en angiven URL

Parsa HTML-tabell

Parsar en HTML-tabell i strukturerade data med rubriker och rader

Välj HTML-element

Väljer HTML-element som matchar den angivna väljaren

Extrahera värden från HTML-element

Extraherar specifika attributvärden från HTML-element som matchar den angivna väljaren

Parametrar

Name Nyckel Obligatorisk Typ Description
HTML
html True string

HTML-innehåll som ska parsas

Selector
selector True string

CSS-väljare eller XPath för målelement

attribut
attribute True string

Attribut som ska extraheras från valda element. Använd "text" för inre text, "html" för inre HTML eller specifikt attributnamn

selector_type
selector_type string

Typ av väljare som ska användas

Returer

Name Sökväg Typ Description
framgång
success boolean

Anger om åtgärden lyckades

values
values array of string

Matris med extraherade värden från matchande element

count
count integer

Antal extraherade värden

Hitta alla matchande element

Hittar alla HTML-element som matchar det angivna taggnamnet och valfria attribut

Parametrar

Name Nyckel Obligatorisk Typ Description
HTML
html True string

HTML-innehåll som ska parsas

tag_name
tag_name True string

HTML-taggnamn att söka efter

Id-nummer
id string

Filtrera efter element-ID

class
class string

Filtrera efter elementklass

Returer

Name Sökväg Typ Description
framgång
success boolean

Anger om åtgärden lyckades

element
elements array of HtmlElement

Matris med HTML-element som matchar det angivna taggnamnet och attributen

count
count integer

Antal element som hittades

Hämta HTML-innehåll

Hämtar HTML-innehåll från en angiven URL

Parametrar

Name Nyckel Obligatorisk Typ Description
URL
url True string

URL för att hämta HTML-innehåll från

Returer

Name Sökväg Typ Description
framgång
success boolean

Anger om åtgärden lyckades

HTML
html string

HTML-innehåll som hämtats från den angivna URL:en

Parsa HTML-tabell

Parsar en HTML-tabell i strukturerade data med rubriker och rader

Parametrar

Name Nyckel Obligatorisk Typ Description
HTML
html True string

HTML-innehåll som innehåller tabellen

table_selector
table_selector string

CSS-väljare för att hitta HTML-tabellelementet

header_rows_exist
header_rows_exist boolean

Om tabellen har rubrikrader

Returer

Name Sökväg Typ Description
framgång
success boolean

Anger om åtgärden lyckades

Headers
data.Headers array of string

Kolumnrubriker som extraherats från tabellen

Rows
data.Rows array of array

Tabellrader som var och en innehåller en matris med cellvärden

items
data.Rows array of string

Välj HTML-element

Väljer HTML-element som matchar den angivna väljaren

Parametrar

Name Nyckel Obligatorisk Typ Description
HTML
html True string

HTML-innehåll som ska parsas

Selector
selector True string

CSS-väljare eller XPath för målelement

selector_type
selector_type string

Typ av väljare som ska användas

Returer

Name Sökväg Typ Description
framgång
success boolean

Anger om åtgärden lyckades

element
elements array of HtmlElement

Matris med HTML-element som matchar den angivna väljaren

count
count integer

Antal element som hittades

Definitioner

HtmlElement

Representerar ett HTML-element med dess egenskaper och attribut

Name Sökväg Typ Description
tag
tag string

HTML-taggnamnet för elementet (t.ex. "div", "span", "a")

outerHtml
outerHtml string

Den fullständiga HTML-koden för elementet inklusive själva elementet

innerHtml
innerHtml string

HTML-innehållet i elementet, som kan innehålla andra element

innerText
innerText string

Textinnehållet i elementet med alla HTML-taggar borttagna

attributes
attributes object

Alla attribut för elementet som namn/värde-par

isSelfClosing
isSelfClosing boolean

Anger om elementet är en självslutande tagg (t.ex. ,
)