MiniSoup HTML Parser (Oberoende utgivare) (förhandsversion)
Ett enkelt HTML-parsningsbibliotek inspirerat av Beautiful Soup, som ger funktioner för HTML-elementanalys och extrahering
Den här anslutningsappen är tillgänglig i följande produkter och regioner:
| Tjänster | Class | Regioner |
|---|---|---|
| Copilot Studio | Premie | Alla Power Automate-regioner utom följande: - Amerikanska myndigheter (GCC) - Amerikanska myndigheter (GCC High) – China Cloud drivs av 21Vianet - US Department of Defense (DoD) |
| Logiska appar | Norm | Alla Logic Apps-regioner utom följande: – Azure Government-regioner – Regioner i Azure Kina - US Department of Defense (DoD) |
| Power Apps | Premie | Alla Power Apps-regioner utom följande: - Amerikanska myndigheter (GCC) - Amerikanska myndigheter (GCC High) – China Cloud drivs av 21Vianet - US Department of Defense (DoD) |
| Power Automate | Premie | Alla Power Automate-regioner utom följande: - Amerikanska myndigheter (GCC) - Amerikanska myndigheter (GCC High) – China Cloud drivs av 21Vianet - US Department of Defense (DoD) |
| Kontakt | |
|---|---|
| Namn | Stöd för MiniSoup |
| URL | https://github.com/DEmodoriGatsuO/MiniSoup |
| E-postmeddelande | demodori.gatsuo@gmail.com |
| Metadata för anslutningsprogram | |
|---|---|
| Utgivare | Shogo Shindo |
| Webbplats | https://github.com/DEmodoriGatsuO/MiniSoup |
| Sekretesspolicy | https://github.com/DEmodoriGatsuO/MiniSoup/blob/main/PRIVACY.md |
| Kategorier | Data; Webbplats |
Begränsningsgränser
| Name | Anrop | Förnyelseperiod |
|---|---|---|
| API-anrop per anslutning | 100 | 60 sekunder |
Åtgärder
| Extrahera värden från HTML-element |
Extraherar specifika attributvärden från HTML-element som matchar den angivna väljaren |
| Hitta alla matchande element |
Hittar alla HTML-element som matchar det angivna taggnamnet och valfria attribut |
| Hämta HTML-innehåll |
Hämtar HTML-innehåll från en angiven URL |
| Parsa HTML-tabell |
Parsar en HTML-tabell i strukturerade data med rubriker och rader |
| Välj HTML-element |
Väljer HTML-element som matchar den angivna väljaren |
Extrahera värden från HTML-element
Extraherar specifika attributvärden från HTML-element som matchar den angivna väljaren
Parametrar
| Name | Nyckel | Obligatorisk | Typ | Description |
|---|---|---|---|---|
|
HTML
|
html | True | string |
HTML-innehåll som ska parsas |
|
Selector
|
selector | True | string |
CSS-väljare eller XPath för målelement |
|
attribut
|
attribute | True | string |
Attribut som ska extraheras från valda element. Använd "text" för inre text, "html" för inre HTML eller specifikt attributnamn |
|
selector_type
|
selector_type | string |
Typ av väljare som ska användas |
Returer
| Name | Sökväg | Typ | Description |
|---|---|---|---|
|
framgång
|
success | boolean |
Anger om åtgärden lyckades |
|
values
|
values | array of string |
Matris med extraherade värden från matchande element |
|
count
|
count | integer |
Antal extraherade värden |
Hitta alla matchande element
Hittar alla HTML-element som matchar det angivna taggnamnet och valfria attribut
Parametrar
| Name | Nyckel | Obligatorisk | Typ | Description |
|---|---|---|---|---|
|
HTML
|
html | True | string |
HTML-innehåll som ska parsas |
|
tag_name
|
tag_name | True | string |
HTML-taggnamn att söka efter |
|
Id-nummer
|
id | string |
Filtrera efter element-ID |
|
|
class
|
class | string |
Filtrera efter elementklass |
Returer
| Name | Sökväg | Typ | Description |
|---|---|---|---|
|
framgång
|
success | boolean |
Anger om åtgärden lyckades |
|
element
|
elements | array of HtmlElement |
Matris med HTML-element som matchar det angivna taggnamnet och attributen |
|
count
|
count | integer |
Antal element som hittades |
Hämta HTML-innehåll
Hämtar HTML-innehåll från en angiven URL
Parametrar
| Name | Nyckel | Obligatorisk | Typ | Description |
|---|---|---|---|---|
|
URL
|
url | True | string |
URL för att hämta HTML-innehåll från |
Returer
| Name | Sökväg | Typ | Description |
|---|---|---|---|
|
framgång
|
success | boolean |
Anger om åtgärden lyckades |
|
HTML
|
html | string |
HTML-innehåll som hämtats från den angivna URL:en |
Parsa HTML-tabell
Parsar en HTML-tabell i strukturerade data med rubriker och rader
Parametrar
| Name | Nyckel | Obligatorisk | Typ | Description |
|---|---|---|---|---|
|
HTML
|
html | True | string |
HTML-innehåll som innehåller tabellen |
|
table_selector
|
table_selector | string |
CSS-väljare för att hitta HTML-tabellelementet |
|
|
header_rows_exist
|
header_rows_exist | boolean |
Om tabellen har rubrikrader |
Returer
| Name | Sökväg | Typ | Description |
|---|---|---|---|
|
framgång
|
success | boolean |
Anger om åtgärden lyckades |
|
Headers
|
data.Headers | array of string |
Kolumnrubriker som extraherats från tabellen |
|
Rows
|
data.Rows | array of array |
Tabellrader som var och en innehåller en matris med cellvärden |
|
items
|
data.Rows | array of string |
Välj HTML-element
Väljer HTML-element som matchar den angivna väljaren
Parametrar
| Name | Nyckel | Obligatorisk | Typ | Description |
|---|---|---|---|---|
|
HTML
|
html | True | string |
HTML-innehåll som ska parsas |
|
Selector
|
selector | True | string |
CSS-väljare eller XPath för målelement |
|
selector_type
|
selector_type | string |
Typ av väljare som ska användas |
Returer
| Name | Sökväg | Typ | Description |
|---|---|---|---|
|
framgång
|
success | boolean |
Anger om åtgärden lyckades |
|
element
|
elements | array of HtmlElement |
Matris med HTML-element som matchar den angivna väljaren |
|
count
|
count | integer |
Antal element som hittades |
Definitioner
HtmlElement
Representerar ett HTML-element med dess egenskaper och attribut
| Name | Sökväg | Typ | Description |
|---|---|---|---|
|
tag
|
tag | string |
HTML-taggnamnet för elementet (t.ex. "div", "span", "a") |
|
outerHtml
|
outerHtml | string |
Den fullständiga HTML-koden för elementet inklusive själva elementet |
|
innerHtml
|
innerHtml | string |
HTML-innehållet i elementet, som kan innehålla andra element |
|
innerText
|
innerText | string |
Textinnehållet i elementet med alla HTML-taggar borttagna |
|
attributes
|
attributes | object |
Alla attribut för elementet som namn/värde-par |
|
isSelfClosing
|
isSelfClosing | boolean |
Anger om elementet är en självslutande tagg (t.ex. , |