MiniSoup HTML Parser (nezávislý vydavatel) (Preview)
Zjednodušená knihovna pro analýzu HTML inspirovaná krásnou polévkou, která poskytuje možnosti pro analýzu a extrakci elementů HTML
Tento konektor je dostupný v následujících produktech a oblastech:
| Service | Class | Regions |
|---|---|---|
| Copilot Studio | Premium | Všechny oblasti Power Automate s výjimkou následujících: – státní správa USA (GCC) – státní správa USA (GCC High) - China Cloud provozovaný společností 21Vianet - Ministerstvo obrany USA (DoD) |
| Logic Apps | Standard | Všechny oblasti Logic Apps s výjimkou následujících: – Oblasti Azure Government – Oblasti Azure China - Ministerstvo obrany USA (DoD) |
| Power Apps | Premium | Všechny oblasti Power Apps s výjimkou následujících: – státní správa USA (GCC) – státní správa USA (GCC High) - China Cloud provozovaný společností 21Vianet - Ministerstvo obrany USA (DoD) |
| Power Automate | Premium | Všechny oblasti Power Automate s výjimkou následujících: – státní správa USA (GCC) – státní správa USA (GCC High) - China Cloud provozovaný společností 21Vianet - Ministerstvo obrany USA (DoD) |
| Kontakt | |
|---|---|
| Název | Podpora miniSoup |
| URL | https://github.com/DEmodoriGatsuO/MiniSoup |
| demodori.gatsuo@gmail.com |
| Metadata konektoru | |
|---|---|
| Vydavatel | Shogo Shindo |
| Internetová stránka | https://github.com/DEmodoriGatsuO/MiniSoup |
| Zásady ochrany osobních údajů | https://github.com/DEmodoriGatsuO/MiniSoup/blob/main/PRIVACY.md |
| Kategorie | Data; Internetová stránka |
Limity omezování
| Name | Volání | Období obnovení |
|---|---|---|
| Volání rozhraní API na připojení | 100 | 60 sekund |
Akce
| Analýza tabulky HTML |
Parsuje tabulku HTML do strukturovaných dat se záhlavími a řádky. |
| Extrakce hodnot z elementů HTML |
Extrahuje konkrétní hodnoty atributů z elementů HTML odpovídajících zadanému selektoru. |
| Najít všechny odpovídající prvky |
Vyhledá všechny elementy HTML odpovídající zadanému názvu značky a volitelným atributům. |
| Načtení obsahu HTML |
Načte obsah HTML ze zadané adresy URL. |
| Výběr elementů HTML |
Vybere elementy HTML odpovídající zadanému selektoru. |
Analýza tabulky HTML
Parsuje tabulku HTML do strukturovaných dat se záhlavími a řádky.
Parametry
| Name | Klíč | Vyžadováno | Typ | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Obsah HTML obsahující tabulku |
|
table_selector
|
table_selector | string |
Výběr šablon stylů CSS pro vyhledání elementu tabulky HTML |
|
|
header_rows_exist
|
header_rows_exist | boolean |
Určuje, jestli tabulka obsahuje řádky záhlaví. |
Návraty
| Name | Cesta | Typ | Description |
|---|---|---|---|
|
úspěch
|
success | boolean |
Určuje, jestli byla operace úspěšná. |
|
Headers
|
data.Headers | array of string |
Záhlaví sloupců extrahovaná z tabulky |
|
Řádky
|
data.Rows | array of array |
Řádky tabulky obsahující matici hodnot buněk |
|
items
|
data.Rows | array of string |
Extrakce hodnot z elementů HTML
Extrahuje konkrétní hodnoty atributů z elementů HTML odpovídajících zadanému selektoru.
Parametry
| Name | Klíč | Vyžadováno | Typ | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Obsah HTML, který se má analyzovat |
|
selektor
|
selector | True | string |
Selektor šablon stylů CSS nebo XPath pro cílení prvků |
|
atribut
|
attribute | True | string |
Atribut pro extrakci z vybraných prvků Pro vnitřní text, html pro vnitřní kód HTML nebo název konkrétního atributu použijte text. |
|
selector_type
|
selector_type | string |
Typ selektoru, který se má použít |
Návraty
| Name | Cesta | Typ | Description |
|---|---|---|---|
|
úspěch
|
success | boolean |
Určuje, jestli byla operace úspěšná. |
|
values
|
values | array of string |
Pole extrahovaných hodnot z odpovídajících prvků |
|
count
|
count | integer |
Počet extrahovaných hodnot |
Najít všechny odpovídající prvky
Vyhledá všechny elementy HTML odpovídající zadanému názvu značky a volitelným atributům.
Parametry
| Name | Klíč | Vyžadováno | Typ | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Obsah HTML, který se má analyzovat |
|
tag_name
|
tag_name | True | string |
Název značky HTML, který se má vyhledat |
|
identifikační číslo
|
id | string |
Filtrovat podle ID elementu |
|
|
třída
|
class | string |
Filtrovat podle třídy elementu |
Návraty
| Name | Cesta | Typ | Description |
|---|---|---|---|
|
úspěch
|
success | boolean |
Určuje, jestli byla operace úspěšná. |
|
elementy
|
elements | array of HtmlElement |
Pole elementů HTML, které odpovídají zadanému názvu značky a atributům |
|
count
|
count | integer |
Počet nalezených prvků |
Načtení obsahu HTML
Načte obsah HTML ze zadané adresy URL.
Parametry
| Name | Klíč | Vyžadováno | Typ | Description |
|---|---|---|---|---|
|
adresa URL
|
url | True | string |
Adresa URL pro načtení obsahu HTML z |
Návraty
| Name | Cesta | Typ | Description |
|---|---|---|---|
|
úspěch
|
success | boolean |
Určuje, jestli byla operace úspěšná. |
|
html
|
html | string |
Obsah HTML načtený ze zadané adresy URL |
Výběr elementů HTML
Vybere elementy HTML odpovídající zadanému selektoru.
Parametry
| Name | Klíč | Vyžadováno | Typ | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Obsah HTML, který se má analyzovat |
|
selektor
|
selector | True | string |
Selektor šablon stylů CSS nebo XPath pro cílení prvků |
|
selector_type
|
selector_type | string |
Typ selektoru, který se má použít |
Návraty
| Name | Cesta | Typ | Description |
|---|---|---|---|
|
úspěch
|
success | boolean |
Určuje, jestli byla operace úspěšná. |
|
elementy
|
elements | array of HtmlElement |
Pole elementů HTML, které odpovídají zadanému selektoru |
|
count
|
count | integer |
Počet nalezených prvků |
Definice
HtmlElement
Představuje element HTML s jeho vlastnostmi a atributy.
| Name | Cesta | Typ | Description |
|---|---|---|---|
|
klíčové slovo
|
tag | string |
Název značky HTML elementu (např. div, span, a) |
|
outerHtml
|
outerHtml | string |
Kompletní kód HTML elementu včetně samotného elementu |
|
innerHtml
|
innerHtml | string |
Obsah HTML uvnitř elementu, který může obsahovat další prvky |
|
innerText
|
innerText | string |
Textový obsah uvnitř elementu se všemi odebranými značkami HTML |
|
attributes
|
attributes | object |
Všechny atributy elementu jako páry name-value |
|
isSelfClosing
|
isSelfClosing | boolean |
Určuje, |