Sdílet prostřednictvím


MiniSoup HTML Parser (nezávislý vydavatel) (Preview)

Zjednodušená knihovna pro analýzu HTML inspirovaná krásnou polévkou, která poskytuje možnosti pro analýzu a extrakci elementů HTML

Tento konektor je dostupný v následujících produktech a oblastech:

Service Class Regions
Copilot Studio Premium Všechny oblasti Power Automate s výjimkou následujících:
     – státní správa USA (GCC)
     – státní správa USA (GCC High)
     - China Cloud provozovaný společností 21Vianet
     - Ministerstvo obrany USA (DoD)
Logic Apps Standard Všechny oblasti Logic Apps s výjimkou následujících:
     – Oblasti Azure Government
     – Oblasti Azure China
     - Ministerstvo obrany USA (DoD)
Power Apps Premium Všechny oblasti Power Apps s výjimkou následujících:
     – státní správa USA (GCC)
     – státní správa USA (GCC High)
     - China Cloud provozovaný společností 21Vianet
     - Ministerstvo obrany USA (DoD)
Power Automate Premium Všechny oblasti Power Automate s výjimkou následujících:
     – státní správa USA (GCC)
     – státní správa USA (GCC High)
     - China Cloud provozovaný společností 21Vianet
     - Ministerstvo obrany USA (DoD)
Kontakt
Název Podpora miniSoup
URL https://github.com/DEmodoriGatsuO/MiniSoup
Email demodori.gatsuo@gmail.com
Metadata konektoru
Vydavatel Shogo Shindo
Internetová stránka https://github.com/DEmodoriGatsuO/MiniSoup
Zásady ochrany osobních údajů https://github.com/DEmodoriGatsuO/MiniSoup/blob/main/PRIVACY.md
Kategorie Data; Internetová stránka

Limity omezování

Name Volání Období obnovení
Volání rozhraní API na připojení 100 60 sekund

Akce

Analýza tabulky HTML

Parsuje tabulku HTML do strukturovaných dat se záhlavími a řádky.

Extrakce hodnot z elementů HTML

Extrahuje konkrétní hodnoty atributů z elementů HTML odpovídajících zadanému selektoru.

Najít všechny odpovídající prvky

Vyhledá všechny elementy HTML odpovídající zadanému názvu značky a volitelným atributům.

Načtení obsahu HTML

Načte obsah HTML ze zadané adresy URL.

Výběr elementů HTML

Vybere elementy HTML odpovídající zadanému selektoru.

Analýza tabulky HTML

Parsuje tabulku HTML do strukturovaných dat se záhlavími a řádky.

Parametry

Name Klíč Vyžadováno Typ Description
html
html True string

Obsah HTML obsahující tabulku

table_selector
table_selector string

Výběr šablon stylů CSS pro vyhledání elementu tabulky HTML

header_rows_exist
header_rows_exist boolean

Určuje, jestli tabulka obsahuje řádky záhlaví.

Návraty

Name Cesta Typ Description
úspěch
success boolean

Určuje, jestli byla operace úspěšná.

Headers
data.Headers array of string

Záhlaví sloupců extrahovaná z tabulky

Řádky
data.Rows array of array

Řádky tabulky obsahující matici hodnot buněk

items
data.Rows array of string

Extrakce hodnot z elementů HTML

Extrahuje konkrétní hodnoty atributů z elementů HTML odpovídajících zadanému selektoru.

Parametry

Name Klíč Vyžadováno Typ Description
html
html True string

Obsah HTML, který se má analyzovat

selektor
selector True string

Selektor šablon stylů CSS nebo XPath pro cílení prvků

atribut
attribute True string

Atribut pro extrakci z vybraných prvků Pro vnitřní text, html pro vnitřní kód HTML nebo název konkrétního atributu použijte text.

selector_type
selector_type string

Typ selektoru, který se má použít

Návraty

Name Cesta Typ Description
úspěch
success boolean

Určuje, jestli byla operace úspěšná.

values
values array of string

Pole extrahovaných hodnot z odpovídajících prvků

count
count integer

Počet extrahovaných hodnot

Najít všechny odpovídající prvky

Vyhledá všechny elementy HTML odpovídající zadanému názvu značky a volitelným atributům.

Parametry

Name Klíč Vyžadováno Typ Description
html
html True string

Obsah HTML, který se má analyzovat

tag_name
tag_name True string

Název značky HTML, který se má vyhledat

identifikační číslo
id string

Filtrovat podle ID elementu

třída
class string

Filtrovat podle třídy elementu

Návraty

Name Cesta Typ Description
úspěch
success boolean

Určuje, jestli byla operace úspěšná.

elementy
elements array of HtmlElement

Pole elementů HTML, které odpovídají zadanému názvu značky a atributům

count
count integer

Počet nalezených prvků

Načtení obsahu HTML

Načte obsah HTML ze zadané adresy URL.

Parametry

Name Klíč Vyžadováno Typ Description
adresa URL
url True string

Adresa URL pro načtení obsahu HTML z

Návraty

Name Cesta Typ Description
úspěch
success boolean

Určuje, jestli byla operace úspěšná.

html
html string

Obsah HTML načtený ze zadané adresy URL

Výběr elementů HTML

Vybere elementy HTML odpovídající zadanému selektoru.

Parametry

Name Klíč Vyžadováno Typ Description
html
html True string

Obsah HTML, který se má analyzovat

selektor
selector True string

Selektor šablon stylů CSS nebo XPath pro cílení prvků

selector_type
selector_type string

Typ selektoru, který se má použít

Návraty

Name Cesta Typ Description
úspěch
success boolean

Určuje, jestli byla operace úspěšná.

elementy
elements array of HtmlElement

Pole elementů HTML, které odpovídají zadanému selektoru

count
count integer

Počet nalezených prvků

Definice

HtmlElement

Představuje element HTML s jeho vlastnostmi a atributy.

Name Cesta Typ Description
klíčové slovo
tag string

Název značky HTML elementu (např. div, span, a)

outerHtml
outerHtml string

Kompletní kód HTML elementu včetně samotného elementu

innerHtml
innerHtml string

Obsah HTML uvnitř elementu, který může obsahovat další prvky

innerText
innerText string

Textový obsah uvnitř elementu se všemi odebranými značkami HTML

attributes
attributes object

Všechny atributy elementu jako páry name-value

isSelfClosing
isSelfClosing boolean

Určuje, zda je element samozavírací značkou (např. ,
)