MiniSoup HTML-elemző (független közzétevő) (előzetes verzió)
A Beautiful Soup által ihletett egyszerűsített HTML-elemzési kódtár, amely a HTML-elemek elemzéséhez és kinyeréshez nyújt képességeket
Ez az összekötő a következő termékekben és régiókban érhető el:
| Service | Class | Régiók |
|---|---|---|
| Copilot Studio | prémium | Az összes Power Automate-régió, kivéve a következőket: - USA kormánya (GCC) - Amerikai kormány (GCC High) - A 21Vianet által üzemeltetett China Cloud - Amerikai Védelmi Minisztérium (DoD) |
| Logikai alkalmazások | Standard | Az összes Logic Apps-régió , kivéve a következőket: - Azure Government-régiók - Azure China-régiók - Amerikai Védelmi Minisztérium (DoD) |
| Power Alkalmazások | prémium | Az összes Power Apps-régió , kivéve a következőket: - USA kormánya (GCC) - Amerikai kormány (GCC High) - A 21Vianet által üzemeltetett China Cloud - Amerikai Védelmi Minisztérium (DoD) |
| Power Automate | prémium | Az összes Power Automate-régió, kivéve a következőket: - USA kormánya (GCC) - Amerikai kormány (GCC High) - A 21Vianet által üzemeltetett China Cloud - Amerikai Védelmi Minisztérium (DoD) |
| Érintkezés | |
|---|---|
| Név | MiniSoup-támogatás |
| URL | https://github.com/DEmodoriGatsuO/MiniSoup |
| demodori.gatsuo@gmail.com |
| Összekötő metaadatai | |
|---|---|
| Kiadó | Shogo Shindo |
| Webhely | https://github.com/DEmodoriGatsuO/MiniSoup |
| Adatvédelmi irányelvek | https://github.com/DEmodoriGatsuO/MiniSoup/blob/main/PRIVACY.md |
| Kategóriák | Adat; Webhely |
Szabályozási korlátok
| Name | Hívások | Megújítási időszak |
|---|---|---|
| API-hívások kapcsolatonként | 100 | 60 másodperc |
Műveletek
| Az összes egyező elem megkeresése |
Megkeresi a megadott címkenévnek és opcionális attribútumoknak megfelelő összes HTML-elemet |
| HTML-elemek kiválasztása |
A megadott választónak megfelelő HTML-elemek kijelölése |
| HTML-tartalom beolvasása |
HTML-tartalom lekérése egy megadott URL-címről |
| HTML-táblázat elemzése |
HTML-táblázat elemzése strukturált adatokká fejlécekkel és sorokkal |
| Értékek kinyerése HTML-elemekből |
A megadott választónak megfelelő HTML-elemekből nyer ki konkrét attribútumértékeket |
Az összes egyező elem megkeresése
Megkeresi a megadott címkenévnek és opcionális attribútumoknak megfelelő összes HTML-elemet
Paraméterek
| Name | Kulcs | Kötelező | Típus | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Elemezni kívánt HTML-tartalom |
|
tag_name
|
tag_name | True | string |
A keresendő HTML-címke neve |
|
azonosító
|
id | string |
Szűrés elemazonosító szerint |
|
|
osztály
|
class | string |
Szűrés elemosztály szerint |
Válaszok
| Name | Elérési út | Típus | Description |
|---|---|---|---|
|
siker
|
success | boolean |
Jelzi, hogy a művelet sikeres volt-e |
|
Elemek
|
elements | array of HtmlElement |
A megadott címkenévnek és attribútumoknak megfelelő HTML-elemek tömbje |
|
count
|
count | integer |
A talált elemek száma |
HTML-elemek kiválasztása
A megadott választónak megfelelő HTML-elemek kijelölése
Paraméterek
| Name | Kulcs | Kötelező | Típus | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Elemezni kívánt HTML-tartalom |
|
szelektor
|
selector | True | string |
CSS-választó vagy XPath az elemek célzásához |
|
selector_type
|
selector_type | string |
A használni kívánt választó típusa |
Válaszok
| Name | Elérési út | Típus | Description |
|---|---|---|---|
|
siker
|
success | boolean |
Jelzi, hogy a művelet sikeres volt-e |
|
Elemek
|
elements | array of HtmlElement |
A megadott választónak megfelelő HTML-elemek tömbje |
|
count
|
count | integer |
A talált elemek száma |
HTML-tartalom beolvasása
HTML-tartalom lekérése egy megadott URL-címről
Paraméterek
| Name | Kulcs | Kötelező | Típus | Description |
|---|---|---|---|---|
|
URL-cím
|
url | True | string |
URL-cím HTML-tartalom lekéréséhez |
Válaszok
| Name | Elérési út | Típus | Description |
|---|---|---|---|
|
siker
|
success | boolean |
Jelzi, hogy a művelet sikeres volt-e |
|
html
|
html | string |
A megadott URL-címről lekért HTML-tartalom |
HTML-táblázat elemzése
HTML-táblázat elemzése strukturált adatokká fejlécekkel és sorokkal
Paraméterek
| Name | Kulcs | Kötelező | Típus | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
A táblázatot tartalmazó HTML-tartalom |
|
table_selector
|
table_selector | string |
CSS-választó a HTML-táblaelem megkereséséhez |
|
|
header_rows_exist
|
header_rows_exist | boolean |
Azt jelzi, hogy a tábla fejlécsorokat tartalmaz-e |
Válaszok
| Name | Elérési út | Típus | Description |
|---|---|---|---|
|
siker
|
success | boolean |
Jelzi, hogy a művelet sikeres volt-e |
|
Fejlécek
|
data.Headers | array of string |
A táblázatból kinyert oszlopfejlécek |
|
Rows
|
data.Rows | array of array |
Cellaértékeket tartalmazó táblázatsorok |
|
items
|
data.Rows | array of string |
Értékek kinyerése HTML-elemekből
A megadott választónak megfelelő HTML-elemekből nyer ki konkrét attribútumértékeket
Paraméterek
| Name | Kulcs | Kötelező | Típus | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Elemezni kívánt HTML-tartalom |
|
szelektor
|
selector | True | string |
CSS-választó vagy XPath az elemek célzásához |
|
attribútum
|
attribute | True | string |
A kijelölt elemekből kinyerendő attribútum. Szöveg használata belső szöveghez, "html" belső HTML-hez vagy adott attribútumnévhez |
|
selector_type
|
selector_type | string |
A használni kívánt választó típusa |
Válaszok
| Name | Elérési út | Típus | Description |
|---|---|---|---|
|
siker
|
success | boolean |
Jelzi, hogy a művelet sikeres volt-e |
|
values
|
values | array of string |
Az egyező elemekből kinyert értékek tömbje |
|
count
|
count | integer |
Kinyert értékek száma |
Definíciók
Html elem
HTML-elemet jelöl annak tulajdonságaival és attribútumaival
| Name | Elérési út | Típus | Description |
|---|---|---|---|
|
címke
|
tag | string |
Az elem HTML-címkeneve (pl. 'div', 'span', 'a') |
|
outerHtml
|
outerHtml | string |
Az elem teljes HTML-tartalma, beleértve magát az elemet is |
|
innerHtml
|
innerHtml | string |
Az elemen belüli HTML-tartalom, amely más elemeket is tartalmazhat |
|
innerText
|
innerText | string |
Az elemen belüli szöveges tartalom az összes HTML-címke eltávolításával |
|
attributes
|
attributes | object |
Az elem összes attribútuma név-érték párként |
|
isSelfClosing
|
isSelfClosing | boolean |
Azt jelzi, hogy az elem önzáró címke-e (pl. |