MiniSoup HTML Ayrıştırıcısı (Bağımsız Yayımcı) (Önizleme)
Beautiful Soup'dan esinlenen, HTML öğe analizi ve ayıklama özellikleri sağlayan basit bir HTML ayrıştırma kitaplığı
Bu bağlayıcı aşağıdaki ürün ve bölgelerde kullanılabilir:
| Hizmet | Class | Bölgeler |
|---|---|---|
| Copilot Studio | Premium | Aşağıdakiler dışında tüm Power Automate bölgeleri : - ABD Kamu (GCC) - US Government (GCC High) - 21Vianet tarafından işletilen Çin Bulutu - ABD Savunma Bakanlığı (DoD) |
| Logic Apps | Standart | Aşağıdakiler dışında tüm Logic Apps bölgeleri : - Azure Kamu bölgeleri - Azure Çin bölgeleri - ABD Savunma Bakanlığı (DoD) |
| Power Apps | Premium | Aşağıdakiler dışında tüm Power Apps bölgeleri : - ABD Kamu (GCC) - US Government (GCC High) - 21Vianet tarafından işletilen Çin Bulutu - ABD Savunma Bakanlığı (DoD) |
| Power Automate | Premium | Aşağıdakiler dışında tüm Power Automate bölgeleri : - ABD Kamu (GCC) - US Government (GCC High) - 21Vianet tarafından işletilen Çin Bulutu - ABD Savunma Bakanlığı (DoD) |
| İletişim | |
|---|---|
| İsim | MiniSoup Desteği |
| URL | https://github.com/DEmodoriGatsuO/MiniSoup |
| E-posta | demodori.gatsuo@gmail.com |
| Bağlayıcı Meta Verileri | |
|---|---|
| Publisher | Shogo Shindo |
| Web sitesi | https://github.com/DEmodoriGatsuO/MiniSoup |
| Gizlilik ilkesi | https://github.com/DEmodoriGatsuO/MiniSoup/blob/main/PRIVACY.md |
| Kategoriler | Veri; Web sitesi |
Azaltma Sınırları
| Name | Çağrılar | Yenileme Dönemi |
|---|---|---|
| Bağlantı başına API çağrıları | 100 | 60 saniye |
Eylemler
|
HTML İçeriği |
Belirtilen URL'den HTML içeriği getirir |
| HTML Tablosunu Ayrıştır |
HTML tablosunu üst bilgiler ve satırlarla yapılandırılmış verilere ayrıştırır |
| HTML Öğeleri Seç |
Sağlanan seçiciyle eşleşen HTML öğelerini seçer |
| HTML Öğelerinden Değerleri Ayıklama |
Sağlanan seçiciyle eşleşen HTML öğelerinden belirli öznitelik değerlerini ayıklar |
| Tüm Eşleşen Öğeleri Bul |
Belirtilen etiket adı ve isteğe bağlı özniteliklerle eşleşen tüm HTML öğelerini bulur |
HTML İçeriğiNi Getirme
Belirtilen URL'den HTML içeriği getirir
Parametreler
| Name | Anahtar | Gerekli | Tür | Description |
|---|---|---|---|---|
|
url
|
url | True | string |
HTML içeriğinin getirilmeye kaynaklandığı URL |
Döndürülenler
| Name | Yol | Tür | Description |
|---|---|---|---|
|
başarı
|
success | boolean |
İşlemin başarılı olup olmadığını gösterir |
|
html
|
html | string |
Belirtilen URL'den alınan HTML içeriği |
HTML Tablosunu Ayrıştır
HTML tablosunu üst bilgiler ve satırlarla yapılandırılmış verilere ayrıştırır
Parametreler
| Name | Anahtar | Gerekli | Tür | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Tabloyu içeren HTML içeriği |
|
table_selector
|
table_selector | string |
HTML tablosu öğesini bulmak için CSS seçicisi |
|
|
header_rows_exist
|
header_rows_exist | boolean |
Tabloda üst bilgi satırı olup olmadığı |
Döndürülenler
| Name | Yol | Tür | Description |
|---|---|---|---|
|
başarı
|
success | boolean |
İşlemin başarılı olup olmadığını gösterir |
|
Headers
|
data.Headers | array of string |
Tablodan ayıklanan sütun üst bilgileri |
|
Rows
|
data.Rows | array of array |
Her biri bir hücre değerleri dizisi içeren tablo satırları |
|
items
|
data.Rows | array of string |
HTML Öğeleri Seç
Sağlanan seçiciyle eşleşen HTML öğelerini seçer
Parametreler
| Name | Anahtar | Gerekli | Tür | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Ayrıştırılacak HTML içeriği |
|
Seçici
|
selector | True | string |
Öğeleri hedeflemek için CSS seçicisi veya XPath |
|
selector_type
|
selector_type | string |
Kullanılacak seçici türü |
Döndürülenler
| Name | Yol | Tür | Description |
|---|---|---|---|
|
başarı
|
success | boolean |
İşlemin başarılı olup olmadığını gösterir |
|
Öğe
|
elements | array of HtmlElement |
Belirtilen seçiciyle eşleşen HTML öğeleri dizisi |
|
count
|
count | integer |
Bulunan öğe sayısı |
HTML Öğelerinden Değerleri Ayıklama
Sağlanan seçiciyle eşleşen HTML öğelerinden belirli öznitelik değerlerini ayıklar
Parametreler
| Name | Anahtar | Gerekli | Tür | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Ayrıştırılacak HTML içeriği |
|
Seçici
|
selector | True | string |
Öğeleri hedeflemek için CSS seçicisi veya XPath |
|
Öznitelik
|
attribute | True | string |
Seçili öğelerden ayıklanan öznitelik. İç metin için 'text', iç HTML için 'html' veya belirli öznitelik adı kullanın |
|
selector_type
|
selector_type | string |
Kullanılacak seçici türü |
Döndürülenler
| Name | Yol | Tür | Description |
|---|---|---|---|
|
başarı
|
success | boolean |
İşlemin başarılı olup olmadığını gösterir |
|
values
|
values | array of string |
Eşleşen öğelerden ayıklanan değerlerin dizisi |
|
count
|
count | integer |
Ayıklanan değer sayısı |
Tüm Eşleşen Öğeleri Bul
Belirtilen etiket adı ve isteğe bağlı özniteliklerle eşleşen tüm HTML öğelerini bulur
Parametreler
| Name | Anahtar | Gerekli | Tür | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Ayrıştırılacak HTML içeriği |
|
tag_name
|
tag_name | True | string |
Aranacak HTML etiketi adı |
|
kimlik
|
id | string |
Öğe kimliğine göre filtreleme |
|
|
sınıf
|
class | string |
Öğe sınıfına göre filtreleme |
Döndürülenler
| Name | Yol | Tür | Description |
|---|---|---|---|
|
başarı
|
success | boolean |
İşlemin başarılı olup olmadığını gösterir |
|
Öğe
|
elements | array of HtmlElement |
Belirtilen etiket adı ve öznitelikleriyle eşleşen HTML öğeleri dizisi |
|
count
|
count | integer |
Bulunan öğe sayısı |
Tanımlar
HtmlElement
Özellikleri ve öznitelikleri olan bir HTML öğesini temsil eder
| Name | Yol | Tür | Description |
|---|---|---|---|
|
tag
|
tag | string |
Öğesinin HTML etiket adı (örneğin, 'div', 'span', 'a') |
|
outerHtml
|
outerHtml | string |
Öğenin kendisini içeren tam HTML'si |
|
innerHtml
|
innerHtml | string |
Öğesinin içindeki html içeriği, diğer öğeleri içerebilir |
|
innerText
|
innerText | string |
Tüm HTML etiketlerinin kaldırıldığı öğenin içindeki metin içeriği |
|
attributes
|
attributes | object |
öğesinin ad-değer çiftleri olarak tüm öznitelikleri |
|
isSelfClosing
|
isSelfClosing | boolean |
öğesinin kendi kendine kapanan bir etiket olup olmadığını gösterir (örneğin, , |