Aracılığıyla paylaş


MiniSoup HTML Ayrıştırıcısı (Bağımsız Yayımcı) (Önizleme)

Beautiful Soup'dan esinlenen, HTML öğe analizi ve ayıklama özellikleri sağlayan basit bir HTML ayrıştırma kitaplığı

Bu bağlayıcı aşağıdaki ürün ve bölgelerde kullanılabilir:

Hizmet Class Bölgeler
Copilot Studio Premium Aşağıdakiler dışında tüm Power Automate bölgeleri :
     - ABD Kamu (GCC)
     - US Government (GCC High)
     - 21Vianet tarafından işletilen Çin Bulutu
     - ABD Savunma Bakanlığı (DoD)
Logic Apps Standart Aşağıdakiler dışında tüm Logic Apps bölgeleri :
     - Azure Kamu bölgeleri
     - Azure Çin bölgeleri
     - ABD Savunma Bakanlığı (DoD)
Power Apps Premium Aşağıdakiler dışında tüm Power Apps bölgeleri :
     - ABD Kamu (GCC)
     - US Government (GCC High)
     - 21Vianet tarafından işletilen Çin Bulutu
     - ABD Savunma Bakanlığı (DoD)
Power Automate Premium Aşağıdakiler dışında tüm Power Automate bölgeleri :
     - ABD Kamu (GCC)
     - US Government (GCC High)
     - 21Vianet tarafından işletilen Çin Bulutu
     - ABD Savunma Bakanlığı (DoD)
İletişim
İsim MiniSoup Desteği
URL https://github.com/DEmodoriGatsuO/MiniSoup
E-posta demodori.gatsuo@gmail.com
Bağlayıcı Meta Verileri
Publisher Shogo Shindo
Web sitesi https://github.com/DEmodoriGatsuO/MiniSoup
Gizlilik ilkesi https://github.com/DEmodoriGatsuO/MiniSoup/blob/main/PRIVACY.md
Kategoriler Veri; Web sitesi

Azaltma Sınırları

Name Çağrılar Yenileme Dönemi
Bağlantı başına API çağrıları 100 60 saniye

Eylemler

HTML İçeriğiNi Getirme

Belirtilen URL'den HTML içeriği getirir

HTML Tablosunu Ayrıştır

HTML tablosunu üst bilgiler ve satırlarla yapılandırılmış verilere ayrıştırır

HTML Öğeleri Seç

Sağlanan seçiciyle eşleşen HTML öğelerini seçer

HTML Öğelerinden Değerleri Ayıklama

Sağlanan seçiciyle eşleşen HTML öğelerinden belirli öznitelik değerlerini ayıklar

Tüm Eşleşen Öğeleri Bul

Belirtilen etiket adı ve isteğe bağlı özniteliklerle eşleşen tüm HTML öğelerini bulur

HTML İçeriğiNi Getirme

Belirtilen URL'den HTML içeriği getirir

Parametreler

Name Anahtar Gerekli Tür Description
url
url True string

HTML içeriğinin getirilmeye kaynaklandığı URL

Döndürülenler

Name Yol Tür Description
başarı
success boolean

İşlemin başarılı olup olmadığını gösterir

html
html string

Belirtilen URL'den alınan HTML içeriği

HTML Tablosunu Ayrıştır

HTML tablosunu üst bilgiler ve satırlarla yapılandırılmış verilere ayrıştırır

Parametreler

Name Anahtar Gerekli Tür Description
html
html True string

Tabloyu içeren HTML içeriği

table_selector
table_selector string

HTML tablosu öğesini bulmak için CSS seçicisi

header_rows_exist
header_rows_exist boolean

Tabloda üst bilgi satırı olup olmadığı

Döndürülenler

Name Yol Tür Description
başarı
success boolean

İşlemin başarılı olup olmadığını gösterir

Headers
data.Headers array of string

Tablodan ayıklanan sütun üst bilgileri

Rows
data.Rows array of array

Her biri bir hücre değerleri dizisi içeren tablo satırları

items
data.Rows array of string

HTML Öğeleri Seç

Sağlanan seçiciyle eşleşen HTML öğelerini seçer

Parametreler

Name Anahtar Gerekli Tür Description
html
html True string

Ayrıştırılacak HTML içeriği

Seçici
selector True string

Öğeleri hedeflemek için CSS seçicisi veya XPath

selector_type
selector_type string

Kullanılacak seçici türü

Döndürülenler

Name Yol Tür Description
başarı
success boolean

İşlemin başarılı olup olmadığını gösterir

Öğe
elements array of HtmlElement

Belirtilen seçiciyle eşleşen HTML öğeleri dizisi

count
count integer

Bulunan öğe sayısı

HTML Öğelerinden Değerleri Ayıklama

Sağlanan seçiciyle eşleşen HTML öğelerinden belirli öznitelik değerlerini ayıklar

Parametreler

Name Anahtar Gerekli Tür Description
html
html True string

Ayrıştırılacak HTML içeriği

Seçici
selector True string

Öğeleri hedeflemek için CSS seçicisi veya XPath

Öznitelik
attribute True string

Seçili öğelerden ayıklanan öznitelik. İç metin için 'text', iç HTML için 'html' veya belirli öznitelik adı kullanın

selector_type
selector_type string

Kullanılacak seçici türü

Döndürülenler

Name Yol Tür Description
başarı
success boolean

İşlemin başarılı olup olmadığını gösterir

values
values array of string

Eşleşen öğelerden ayıklanan değerlerin dizisi

count
count integer

Ayıklanan değer sayısı

Tüm Eşleşen Öğeleri Bul

Belirtilen etiket adı ve isteğe bağlı özniteliklerle eşleşen tüm HTML öğelerini bulur

Parametreler

Name Anahtar Gerekli Tür Description
html
html True string

Ayrıştırılacak HTML içeriği

tag_name
tag_name True string

Aranacak HTML etiketi adı

kimlik
id string

Öğe kimliğine göre filtreleme

sınıf
class string

Öğe sınıfına göre filtreleme

Döndürülenler

Name Yol Tür Description
başarı
success boolean

İşlemin başarılı olup olmadığını gösterir

Öğe
elements array of HtmlElement

Belirtilen etiket adı ve öznitelikleriyle eşleşen HTML öğeleri dizisi

count
count integer

Bulunan öğe sayısı

Tanımlar

HtmlElement

Özellikleri ve öznitelikleri olan bir HTML öğesini temsil eder

Name Yol Tür Description
tag
tag string

Öğesinin HTML etiket adı (örneğin, 'div', 'span', 'a')

outerHtml
outerHtml string

Öğenin kendisini içeren tam HTML'si

innerHtml
innerHtml string

Öğesinin içindeki html içeriği, diğer öğeleri içerebilir

innerText
innerText string

Tüm HTML etiketlerinin kaldırıldığı öğenin içindeki metin içeriği

attributes
attributes object

öğesinin ad-değer çiftleri olarak tüm öznitelikleri

isSelfClosing
isSelfClosing boolean

öğesinin kendi kendine kapanan bir etiket olup olmadığını gösterir (örneğin, ,
)