Aracılığıyla paylaş


ScrapingBee (Bağımsız Yayımcı) (Önizleme)

ScrapingBee, web'de en güçlü web kazıma hizmetidir. Başsız tarayıcıları, proxy'leri, CAPTCHA'ları, CSS seçicileri olan herhangi bir web sitesinden karmaşık yapılandırılmış bilgileri ayıklamayı ve JavaScript senaryolarını çalıştırmayı (tıklama, kaydırma, form doldurma vb.) işler.

Bu bağlayıcı aşağıdaki ürün ve bölgelerde kullanılabilir:

Hizmet Class Bölgeler
Copilot Studio Premium Aşağıdakiler dışında tüm Power Automate bölgeleri :
     - ABD Kamu (GCC)
     - US Government (GCC High)
     - 21Vianet tarafından işletilen Çin Bulutu
     - ABD Savunma Bakanlığı (DoD)
Logic Apps Standart Aşağıdakiler dışında tüm Logic Apps bölgeleri :
     - Azure Kamu bölgeleri
     - Azure Çin bölgeleri
     - ABD Savunma Bakanlığı (DoD)
Power Apps Premium Aşağıdakiler dışında tüm Power Apps bölgeleri :
     - ABD Kamu (GCC)
     - US Government (GCC High)
     - 21Vianet tarafından işletilen Çin Bulutu
     - ABD Savunma Bakanlığı (DoD)
Power Automate Premium Aşağıdakiler dışında tüm Power Automate bölgeleri :
     - ABD Kamu (GCC)
     - US Government (GCC High)
     - 21Vianet tarafından işletilen Çin Bulutu
     - ABD Savunma Bakanlığı (DoD)
İletişim
İsim Troy Taylor
URL https://www.hitachisolutions.com
E-posta ttaylor@hitachisolutions.com
Bağlayıcı Meta Verileri
Publisher Troy Taylor
Web sitesi https://www.scrapingbee.com/
Gizlilik ilkesi https://www.scrapingbee.com/privacy-policy/
Kategoriler Web sitesi

Bağlantı oluşturma

Bağlayıcı aşağıdaki kimlik doğrulama türlerini destekler:

Varsayılan Bağlantı oluşturmak için parametreler. Tüm bölgeler Paylaşılamaz

Temerrüt

Geçerli: Tüm bölgeler

Bağlantı oluşturmak için parametreler.

Bu, paylaşılabilir bir bağlantı değildir. Power app başka bir kullanıcıyla paylaşılıyorsa, başka bir kullanıcıdan açıkça yeni bağlantı oluşturması istenir.

İsim Türü Description Gerekli
API Anahtarı securestring Bu API için API Anahtarı Doğru

Azaltma Sınırları

Name Çağrılar Yenileme Dönemi
Bağlantı başına API çağrıları 100 60 saniye

Eylemler

Google araması yapma

Google Search sonuçları sayfalarının bir kazınma değerini alır

Iskarta URL'si

Kazımak için istenen URL'yi getirir ve istenirse JavaScript'i işler.

Kullanımı alma

Kredi tüketimi ve eşzamanlılık kullanımı hakkında bilgi alın.

Google araması yapma

Google Search sonuçları sayfalarının bir kazınma değerini alır

Parametreler

Name Anahtar Gerekli Tür Description
Search
search True string

Google arama çubuğuna yerleştirdiğiniz metin.

Ülke Kodu
country_code string

İsteğin gelmesini istediğiniz ülke.

Results
nb_results integer

Döndürülecek sonuç sayısı.

Sayfa
page integer

Sonuçların ayıklanması için sayfa numarası.

Language
language string

Sonuçların döndürüleceği dil.

Ek Parametreler
extra_params string

Gönderecek ek URL parametreleri.

Döndürülenler

Name Yol Tür Description
URL
meta_data.url string

URL adresi.

Results
meta_data.number_of_results integer

Sonuç sayısı.

Yer
meta_data.location string

Konum.

Organik Sonuçlar
meta_data.number_of_organic_results integer

Organik sonuçların sayısı.

Reklam
meta_data.number_of_ads integer

Reklam sayısı.

Sayfa
meta_data.number_of_page integer

Sayfa numarası.

Sonuç İletisi Yok
meta_data.no_results_message string

Sonuç yok iletisi.

Organik Sonuçlar
organic_results array of object
URL
organic_results.url string

URL adresi.

Görüntülenen URL
organic_results.displayed_url string

Görüntülenen URL adresleri.

Description
organic_results.description string

Açıklama.

Ek Bilgi
organic_results.extra_info string

Ek bilgiler.

Position
organic_results.position integer

Konum.

Başlık
organic_results.title string

Başlık.

Yerel Sonuçlar
local_results array of string

Yerel sonuçlar.

Popüler Reklamlar
top_ads string

En popüler reklamlar.

Alt Reklamlar
bottom_ads string

En alttaki reklamlar.

İlgili Sorgular
related_queries array of object
Metin
related_queries.text string

Metin.

Position
related_queries.position integer

Konum.

Sorular
questions array of string

Sorular.

Iskarta URL'si

Kazımak için istenen URL'yi getirir ve istenirse JavaScript'i işler.

Parametreler

Name Anahtar Gerekli Tür Description
URL
url True string

Kazımak istediğiniz URL.

JS İşleme
render_js True boolean

Web sitesini başsız bir tarayıcıda işleyin.

JS Senaryosu
js_scenario string

İşlemeden önce JavaScript'i yürütür.

Wait
wait integer

İşlemeden önce bekleme süresi.

Bekle
wait_for string

DoM'da belirli bir öğenin görünmesini bekleyin.

Reklamları Engelle
block_ads boolean

Reklamların engellenip engellenmeyeceği.

Kaynakları Engelle
block_resources boolean

Tüm görüntülerin ve CSS'nin engellenip engellenmeyeceği.

Pencere Genişliği
window_width integer

Kullanılacak pencerenin genişliği.

Pencere Yüksekliği
window_height integer

Kullanılacak pencerenin yüksekliği.

Premium Proxy
premium_proxy boolean

Web sitesini yapıştırmak için ara sunucu kullanılıp kullanılmaymayacağı.

Ülke Kodu
country_code string

Web sitesini yapıştırmak için kullanılacak proxy ülke.

Gizli Ara Sunucu
stealth_proxy boolean

Web sitesini kazımak için gizli proxy kullanılıp kullanılmaymayacağı.

Kendi Proxy'si
own_proxy string

Kullanılacak kendi proxy'niz.

Kuralları Ayıklama
extract_rules string

Html'yi yanıtlamadan önce ayrıştırmak için ayıklama kuralları.

Screenshot
screenshot boolean

İstenen web sitesinin ekran görüntüsünü alın.

Ekran Görüntüsü Seçici
screenshot_selector string

Belirli bir CSS seçicisinin ekran görüntüsünü alın.

Ekran Görüntüsü Tam Sayfa
screenshot_full_page boolean

Web sitesinin tamamının ekran görüntüsünü alın.

Dönüş Sayfası Kaynağı
return_page_source boolean

Sayfa kaynağını da döndür.

Oturum kimliği
session_id integer

Aynı session_id kullanan tüm API istekleri 5 dakika boyunca aynı IP adresi üzerinden yönlendirilir.

Zaman Aşımı
timeout integer

1000 ile 140000 (varsayılan) arasında en fazla ms zaman aşımı sayısı.

Cookies
cookies string

Web sitesine geçirmek için özel çerez.

Device
device string

Sunucuya gönderilen cihaz türü.

Özel Google
custom_google boolean

Google'da veya bir Google alt etki alanı üzerinde web sayfası kazınıyorsa true olarak ayarlayın.

Döndürülenler

Name Yol Tür Description
Body
body string

Ceset.

Cookies
cookies array of object
İsim
cookies.name string

Adı.

Değer
cookies.value string

Değer.

Alan adı
cookies.domain string

Etki alanı.

Yol
cookies.path string

Yol.

Sona eri -yor
cookies.expires float

Süresi dolduğunda.

Boyut
cookies.size integer

Boyutu.

Yalnızca HTTP
cookies.httpOnly boolean

Yalnızca HTTP olup olmadığı.

Secure
cookies.secure boolean

Güvenli olup olmadığı.

Session
cookies.session boolean

Oturum olup olmadığı.

Aynı Taraf
cookies.sameParty boolean

Aynı parti mi?

Kaynak Düzeni
cookies.sourceScheme string

Kaynak düzeni.

Kaynak Portu
cookies.sourcePort integer

Kaynak bağlantı noktası.

Değerlendirilen Sonuçlar
evaluate_results array of string

Değerlendirilen sonuçlar.

Yaş
headers.age string

Yaşı.

Önbellek Denetimi
headers.cache-control string

Önbellek denetimi.

İçerik Kodlama
headers.content-encoding string

İçerik kodlama.

İçerik Güvenlik İlkesi
headers.content-security-policy string

İçerik güvenlik ilkesi.

İçerik Türü
headers.content-type string

İçerik türü.

Date
headers.date string

Tarih.

ETag (İngilizce)
headers.etag string

eTag.

Başvuran İlkesi
headers.referrer-policy string

Başvuran ilkesi.

Server
headers.server string

Sunucu.

Katı Aktarım Güvenliği
headers.strict-transport-security string

Sıkı taşıma güvenliği.

X İçerik Türü Seçenekleri
headers.x-content-type-options string

x içerik türü seçenekleri.

X Çerçeve Seçenekleri
headers.x-frame-options string

x çerçeve seçenekleri.

X Eşleşen Yol
headers.x-matched-path string

x ile eşleşen yol.

Tarafından Desteklenen X
headers.x-powered-by string

Tarafından güçlendirilmiş x.

X Vercel Önbelleği
headers.x-vercel-cache string

x Vercel önbelleği.

X Vercel Kimliği
headers.x-vercel-id string

x Vercel tanımlayıcısı.

Türü
type string

Türü.

IFrame'ler
iframes array of string

iFrame'ler.

XHR
xhr array of object
URL
xhr.url string

URL adresi.

Durum Kodu
xhr.status_code integer

Durum kodu.

Yöntem
xhr.method string

yöntemi.

Yaş
xhr.headers.age string

Yaşı.

Önbellek Denetimi
xhr.headers.cache-control string

Önbellek denetimi.

İçerik Uzunluğu
xhr.headers.content-length string

İçerik uzunluğu.

İçerik Güvenlik İlkesi
xhr.headers.content-security-policy string

İçerik güvenlik ilkesi.

İçerik Türü
xhr.headers.content-type string

İçerik türü.

Date
xhr.headers.date string

Tarih.

ETag (İngilizce)
xhr.headers.etag string

eTag.

Başvuran İlkesi
xhr.headers.referrer-policy string

Başvuran ilkesi.

Server
xhr.headers.server string

Sunucu.

Katı Aktarım Güvenliği
xhr.headers.strict-transport-security string

Sıkı taşıma güvenliği.

X İçerik Türü Seçenekleri
xhr.headers.x-content-type-options string

X içerik türü seçenekleri.

X Çerçeve Seçenekleri
xhr.headers.x-frame-options string

X çerçeve seçenekleri.

X Eşleşen Yol
xhr.headers.x-matched-path string

X eşleşen yolu.

X Vercel Önbelleği
xhr.headers.x-vercel-cache string

X Vercel önbelleği.

X Vercel Kimliği
xhr.headers.x-vercel-id string

X Vercel tanımlayıcısı.

Erişim Denetimi Kaynak İzin Ver
xhr.headers.access-control-allow-origin string

Erişim denetimi kaynak olarak izin verir.

Erişim Denetimi Üst Bilgilerini Kullanıma Sunma
xhr.headers.access-control-expose-headers string

Erişim denetimi üst bilgileri kullanıma sunar.

Alt SVC
xhr.headers.alt-svc string

Alternatif SVC.

Vary
xhr.headers.vary string

Değişiklik gösterir.

Via
xhr.headers.via string

Üzerinden.

X Envoy Yukarı Akış Hizmet Süresi
xhr.headers.x-envoy-upstream-service-time string

X elçisi yukarı akış hizmet süresi.

X Amazon İstek Kimliği
xhr.headers.x-amzn-requestid string

X Amazon istek tanımlayıcısı.

X Amazon Trace ID
xhr.headers.x-amzn-trace-id string

X Amazon izleme tanımlayıcısı.

Body
xhr.body string

Ceset.

Maliyet
cost integer

Maliyeti.

İlk Durum Kodu
initial-status-code integer

İlk durum kodu.

Çözümlenen URL
resolved-url string

Çözümlenen URL adresi.

Mikro veriler
metadata.microdata array of string

Mikro veriler.

JSON LD
metadata.json-ld array of object
Context
metadata.json-ld.@context string

Bağlam.

Türü
metadata.json-ld.@type string

Türü.

İsim
metadata.json-ld.name string

Adı.

URL
metadata.json-ld.url string

URL adresi.

Description
metadata.json-ld.description string

Açıklama.

Türü
metadata.json-ld.mainEntityOfPage.@type string

Türü.

URL
metadata.json-ld.mainEntityOfPage.url string

URL adresi.

Türü
metadata.json-ld.image.@type string

Türü.

URL
metadata.json-ld.image.url string

URL adresi.

Türü
metadata.json-ld.publisher.@type string

Türü.

İsim
metadata.json-ld.publisher.name string

Adı.

URL
metadata.json-ld.publisher.url string

URL adresi.

Aynı
metadata.json-ld.sameAs string

Aynı şey.

Grafı Aç
metadata.opengraph array of object
Grafik Başlığını Aç
metadata.opengraph.og:title string

Grafiği Aç başlığı.

Grafik Açıklamasını Aç
metadata.opengraph.og:description string

Grafik Aç açıklaması.

Graph Site Adını Aç
metadata.opengraph.og:site_name string

Open Graph site adı.

Grafik URL'sini açma
metadata.opengraph.og:url string

Grafı Aç URL adresi.

Grafik Resmini Aç
metadata.opengraph.og:image string

Grafı Aç resmi.

Türü
metadata.opengraph.@type string

Türü.

OG
metadata.opengraph.@context.og string

Açık Grafik.

Dublincore
metadata.dublincore array of object
Elements
metadata.dublincore.elements array of object
İsim
metadata.dublincore.elements.name string

Adı.

Content
metadata.dublincore.elements.content string

İçerik.

URI
metadata.dublincore.elements.URI string

The URI.

Terms
metadata.dublincore.terms array of string

Terimler.

Kullanımı alma

Kredi tüketimi ve eşzamanlılık kullanımı hakkında bilgi alın.

Döndürülenler

Name Yol Tür Description
Maksimum API Kredisi
max_api_credit integer

Maksimum API kredisi.

Kullanılan API Kredisi
used_api_credit integer

Kullanılan API kredisi.

En Fazla Eşzamanlılık
max_concurrency integer

En yüksek eşzamanlılık.

Geçerli Eşzamanlılık
current_concurrency integer

Geçerli eşzamanlılık.

Yenileme Abonelik Tarihi
renewal_subscription_date string

Yenileme aboneliği tarihi.