ScrapingBee (Bağımsız Yayımcı) (Önizleme)
ScrapingBee, web'de en güçlü web kazıma hizmetidir. Başsız tarayıcıları, proxy'leri, CAPTCHA'ları, CSS seçicileri olan herhangi bir web sitesinden karmaşık yapılandırılmış bilgileri ayıklamayı ve JavaScript senaryolarını çalıştırmayı (tıklama, kaydırma, form doldurma vb.) işler.
Bu bağlayıcı aşağıdaki ürün ve bölgelerde kullanılabilir:
| Hizmet | Class | Bölgeler |
|---|---|---|
| Copilot Studio | Premium | Aşağıdakiler dışında tüm Power Automate bölgeleri : - ABD Kamu (GCC) - US Government (GCC High) - 21Vianet tarafından işletilen Çin Bulutu - ABD Savunma Bakanlığı (DoD) |
| Logic Apps | Standart | Aşağıdakiler dışında tüm Logic Apps bölgeleri : - Azure Kamu bölgeleri - Azure Çin bölgeleri - ABD Savunma Bakanlığı (DoD) |
| Power Apps | Premium | Aşağıdakiler dışında tüm Power Apps bölgeleri : - ABD Kamu (GCC) - US Government (GCC High) - 21Vianet tarafından işletilen Çin Bulutu - ABD Savunma Bakanlığı (DoD) |
| Power Automate | Premium | Aşağıdakiler dışında tüm Power Automate bölgeleri : - ABD Kamu (GCC) - US Government (GCC High) - 21Vianet tarafından işletilen Çin Bulutu - ABD Savunma Bakanlığı (DoD) |
| İletişim | |
|---|---|
| İsim | Troy Taylor |
| URL | https://www.hitachisolutions.com |
| E-posta | ttaylor@hitachisolutions.com |
| Bağlayıcı Meta Verileri | |
|---|---|
| Publisher | Troy Taylor |
| Web sitesi | https://www.scrapingbee.com/ |
| Gizlilik ilkesi | https://www.scrapingbee.com/privacy-policy/ |
| Kategoriler | Web sitesi |
Bağlantı oluşturma
Bağlayıcı aşağıdaki kimlik doğrulama türlerini destekler:
| Varsayılan | Bağlantı oluşturmak için parametreler. | Tüm bölgeler | Paylaşılamaz |
Temerrüt
Geçerli: Tüm bölgeler
Bağlantı oluşturmak için parametreler.
Bu, paylaşılabilir bir bağlantı değildir. Power app başka bir kullanıcıyla paylaşılıyorsa, başka bir kullanıcıdan açıkça yeni bağlantı oluşturması istenir.
| İsim | Türü | Description | Gerekli |
|---|---|---|---|
| API Anahtarı | securestring | Bu API için API Anahtarı | Doğru |
Azaltma Sınırları
| Name | Çağrılar | Yenileme Dönemi |
|---|---|---|
| Bağlantı başına API çağrıları | 100 | 60 saniye |
Eylemler
| Google araması yapma |
Google Search sonuçları sayfalarının bir kazınma değerini alır |
| Iskarta URL'si |
Kazımak için istenen URL'yi getirir ve istenirse JavaScript'i işler. |
| Kullanımı alma |
Kredi tüketimi ve eşzamanlılık kullanımı hakkında bilgi alın. |
Google araması yapma
Google Search sonuçları sayfalarının bir kazınma değerini alır
Parametreler
| Name | Anahtar | Gerekli | Tür | Description |
|---|---|---|---|---|
|
Search
|
search | True | string |
Google arama çubuğuna yerleştirdiğiniz metin. |
|
Ülke Kodu
|
country_code | string |
İsteğin gelmesini istediğiniz ülke. |
|
|
Results
|
nb_results | integer |
Döndürülecek sonuç sayısı. |
|
|
Sayfa
|
page | integer |
Sonuçların ayıklanması için sayfa numarası. |
|
|
Language
|
language | string |
Sonuçların döndürüleceği dil. |
|
|
Ek Parametreler
|
extra_params | string |
Gönderecek ek URL parametreleri. |
Döndürülenler
| Name | Yol | Tür | Description |
|---|---|---|---|
|
URL
|
meta_data.url | string |
URL adresi. |
|
Results
|
meta_data.number_of_results | integer |
Sonuç sayısı. |
|
Yer
|
meta_data.location | string |
Konum. |
|
Organik Sonuçlar
|
meta_data.number_of_organic_results | integer |
Organik sonuçların sayısı. |
|
Reklam
|
meta_data.number_of_ads | integer |
Reklam sayısı. |
|
Sayfa
|
meta_data.number_of_page | integer |
Sayfa numarası. |
|
Sonuç İletisi Yok
|
meta_data.no_results_message | string |
Sonuç yok iletisi. |
|
Organik Sonuçlar
|
organic_results | array of object | |
|
URL
|
organic_results.url | string |
URL adresi. |
|
Görüntülenen URL
|
organic_results.displayed_url | string |
Görüntülenen URL adresleri. |
|
Description
|
organic_results.description | string |
Açıklama. |
|
Ek Bilgi
|
organic_results.extra_info | string |
Ek bilgiler. |
|
Position
|
organic_results.position | integer |
Konum. |
|
Başlık
|
organic_results.title | string |
Başlık. |
|
Yerel Sonuçlar
|
local_results | array of string |
Yerel sonuçlar. |
|
Popüler Reklamlar
|
top_ads | string |
En popüler reklamlar. |
|
Alt Reklamlar
|
bottom_ads | string |
En alttaki reklamlar. |
|
İlgili Sorgular
|
related_queries | array of object | |
|
Metin
|
related_queries.text | string |
Metin. |
|
Position
|
related_queries.position | integer |
Konum. |
|
Sorular
|
questions | array of string |
Sorular. |
Iskarta URL'si
Kazımak için istenen URL'yi getirir ve istenirse JavaScript'i işler.
Parametreler
| Name | Anahtar | Gerekli | Tür | Description |
|---|---|---|---|---|
|
URL
|
url | True | string |
Kazımak istediğiniz URL. |
|
JS İşleme
|
render_js | True | boolean |
Web sitesini başsız bir tarayıcıda işleyin. |
|
JS Senaryosu
|
js_scenario | string |
İşlemeden önce JavaScript'i yürütür. |
|
|
Wait
|
wait | integer |
İşlemeden önce bekleme süresi. |
|
|
Bekle
|
wait_for | string |
DoM'da belirli bir öğenin görünmesini bekleyin. |
|
|
Reklamları Engelle
|
block_ads | boolean |
Reklamların engellenip engellenmeyeceği. |
|
|
Kaynakları Engelle
|
block_resources | boolean |
Tüm görüntülerin ve CSS'nin engellenip engellenmeyeceği. |
|
|
Pencere Genişliği
|
window_width | integer |
Kullanılacak pencerenin genişliği. |
|
|
Pencere Yüksekliği
|
window_height | integer |
Kullanılacak pencerenin yüksekliği. |
|
|
Premium Proxy
|
premium_proxy | boolean |
Web sitesini yapıştırmak için ara sunucu kullanılıp kullanılmaymayacağı. |
|
|
Ülke Kodu
|
country_code | string |
Web sitesini yapıştırmak için kullanılacak proxy ülke. |
|
|
Gizli Ara Sunucu
|
stealth_proxy | boolean |
Web sitesini kazımak için gizli proxy kullanılıp kullanılmaymayacağı. |
|
|
Kendi Proxy'si
|
own_proxy | string |
Kullanılacak kendi proxy'niz. |
|
|
Kuralları Ayıklama
|
extract_rules | string |
Html'yi yanıtlamadan önce ayrıştırmak için ayıklama kuralları. |
|
|
Screenshot
|
screenshot | boolean |
İstenen web sitesinin ekran görüntüsünü alın. |
|
|
Ekran Görüntüsü Seçici
|
screenshot_selector | string |
Belirli bir CSS seçicisinin ekran görüntüsünü alın. |
|
|
Ekran Görüntüsü Tam Sayfa
|
screenshot_full_page | boolean |
Web sitesinin tamamının ekran görüntüsünü alın. |
|
|
Dönüş Sayfası Kaynağı
|
return_page_source | boolean |
Sayfa kaynağını da döndür. |
|
|
Oturum kimliği
|
session_id | integer |
Aynı session_id kullanan tüm API istekleri 5 dakika boyunca aynı IP adresi üzerinden yönlendirilir. |
|
|
Zaman Aşımı
|
timeout | integer |
1000 ile 140000 (varsayılan) arasında en fazla ms zaman aşımı sayısı. |
|
|
Cookies
|
cookies | string |
Web sitesine geçirmek için özel çerez. |
|
|
Device
|
device | string |
Sunucuya gönderilen cihaz türü. |
|
|
Özel Google
|
custom_google | boolean |
Google'da veya bir Google alt etki alanı üzerinde web sayfası kazınıyorsa true olarak ayarlayın. |
Döndürülenler
| Name | Yol | Tür | Description |
|---|---|---|---|
|
Body
|
body | string |
Ceset. |
|
Cookies
|
cookies | array of object | |
|
İsim
|
cookies.name | string |
Adı. |
|
Değer
|
cookies.value | string |
Değer. |
|
Alan adı
|
cookies.domain | string |
Etki alanı. |
|
Yol
|
cookies.path | string |
Yol. |
|
Sona eri -yor
|
cookies.expires | float |
Süresi dolduğunda. |
|
Boyut
|
cookies.size | integer |
Boyutu. |
|
Yalnızca HTTP
|
cookies.httpOnly | boolean |
Yalnızca HTTP olup olmadığı. |
|
Secure
|
cookies.secure | boolean |
Güvenli olup olmadığı. |
|
Session
|
cookies.session | boolean |
Oturum olup olmadığı. |
|
Aynı Taraf
|
cookies.sameParty | boolean |
Aynı parti mi? |
|
Kaynak Düzeni
|
cookies.sourceScheme | string |
Kaynak düzeni. |
|
Kaynak Portu
|
cookies.sourcePort | integer |
Kaynak bağlantı noktası. |
|
Değerlendirilen Sonuçlar
|
evaluate_results | array of string |
Değerlendirilen sonuçlar. |
|
Yaş
|
headers.age | string |
Yaşı. |
|
Önbellek Denetimi
|
headers.cache-control | string |
Önbellek denetimi. |
|
İçerik Kodlama
|
headers.content-encoding | string |
İçerik kodlama. |
|
İçerik Güvenlik İlkesi
|
headers.content-security-policy | string |
İçerik güvenlik ilkesi. |
|
İçerik Türü
|
headers.content-type | string |
İçerik türü. |
|
Date
|
headers.date | string |
Tarih. |
|
ETag (İngilizce)
|
headers.etag | string |
eTag. |
|
Başvuran İlkesi
|
headers.referrer-policy | string |
Başvuran ilkesi. |
|
Server
|
headers.server | string |
Sunucu. |
|
Katı Aktarım Güvenliği
|
headers.strict-transport-security | string |
Sıkı taşıma güvenliği. |
|
X İçerik Türü Seçenekleri
|
headers.x-content-type-options | string |
x içerik türü seçenekleri. |
|
X Çerçeve Seçenekleri
|
headers.x-frame-options | string |
x çerçeve seçenekleri. |
|
X Eşleşen Yol
|
headers.x-matched-path | string |
x ile eşleşen yol. |
|
Tarafından Desteklenen X
|
headers.x-powered-by | string |
Tarafından güçlendirilmiş x. |
|
X Vercel Önbelleği
|
headers.x-vercel-cache | string |
x Vercel önbelleği. |
|
X Vercel Kimliği
|
headers.x-vercel-id | string |
x Vercel tanımlayıcısı. |
|
Türü
|
type | string |
Türü. |
|
IFrame'ler
|
iframes | array of string |
iFrame'ler. |
|
XHR
|
xhr | array of object | |
|
URL
|
xhr.url | string |
URL adresi. |
|
Durum Kodu
|
xhr.status_code | integer |
Durum kodu. |
|
Yöntem
|
xhr.method | string |
yöntemi. |
|
Yaş
|
xhr.headers.age | string |
Yaşı. |
|
Önbellek Denetimi
|
xhr.headers.cache-control | string |
Önbellek denetimi. |
|
İçerik Uzunluğu
|
xhr.headers.content-length | string |
İçerik uzunluğu. |
|
İçerik Güvenlik İlkesi
|
xhr.headers.content-security-policy | string |
İçerik güvenlik ilkesi. |
|
İçerik Türü
|
xhr.headers.content-type | string |
İçerik türü. |
|
Date
|
xhr.headers.date | string |
Tarih. |
|
ETag (İngilizce)
|
xhr.headers.etag | string |
eTag. |
|
Başvuran İlkesi
|
xhr.headers.referrer-policy | string |
Başvuran ilkesi. |
|
Server
|
xhr.headers.server | string |
Sunucu. |
|
Katı Aktarım Güvenliği
|
xhr.headers.strict-transport-security | string |
Sıkı taşıma güvenliği. |
|
X İçerik Türü Seçenekleri
|
xhr.headers.x-content-type-options | string |
X içerik türü seçenekleri. |
|
X Çerçeve Seçenekleri
|
xhr.headers.x-frame-options | string |
X çerçeve seçenekleri. |
|
X Eşleşen Yol
|
xhr.headers.x-matched-path | string |
X eşleşen yolu. |
|
X Vercel Önbelleği
|
xhr.headers.x-vercel-cache | string |
X Vercel önbelleği. |
|
X Vercel Kimliği
|
xhr.headers.x-vercel-id | string |
X Vercel tanımlayıcısı. |
|
Erişim Denetimi Kaynak İzin Ver
|
xhr.headers.access-control-allow-origin | string |
Erişim denetimi kaynak olarak izin verir. |
|
Erişim Denetimi Üst Bilgilerini Kullanıma Sunma
|
xhr.headers.access-control-expose-headers | string |
Erişim denetimi üst bilgileri kullanıma sunar. |
|
Alt SVC
|
xhr.headers.alt-svc | string |
Alternatif SVC. |
|
Vary
|
xhr.headers.vary | string |
Değişiklik gösterir. |
|
Via
|
xhr.headers.via | string |
Üzerinden. |
|
X Envoy Yukarı Akış Hizmet Süresi
|
xhr.headers.x-envoy-upstream-service-time | string |
X elçisi yukarı akış hizmet süresi. |
|
X Amazon İstek Kimliği
|
xhr.headers.x-amzn-requestid | string |
X Amazon istek tanımlayıcısı. |
|
X Amazon Trace ID
|
xhr.headers.x-amzn-trace-id | string |
X Amazon izleme tanımlayıcısı. |
|
Body
|
xhr.body | string |
Ceset. |
|
Maliyet
|
cost | integer |
Maliyeti. |
|
İlk Durum Kodu
|
initial-status-code | integer |
İlk durum kodu. |
|
Çözümlenen URL
|
resolved-url | string |
Çözümlenen URL adresi. |
|
Mikro veriler
|
metadata.microdata | array of string |
Mikro veriler. |
|
JSON LD
|
metadata.json-ld | array of object | |
|
Context
|
metadata.json-ld.@context | string |
Bağlam. |
|
Türü
|
metadata.json-ld.@type | string |
Türü. |
|
İsim
|
metadata.json-ld.name | string |
Adı. |
|
URL
|
metadata.json-ld.url | string |
URL adresi. |
|
Description
|
metadata.json-ld.description | string |
Açıklama. |
|
Türü
|
metadata.json-ld.mainEntityOfPage.@type | string |
Türü. |
|
URL
|
metadata.json-ld.mainEntityOfPage.url | string |
URL adresi. |
|
Türü
|
metadata.json-ld.image.@type | string |
Türü. |
|
URL
|
metadata.json-ld.image.url | string |
URL adresi. |
|
Türü
|
metadata.json-ld.publisher.@type | string |
Türü. |
|
İsim
|
metadata.json-ld.publisher.name | string |
Adı. |
|
URL
|
metadata.json-ld.publisher.url | string |
URL adresi. |
|
Aynı
|
metadata.json-ld.sameAs | string |
Aynı şey. |
|
Grafı Aç
|
metadata.opengraph | array of object | |
|
Grafik Başlığını Aç
|
metadata.opengraph.og:title | string |
Grafiği Aç başlığı. |
|
Grafik Açıklamasını Aç
|
metadata.opengraph.og:description | string |
Grafik Aç açıklaması. |
|
Graph Site Adını Aç
|
metadata.opengraph.og:site_name | string |
Open Graph site adı. |
|
Grafik URL'sini açma
|
metadata.opengraph.og:url | string |
Grafı Aç URL adresi. |
|
Grafik Resmini Aç
|
metadata.opengraph.og:image | string |
Grafı Aç resmi. |
|
Türü
|
metadata.opengraph.@type | string |
Türü. |
|
OG
|
metadata.opengraph.@context.og | string |
Açık Grafik. |
|
Dublincore
|
metadata.dublincore | array of object | |
|
Elements
|
metadata.dublincore.elements | array of object | |
|
İsim
|
metadata.dublincore.elements.name | string |
Adı. |
|
Content
|
metadata.dublincore.elements.content | string |
İçerik. |
|
URI
|
metadata.dublincore.elements.URI | string |
The URI. |
|
Terms
|
metadata.dublincore.terms | array of string |
Terimler. |
Kullanımı alma
Kredi tüketimi ve eşzamanlılık kullanımı hakkında bilgi alın.
Döndürülenler
| Name | Yol | Tür | Description |
|---|---|---|---|
|
Maksimum API Kredisi
|
max_api_credit | integer |
Maksimum API kredisi. |
|
Kullanılan API Kredisi
|
used_api_credit | integer |
Kullanılan API kredisi. |
|
En Fazla Eşzamanlılık
|
max_concurrency | integer |
En yüksek eşzamanlılık. |
|
Geçerli Eşzamanlılık
|
current_concurrency | integer |
Geçerli eşzamanlılık. |
|
Yenileme Abonelik Tarihi
|
renewal_subscription_date | string |
Yenileme aboneliği tarihi. |