Bu makalede, HTTP uç noktasından veri kopyalamak için Azure Data Factory ve Azure Synapse'de Kopyalama Etkinliği'nin nasıl kullanılacağı özetlenmiştir. Makale, Kopyalama Etkinliği'ne genel bir genel bakış sunan Kopyalama Etkinliği üzerine derlenmektedir.
Bu HTTP bağlayıcısı, REST bağlayıcısı ve Web tablosu bağlayıcısı arasındaki fark şunlardır:
REST bağlayıcısı özellikle RESTful API'lerinden veri kopyalamayı destekler;
HTTP bağlayıcısı , herhangi bir HTTP uç noktasından veri almak için geneldir; örneğin dosyayı indirmek için. REST bağlayıcısı kullanılabilir duruma gelmeden önce, REST bağlayıcısı ile karşılaştırıldığında desteklenen ancak daha az işlevsel olan RESTful API'lerinden veri kopyalamak için HTTP bağlayıcısını kullanabilirsiniz.
Web tablosu bağlayıcısı, bir HTML web sayfasından tablo içeriğini ayıklar.
Desteklenen özellikler
Bu HTTP bağlayıcısı aşağıdaki özellikler için desteklenir:
HTTP GET veya POST yöntemlerini kullanarak bir HTTP/S uç noktasından veri alın.
Aşağıdaki kimlik doğrulamalarından birini kullanarak verileri alın: Anonim, Temel, Özet, Windows veya ClientCertificate.
HTTP yanıtını olduğu gibi kopyalayın veya desteklenen dosya biçimlerini ve sıkıştırma codec'lerini kullanarak ayrıştırın.
İpucu
HTTP bağlayıcısını yapılandırmadan önce veri alma için bir HTTP isteğini test etmek için üst bilgi ve gövde gereksinimleri için API belirtimi hakkında bilgi edinin. Doğrulamak için Visual Studio, PowerShell'in Invoke-RestMethod veya web tarayıcısı gibi araçları kullanabilirsiniz.
Önkoşullar
Veri deponuz bir şirket içi ağ, Azure sanal ağı veya Amazon Sanal Özel Bulut içinde bulunuyorsa, şirket içinde barındırılan tümleştirme çalışma zamanını buna bağlanmak için yapılandırmanız gerekir.
Veri deponuz yönetilen bir bulut veri hizmetiyse Azure Integration Runtime'ı kullanabilirsiniz. Erişim, güvenlik duvarı kurallarında onaylanan IP'ler ile sınırlıysa Azure Integration Runtime IP'lerini izin verme listesine ekleyebilirsiniz.
Şirket içinde barındırılan tümleştirme çalışma zamanı yüklemeden ve yapılandırmadan şirket içi ağa erişmek için Azure Data Factory'deki yönetilen sanal ağ tümleştirme çalışma zamanı özelliğini de kullanabilirsiniz.
Data Factory tarafından desteklenen ağ güvenlik mekanizmaları ve seçenekleri hakkında daha fazla bilgi için bkz . Veri erişim stratejileri.
Kullanmaya başlayın
İşlem hattıyla Kopyalama etkinliği gerçekleştirmek için aşağıdaki araçlardan veya SDK'lardan birini kullanabilirsiniz:
Hizmet ayrıntılarını yapılandırın, bağlantıyı test edin ve yeni bağlı hizmeti oluşturun.
Bağlayıcı yapılandırma ayrıntıları
Aşağıdaki bölümlerde, HTTP bağlayıcısına özgü varlıkları tanımlamak için kullanabileceğiniz özelliklerle ilgili ayrıntılar sağlanır.
Bağlı hizmet özellikleri
HTTP bağlı hizmeti için aşağıdaki özellikler desteklenir:
Özellik
Açıklama
Gerekli
Tür
tür özelliği HttpServer olarak ayarlanmalıdır.
Yes
url
Web sunucusunun temel URL'si.
Yes
enableServerCertificateValidation
BIR HTTP uç noktasına bağlanırken sunucu TLS/SSL sertifika doğrulamasını etkinleştirip etkinleştiremeyeceğinizi belirtin. HTTPS sunucunuz otomatik olarak imzalanan bir sertifika kullanıyorsa, bu özelliği false olarak ayarlayın.
Hayır (varsayılan değer true'dur)
authenticationType
Kimlik doğrulama türünü belirtir. İzin verilen değerler Anonim, Temel, Özet, Windows ve ClientCertificate'tir. Ayrıca özelliğinde authHeader kimlik doğrulama üst bilgilerini yapılandırabilirsiniz. Daha fazla özellik için bu tabloyu izleyen bölümlere ve bu kimlik doğrulama türleri için JSON örneklerine bakın.
Yes
authHeaders
Kimlik doğrulaması için ek HTTP isteği üst bilgileri. Örneğin, API anahtarı kimlik doğrulamasını kullanmak için kimlik doğrulama türünü "Anonim" olarak seçebilir ve üst bilgide API anahtarı belirtebilirsiniz.
Temel, Özet veya Windows kimlik doğrulamayı kullanma
authenticationType özelliğini Temel, Özet veya Windows olarak ayarlayın. Önceki bölümde açıklanan genel özelliklere ek olarak aşağıdaki özellikleri belirtin:
Özellik
Açıklama
Gerekli
userName
HTTP uç noktasına erişmek için kullanılacak kullanıcı adı.
Yes
password
Kullanıcının parolası ( userName değeri). Güvenli bir şekilde depolamak için bu alanı SecureString türü olarak işaretleyin. Azure Key Vault'ta depolanan bir gizli diziye de başvurabilirsiniz.
ClientCertificate kimlik doğrulamasını kullanmak için authenticationType özelliğini ClientCertificate olarak ayarlayın. Önceki bölümde açıklanan genel özelliklere ek olarak aşağıdaki özellikleri belirtin:
Özellik
Açıklama
Gerekli
embeddedCertData
Base64 ile kodlanmış sertifika verileri.
embeddedCertData veya certThumbprint belirtin.
certThumbprint
Şirket içinde barındırılan Integration Runtime makinenizin sertifika deposuna yüklenen sertifikanın parmak izi. Yalnızca connectVia özelliğinde şirket içinde barındırılan Integration Runtime türü belirtildiğinde geçerlidir.
embeddedCertData veya certThumbprint belirtin.
password
Sertifikayla ilişkili parola. Güvenli bir şekilde depolamak için bu alanı SecureString türü olarak işaretleyin. Azure Key Vault'ta depolanan bir gizli diziye de başvurabilirsiniz.
Hayır
Kimlik doğrulaması için certThumbprint kullanıyorsanız ve sertifika yerel bilgisayarın kişisel deposunda yüklüyse, şirket içinde barındırılan Integration Runtime'a okuma izinleri verin:
Microsoft Yönetim Konsolu'nu (MMC) açın. Yerel Bilgisayarı hedefleyen Sertifikalar ek bileşenini ekleyin.
Kişisel Sertifikalar'ı>genişletin ve ardından Sertifikalar'ı seçin.
Kişisel mağazadan sertifikaya sağ tıklayın ve ardından Tüm Görevler>Özel Anahtarları Yönet'i seçin.
Güvenlik sekmesinde, Integration Runtime Konak Hizmeti'nin (DIAHostService) çalıştığı kullanıcı hesabını sertifikaya okuma erişimiyle ekleyin.
HTTP bağlayıcısı yalnızca güvenilen sertifikaları yükler. Otomatik olarak imzalanan veya ca tarafından verilmemiş bir sertifika kullanıyorsanız, güveni etkinleştirmek için sertifikanın aşağıdaki depolardan birine de yüklenmesi gerekir:
Biçim tabanlı veri kümesindeki ayarlar altında location HTTP için aşağıdaki özellikler desteklenir:
Özellik
Açıklama
Gerekli
Tür
veri kümesinde altındaki type özelliği location HttpServerLocation olarak ayarlanmalıdır.
Yes
relativeUrl
Verileri içeren kaynağın göreli URL'si. HTTP bağlayıcısı, birleşik URL'den veri kopyalar: [URL specified in linked service][relative URL specified in dataset].
Hayır
Not
Desteklenen HTTP isteği yük boyutu yaklaşık 500 KB'tır. Web uç noktanıza geçirmek istediğiniz yük boyutu 500 KB'tan büyükse yükü daha küçük parçalar halinde toplu işleyebilirsiniz.
Biçim tabanlı kopyalama kaynağındaki ayarlar altında storeSettings HTTP için aşağıdaki özellikler desteklenir:
Özellik
Açıklama
Gerekli
Tür
altındaki storeSettings tür özelliği HttpReadSettings olarak ayarlanmalıdır.
Yes
requestMethod
HTTP yöntemi. İzin verilen değerler Get (varsayılan) ve Post değerleridir.
Hayır
additionalHeaders
Ek HTTP isteği üst bilgileri.
Hayır
requestBody
HTTP isteğinin gövdesi.
Hayır
httpRequestTimeout
Yanıt almak için HTTP isteğinin zaman aşımı (TimeSpan değeri). Bu değer, yanıt verilerini okumak için zaman aşımı değil, yanıt almak için zaman aşımıdır. Varsayılan değer 00:01:40'tır.
Hayır
maxConcurrentConnections
Etkinlik çalıştırması sırasında veri deposuna kurulan eş zamanlı bağlantıların üst sınırı. Yalnızca eşzamanlı bağlantıları sınırlamak istediğinizde bir değer belirtin.
Özellikler hakkında ayrıntılı bilgi edinmek için Arama etkinliği'ne bakın.
Eski modeller
Not
Aşağıdaki modeller geriye dönük uyumluluk için olduğu gibi desteklenmektedir. İleride yukarıdaki bölümlerde bahsedilen yeni modeli kullanmanız önerilir ve yazma kullanıcı arabirimi yeni modeli oluşturmaya geçti.
Eski veri kümesi modeli
Özellik
Açıklama
Gerekli
Tür
Veri kümesinin type özelliği HttpFile olarak ayarlanmalıdır.
Yes
relativeUrl
Verileri içeren kaynağın göreli URL'si. Bu özellik belirtilmediğinde, yalnızca bağlı hizmet tanımında belirtilen URL kullanılır.
Hayır
requestMethod
HTTP yöntemi. İzin verilen değerler Get (varsayılan) ve Post değerleridir.
Hayır
additionalHeaders
Ek HTTP isteği üst bilgileri.
Hayır
requestBody
HTTP isteğinin gövdesi.
Hayır
format
VERILERI ayrıştırmadan HTTP uç noktasından olduğu gibi almak ve ardından verileri dosya tabanlı bir depoya kopyalamak istiyorsanız, hem giriş hem de çıkış veri kümesi tanımlarında biçim bölümünü atlayın.
Kopyalama sırasında HTTP yanıt içeriğini ayrıştırmak istiyorsanız, şu dosya biçimi türleri desteklenir: TextFormat, JsonFormat, AvroFormat, OrcFormat ve ParquetFormat. Biçim'in altında type özelliğini bu değerlerden birine ayarlayın. Daha fazla bilgi için bkz . JSON biçimi, Metin biçimi, Avro biçimi, Ork biçimi ve Parquet biçimi.
Desteklenen türler: GZip, Deflate, BZip2 ve ZipDeflate. Desteklenen düzeyler: En uygun ve en hızlı.
Hayır
Not
Desteklenen HTTP isteği yük boyutu yaklaşık 500 KB'tır. Web uç noktanıza geçirmek istediğiniz yük boyutu 500 KB'tan büyükse yükü daha küçük parçalar halinde toplu işleyebilirsiniz.
Kopyalama etkinliği kaynağının type özelliği HttpSource olarak ayarlanmalıdır.
Yes
httpRequestTimeout
Yanıt almak için HTTP isteğinin zaman aşımı (TimeSpan değeri). Bu değer, yanıt verilerini okumak için zaman aşımı değil, yanıt almak için zaman aşımıdır. Varsayılan değer 00:01:40'tır.
Bir dizi Azure hizmetini kullanarak Microsoft Azure'da veri mühendisliği iş yüklerini uygulamaya ve yönetmeye yönelik yaygın veri mühendisliği görevlerinin anlaşılmasını gösterin.
Kopyalama Etkinliği'ni kullanarak verileri kopyalamayı ve Veri Akışı kullanarak verileri bulut veya şirket içi REST kaynağından desteklenen havuz veri depolarına veya desteklenen kaynak veri deposundan Azure Data Factory veya Azure Synapse Analytics işlem hatlarındaki bir REST havuzuna dönüştürmeyi öğrenin.
İşlem hattından REST uç noktasını çağırmak için Azure Data Factory ve Azure Synapse Analytics tarafından desteklenen denetim akışı etkinliklerinden biri olan Web Etkinliği'ni nasıl kullanabileceğinizi öğrenin.
Bir web tablosundaki verileri Azure Data Factory ve Synapse Analytics tarafından havuz olarak desteklenen veri depolarına kopyalamanıza olanak tanıyan Web Tablosu Bağlayıcısı hakkında bilgi edinin.
Azure Data Factory ve Azure Synapse Analytics'teki Kopyalama etkinliği hakkında bilgi edinin. Desteklenen bir kaynak veri deposundaki verileri desteklenen havuz veri deposuna kopyalamak için kullanabilirsiniz.
Azure Data Factory veya Azure Synapse Analytics işlem hatlarını kullanarak dosya sisteminden desteklenen havuz veri depolarına veya desteklenen kaynak veri depolarından dosya sistemine veri kopyalamayı öğrenin.