Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
GEÇERLİ OLDUĞU YERLER:
Azure Data Factory
Azure Synapse Analytics
İpucu
Kuruluşlar için hepsi bir arada analiz çözümü olan Microsoft Fabric'te Data Factory'yi deneyin. Microsoft Fabric , veri taşımadan veri bilimine, gerçek zamanlı analize, iş zekasına ve raporlamaya kadar her şeyi kapsar. Yeni bir deneme sürümünü ücretsiz olarak başlatmayı öğrenin!
Bu makalede, Presto'dan veri kopyalamak için Azure Data Factory veya Synapse Analytics işlem hattında Kopyalama Etkinliği'nin nasıl kullanılacağı özetlenmiştir. Kopyalama etkinliğine genel bir bakış sunan kopyalama etkinliği genel bakış makalesine dayanır.
Önemli
Presto bağlayıcısı sürüm 1.0 kaldırma aşamasındadır. Presto bağlayıcısını sürüm 1.0'dan 2.0'a yükseltmeniz önerilir.
Desteklenen özellikler
Bu Presto bağlayıcısı aşağıdaki özellikler için desteklenir:
| Desteklenen özellikler | Kızılötesi |
|---|---|
| Kopyalama etkinliği (kaynak/-) | (1) (2) |
| Arama etkinliği | (1) (2) |
(1) Azure tümleştirme çalışma zamanı (2) Kendi kendine barındırılan tümleştirme çalışma zamanı
Kopyalama etkinliği tarafından kaynak/havuz olarak desteklenen veri depolarının listesi için Desteklenen veri depoları tablosuna bakın.
Hizmet, bağlantıyı etkinleştirmek için yerleşik bir sürücü sağlar, bu nedenle bu bağlayıcıyı kullanarak herhangi bir sürücüyü el ile yüklemeniz gerekmez.
Başlatılma
Kopyalama etkinliğini bir işlem hattıyla gerçekleştirmek için aşağıdaki araçlardan veya SDK'lardan birini kullanabilirsiniz:
- Veri Kopyalama aracı
- Azure portalı
- .NET SDK
- Python SDK'sı
- Azure PowerShell
- REST API
- Azure Resource Manager şablonu
Kullanıcı arabirimini kullanarak Presto'ya bağlı hizmet oluşturma
Azure portalı kullanıcı arabiriminde Presto'ya bağlı bir hizmet oluşturmak için aşağıdaki adımları kullanın.
Azure Data Factory veya Synapse çalışma alanınızda Yönet sekmesine göz atın ve Bağlı Hizmetler'i seçin, ardından Yeni'ye tıklayın:
Presto için arama yapın ve Presto bağlayıcısını seçin.
Hizmet ayrıntılarını yapılandırın, bağlantıyı test edin ve yeni bağlı hizmeti oluşturun.
Bağlayıcı yapılandırma ayrıntıları
Aşağıdaki bölümlerde, Presto bağlayıcısına özgü Data Factory varlıklarını tanımlamak için kullanılan özelliklerle ilgili ayrıntılar sağlanır.
Bağlı hizmet özellikleri
Presto bağlayıcısı artık 2.0 sürümünü destekliyor. Presto bağlayıcısı sürümünüzü sürüm 1.0'dan yükseltmek için bu bölüme bakın. Özellik ayrıntıları için ilgili bölümlere bakın.
Sürüm 2.0
Presto bağlı hizmeti, 2.0 sürümünü uygularken aşağıdaki özellikleri destekler:
| Mülk | Açıklama | Gerekli |
|---|---|---|
| Tip | Tür özelliği şu şekilde ayarlanmalıdır: Presto | Evet |
| Sürüm | Belirttiğiniz sürüm. Bu durumda değer 2.0 olur. |
Evet |
| sunucu | Presto sunucusunun IP adresi veya ana bilgisayar adı. (ör. 192.168.222.160) | Evet |
| katalog | Sunucuya yönelik tüm istekler için katalog bağlamı. | Evet |
| liman / bağlantı noktası | Presto sunucusunun istemci bağlantılarını dinlemek için kullandığı TCP bağlantı noktası. Varsayılan değer 8443'dür. | Hayır |
| kimlik doğrulama türü | Presto sunucusuna bağlanmak için kullanılan kimlik doğrulama mekanizması. İzin verilen değerler şunlardır: Anonim, LDAP |
Evet |
| kullanıcı adı | Presto sunucusuna bağlanmak için kullanılan kullanıcı adı. | Hayır |
| şifre | Kullanıcı adına karşılık gelen parola. Güvenli bir şekilde depolamak için bu alanı SecureString olarak işaretleyin veya Azure Key Vault'ta depolanan bir gizli diziye başvurun. | Hayır |
| SSL'yi etkinleştir | Sunucu bağlantılarının TLS kullanılarak şifrelenip şifrelenmediğini belirtir. Varsayılan değer true değeridir. | Hayır |
| Sunucu Sertifikası Doğrulamasını Etkinleştir | Bağlandığınızda sunucu SSL sertifika doğrulamasının etkinleştirilip etkinleştirilmeyeceğini belirtin. Her zaman Sistem Güven Deposu kullanın. Varsayılan değer true değeridir. |
Hayır |
| Saat Dilimi Kimliği | Bağlantı tarafından kullanılan yerel saat dilimi. Bu seçenek için geçerli değerler IANA Saat Dilimi Veritabanında belirtilir. Varsayılan değer Presto sistem saat dilimidir. | Hayır |
Örnek:
{
"name": "PrestoLinkedService",
"properties": {
"type": "Presto",
"version" : "2.0",
"typeProperties": {
"host" : "<host>",
"catalog" : "<catalog>",
"port" : 8443,
"authenticationType" : "LDAP",
"username" : "<username>",
"password": {
"type": "SecureString",
"value": "<password>"
},
"enableSsl": true,
"enableServerCertificateValidation": true,
"timeZoneID" : ""
}
}
}
Sürüm 1.0
Presto bağlı hizmeti, 1.0 sürümünü uygularken aşağıdaki özellikleri destekler:
| Mülk | Açıklama | Gerekli |
|---|---|---|
| Tip | Tür özelliği şu şekilde ayarlanmalıdır: Presto | Evet |
| sunucu | Presto sunucusunun IP adresi veya ana bilgisayar adı. (ör. 192.168.222.160) | Evet |
| sunucuSürümü | Presto sunucusunun sürümü. (örneğin 0,148-t) | Evet |
| katalog | Sunucuya yönelik tüm istekler için katalog bağlamı. | Evet |
| liman / bağlantı noktası | Presto sunucusunun istemci bağlantılarını dinlemek için kullandığı TCP bağlantı noktası. Varsayılan değer 8080'dir. | Hayır |
| kimlik doğrulama türü | Presto sunucusuna bağlanmak için kullanılan kimlik doğrulama mekanizması. İzin verilen değerler şunlardır: Anonim, LDAP |
Evet |
| kullanıcı adı | Presto sunucusuna bağlanmak için kullanılan kullanıcı adı. | Hayır |
| şifre | Kullanıcı adına karşılık gelen parola. Güvenli bir şekilde depolamak için bu alanı SecureString olarak işaretleyin veya Azure Key Vault'ta depolanan bir gizli diziye başvurun. | Hayır |
| SSL'yi etkinleştir | Sunucu bağlantılarının TLS kullanılarak şifrelenip şifrelenmediğini belirtir. Varsayılan değer false'tur. | Hayır |
| trustedCertPath | TLS üzerinden bağlanırken sunucuyu doğrulamak için güvenilen CA sertifikalarını içeren .pem dosyasının tam yolu. Bu özellik yalnızca şirket içinde barındırılan IR üzerinde TLS kullanılırken ayarlanabilir. Varsayılan değer, IR ile yüklenen cacerts.pem dosyasıdır. | Hayır |
| Sistem Güven Deposu Kullan | Sistem güven deposundan veya belirtilen PEM dosyasından CA sertifikası kullanılıp kullanılmayacağını belirtir. Varsayılan değer false'tur. | Hayır |
| allowHostNameCNHataliEslesmesineIzinVer | TLS üzerinden bağlanırken sunucunun ana bilgisayar adıyla eşleşmesi için CA tarafından verilen tls/SSL sertifika adının gerekip gerekmediğini belirtir. Varsayılan değer false'tur. | Hayır |
| kendiİmzalıSunucuSertifikasınaİzinVer | Sunucudan otomatik olarak imzalanan sertifikalara izin verilip verilmeyeceğini belirtir. Varsayılan değer false'tur. | Hayır |
| Saat Dilimi Kimliği | Bağlantı tarafından kullanılan yerel saat dilimi. Bu seçenek için geçerli değerler IANA Saat Dilimi Veritabanında belirtilir. Varsayılan değer Azure Data Factory saat dilimidir. | Hayır |
Örnek:
{
"name": "PrestoLinkedService",
"properties": {
"type": "Presto",
"typeProperties": {
"host" : "<host>",
"serverVersion" : "0.148-t",
"catalog" : "<catalog>",
"port" : "<port>",
"authenticationType" : "LDAP",
"username" : "<username>",
"password": {
"type": "SecureString",
"value": "<password>"
},
"timeZoneID" : "Europe/Berlin"
}
}
}
Veri kümesi özellikleri
Veri kümelerini tanımlamak için kullanılabilen bölümlerin ve özelliklerin tam listesi için veri kümeleri makalesine bakın. Bu bölümde Presto veri kümesi tarafından desteklenen özelliklerin listesi sağlanır.
Presto'dan veri kopyalamak için veri kümesinin tür özelliğini PrestoObject olarak ayarlayın. Aşağıdaki özellikler desteklenir:
| Mülk | Açıklama | Gerekli |
|---|---|---|
| Tip | Veri kümesinin tür özelliği şu şekilde ayarlanmalıdır: PrestoObject | Evet |
| şema | Şemanın adı. | Hayır (etkinlik kaynağında "sorgu" belirtilirse) |
| tablo | Tablonun adı. | Hayır (etkinlik kaynağında "sorgu" belirtilirse) |
| tabloAdi | Şema içeren tablonun adı. Bu özellik geriye dönük uyumluluk için desteklenir. Yeni iş yükü için schema ve table kullanın. |
Hayır (etkinlik kaynağında "sorgu" belirtilirse) |
Örnek
{
"name": "PrestoDataset",
"properties": {
"type": "PrestoObject",
"typeProperties": {},
"schema": [],
"linkedServiceName": {
"referenceName": "<Presto linked service name>",
"type": "LinkedServiceReference"
}
}
}
Kopyalama etkinliğinin özellikleri
Etkinlikleri tanımlamak için kullanılabilecek bölümlerin ve özelliklerin tam listesi için Pipelines makalesine bakın. Bu bölümde, Presto kaynağı tarafından desteklenen özelliklerin listesi sağlanır.
Presto'yu kaynak olarak kullanma
Verileri Presto'dan kopyalamak için kopyalama etkinliğindeki kaynak türünü PrestoSource olarak ayarlayın. Kopyalama etkinliği kaynağı bölümünde aşağıdaki özellikler desteklenir:
| Mülk | Açıklama | Gerekli |
|---|---|---|
| Tip | Kopyalama etkinliği kaynağının type özelliği şu şekilde ayarlanmalıdır: PrestoSource | Evet |
| sorgu | Verileri okumak için özel SQL sorgusunu kullanın. Örneğin: "SELECT * FROM MyTable". |
Hayır (veri kümesinde "tableName" belirtilirse) |
Örnek:
"activities":[
{
"name": "CopyFromPresto",
"type": "Copy",
"inputs": [
{
"referenceName": "<Presto input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<output dataset name>",
"type": "DatasetReference"
}
],
"typeProperties": {
"source": {
"type": "PrestoSource",
"query": "SELECT * FROM MyTable"
},
"sink": {
"type": "<sink type>"
}
}
}
]
Presto için veri türü eşlemesi
Presto'dan veri kopyaladığınızda, aşağıdaki eşlemeler Presto'nun veri türlerinden hizmet tarafından kullanılan iç veri türlerine uygulanır. Kopyalama etkinliğinin kaynak şemayı ve veri türünü havuza nasıl eşlediğini öğrenmek için bkz . Şema ve veri türü eşlemeleri.
| Presto veri türü | Ara hizmet veri türü (sürüm 2.0 için) | Ara hizmet veri türü (sürüm 1.0 için) |
|---|---|---|
| DİZİ | Dize | Dize |
| BIGINT | Int64 | Int64 |
| boolean | Boole mantığı | Boole mantığı |
| CHAR | Dize | Dize |
| TARİH | Tarih | Tarih ve saat |
| ONDALIK (Hassasiyet < 28) | Ondalık | Ondalık |
| ONDALıK (Hassasiyet >= 28) | Ondalık | Dize |
| ÇİFT | İki kat | İki kat |
| TAM SAYI | Int32 | Int32 |
| GÜN_DAN_SANIYE_ARALIK | Zaman Aralığı | Desteklenmiyor. |
| YILDAN_AYA_ARALIK | Dize | Desteklenmiyor. |
| IPADDRESS | Dize | Desteklenmiyor. |
| JSON veri formatı | Dize | Dize |
| HARİTA | Dize | Dize |
| GERÇEK | Tek | Tek |
| Sıra | Dize | Dize |
| SMALLINT (Küçük Tamsayı) | Int16 | Int16 |
| ZAMAN | Zaman | Zaman Aralığı |
| ZAMAN_ZAMAN_DİLİMİ_İLE | Dize | Dize |
| ZAMAN DAMGASI | Tarih ve saat | Tarih ve saat |
| Zaman Damgası ve Saat Dilimi | Datetimeoffset | Desteklenmiyor. |
| TINYINT | SByte | Int16 |
| UUID | Kılavuz | Desteklenmiyor. |
| VARBINARY | Bayt[] | Bayt[] |
| VARCHAR | Dize | Dize |
Arama etkinliği özellikleri
Özellikler hakkında ayrıntılı bilgi edinmek için Arama etkinliği'ne bakın.
Presto bağlayıcısını yükseltme
Presto bağlayıcısını yükseltmenize yardımcı olan adımlar şunlardır:
Bağlı hizmeti düzenle sayfasında sürüm 2.0'ı seçin ve bağlı hizmet sürüm 2.0 özelliklerine başvurarak bağlı hizmeti yapılandırın.
Presto bağlı hizmet sürümü 2.0 için veri türü eşlemesi, sürüm 1.0'dan farklıdır. En son veri türü eşlemesini öğrenmek için bkz. Presto için veri türü eşlemesi.
Presto bağlayıcısı sürüm 2.0 ile sürüm 1.0 arasındaki farklar
Presto bağlayıcısı sürüm 2.0 yeni işlevler sunar ve sürüm 1.0'ın çoğu özelliğiyle uyumludur. Aşağıdaki tabloda, sürüm 2.0 ile sürüm 1.0 arasındaki özellik farklılıkları gösterilmektedir.
| Sürüm 2.0 | Sürüm 1.0 |
|---|---|
serverVersion desteklenmez. |
serverVersion desteklenir. |
varsayılan değeri port 8443'tür. |
varsayılan değeri port 8080'dir. |
Varsayılan değer enableSSL için doğrudur.enableServerCertificateValidation desteklenir. trustedCertPath, useSystemTrustStore, allowHostNameCNMismatch ve allowSelfSignedServerCert desteklenmiyor. |
enableSSL varsayılan değeri yanlıştır.enableServerCertificateValidation desteklenmez. trustedCertPath, useSystemTrustStoreallowHostNameCNMismatch ve allowSelfSignedServerCert desteklenir. |
varsayılan değeri timeZoneID Presto sistem saat dilimidir. |
varsayılan değeri timeZoneID Azure Data Factory saat dilimidir. |
| Presto veri türlerinden ara hizmet veri türüne aşağıdaki eşlemeler kullanılır. TARİh -> Tarih ONDALIK (Kesinlik >= 28) -> Ondalık INTERVAL_DAY_TO_SECOND -> ZamanAralığı INTERVAL_YEAR_TO_MONTH -> Dize IPADDRESS -> Karakter Dizisi TIME -> Saat TIMESTAMPWITHTIMEZONE -> Zaman Damgası ile Zaman Dilimi TINYINT -> SByte UUID -> Guid |
Presto veri türlerinden ara hizmet veri türüne aşağıdaki eşlemeler kullanılır. TARİH -> Tarih ve saat ONDALıK (Hassasiyet >= 28) -> Dize TIME -> TimeSpan TINYINT -> Int16 Sürüm 2.0 tarafından desteklenen ve sol tarafta listelenen diğer eşlemeler sürüm 1.0 tarafından desteklenmez. |
İlgili içerik
Kopyalama etkinliği tarafından kaynak ve havuz olarak desteklenen veri depolarının listesi için bkz . desteklenen veri depoları.