Veri alma için Azure Veri Gezgini tarafından desteklenen veri biçimleri
Veri alımı, verilerin tabloya eklendiği ve Azure Veri Gezgini'de sorgu için kullanıma sunulduğu işlemdir. Sorgudan alma dışındaki tüm alma yöntemleri için verilerin desteklenen biçimlerden birinde olması gerekir. Aşağıdaki tabloda Azure Veri Gezgini'ın veri alımı için desteklediği biçimler listelenmiş ve açıklanmıştır.
Not
Verileri almadan önce verilerinizin düzgün biçimlendirildiğinden ve beklenen alanları tanımladığından emin olun. Biçimin geçerli olduğunu onaylamak için tercih ettiğiniz doğrulayıcıyı kullanmanızı öneririz. Örneğin, CSV veya JSON dosyalarını denetlemek için aşağıdaki doğrulayıcıları yararlı bulabilirsiniz:
- CSV: http://csvlint.io/
- JSON: https://jsonlint.com/
Veri alımının neden başarısız olabileceği hakkında daha fazla bilgi için bkz. Azure Veri Gezgini'de alma hataları ve alma hata kodları.
Biçimlendir | Uzantı | Description |
---|---|---|
ApacheAvro | .avro |
Mantıksal türleri destekleyen bir AVRO biçimi. Aşağıdaki sıkıştırma codec bileşenleri desteklenir: null , deflate , ve snappy . Biçimin apacheavro okuyucu uygulaması resmi Apache Avro kitaplığını temel alır. Olay Hub'ı Yakalama Avro dosyalarını alma hakkında bilgi için bkz. Olay Hub'ı Yakalama Avro dosyalarını alma. |
Avro | .avro |
.NET kitaplığını temel alan AVRO biçimi için eski bir uygulama. Aşağıdaki sıkıştırma codec'leri desteklenir: null , (için snappy - veri biçimini kullanın ApacheAvro deflate ). |
CSV | .csv |
Virgülle ayrılmış değerlere (, ) sahip bir metin dosyası. Comma-Separated Değerleri (CSV) Dosyaları için bkz. RFC 4180: Ortak Biçim ve MIME Türü. |
JSON | .json |
veya \r\n ile sınırlandırılmış JSON nesnelerinin yer aldığı \n bir metin dosyası. Bkz . JSON Satırları (JSONL). |
MultiJSON | .multijson |
JSON özellik torbaları dizisine (her biri bir kaydı temsil eden) veya boşlukla \n sınırlandırılmış herhangi bir sayıda özellik çantasına sahip bir metin dosyası veya \r\n . Her özellik çantası birden çok satıra yayılabilir. |
ORC | .orc |
ORC dosyası. |
Parquet | .parquet |
Parquet dosyası. |
PSV | .psv |
Kanalla ayrılmış değerlere (| ) sahip bir metin dosyası. |
HAM | .raw |
İçeriğinin tamamı tek bir dize değeri olan bir metin dosyası. |
SCsv | .scsv |
Noktalı virgülle ayrılmış değerler (; ) içeren bir metin dosyası. |
SOHsv | .sohsv |
SOH ile ayrılmış değerler içeren bir metin dosyası. (SOH, ASCII kod noktası 1'dir; bu biçim HDInsight üzerinde Hive tarafından kullanılır.) |
TSV | .tsv |
Sekmeyle ayrılmış değerler (\t ) içeren bir metin dosyası. |
TSVE | .tsv |
Sekmeyle ayrılmış değerler (\t ) içeren bir metin dosyası. Kaçış için ters eğik çizgi karakteri (\ ) kullanılır. |
TXT | .txt |
ile \n sınırlandırılmış satırlar içeren bir metin dosyası. Boş satırlar atlanır. |
W3CLOGFILE | .log |
W3C tarafından standartlaştırılmış web günlüğü dosyası biçimi. |
Not
Normal Parquet biçim dosyalarının (apache Iceberg, Apache Hudi, Delta Lake gibi) üzerinde ACID işlevselliği sağlayan veri depolama sistemlerinden veri alımı desteklenmez.
Şemasız Avro desteklenmez.
veya biçimlerini kullanarak
json
veri alma hakkında daha fazla bilgi için lütfen bu belgeye bakın.multijson
Desteklenen veri sıkıştırma biçimleri
Bloblar ve dosyalar aşağıdaki sıkıştırma algoritmalarından herhangi biri aracılığıyla sıkıştırılabilir:
Sıkıştırma | Uzantı |
---|---|
Gzip | .Gz |
Zip | .zip |
Uzantıyı blob veya dosyanın adına ekleyerek sıkıştırmayı belirtin.
Örnek:
MyData.csv.zip
ZIP ile sıkıştırılmış bir blobu veya CSV olarak biçimlendirilmiş bir dosyayı gösterir (arşiv veya tek bir dosya)MyData.json.gz
, GZip ile sıkıştırılmış JSON olarak biçimlendirilmiş bir blobu veya dosyayı gösterir.
Biçim uzantılarını içermeyen ancak yalnızca sıkıştırma (örneğin) MyData.zip
olan blob veya dosya adları da desteklenir. Bu durumda, çıkarılamadığı için dosya biçimi bir alma özelliği olarak belirtilmelidir.
Not
- Bazı sıkıştırma biçimleri, sıkıştırılmış akışın bir parçası olarak özgün dosya uzantısını izler. Bu uzantı genellikle dosya biçimini belirlemek için yoksayılır. Dosya biçimi (sıkıştırılmış) blobdan veya dosya adından belirlenemiyorsa, alma özelliği aracılığıyla
format
belirtilmelidir. - ve biçimleri tarafından
Parquet
AVRO
ORC
kullanılan iç (öbek düzeyi) sıkıştırma codec bileşeni ile karıştırılmamalıdır. İç sıkıştırma adı genellikle dosya biçimi uzantısının önüne bir dosya adına eklenir, örneğin:file1.gz.parquet
,file1.snappy.avro
, vb. - Deflate64/Enhanced Deflate Zip sıkıştırma yöntemi desteklenmiyor. Windows yerleşik Zip kompresörünün bu sıkıştırma yöntemini 2 GB'ın üzerindeki dosyalarda kullanmayı seçebileceğini lütfen unutmayın.
İlgili içerik
- Veri alımı hakkında daha fazla bilgi edinin
- Azure Veri Gezgini veri alımı özellikleri hakkında daha fazla bilgi edinin
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin