Aracılığıyla paylaş


PySpark referansı

Bu sayfada, Spark için Python API'si olan PySpark için kullanılabilir başvuruya genel bir bakış sağlanmaktadır. PySpark hakkında daha fazla bilgi için bkz. Azure Databricks üzerinde PySpark.

Reference Description
Çekirdek Sınıflar SparkSession ve DataFrame temelleri de dahil olmak üzere PySpark SQL ile çalışmaya yönelik ana sınıflar.
Spark Oturumu PySpark uygulamalarında verileri okumak ve SQL sorguları yürütmek için giriş noktası.
Configuration Yürütme ve iyileştirici ayarları da dahil olmak üzere Spark SQL için çalışma zamanı yapılandırma seçenekleri.
Yalnızca Databricks'te kullanılabilen yapılandırma hakkında bilgi için bkz. Azure Databricks'te Spark yapılandırma özelliklerini ayarlama.
DataFrame İlişkisel veritabanındaki bir tabloya benzer şekilde adlandırılmış sütunlar halinde düzenlenmiş dağıtılmış veri koleksiyonu.
Giriş/Çıkış Çeşitli dosya biçimlerinden ve veri kaynaklarından veri okuma ve bu biçimlere veri yazma yöntemleri.
Sütun Dönüştürmeler ve ifadeler de dahil olmak üzere DataFrame sütunlarıyla çalışmaya yönelik işlemler.
Veri Türleri PySpark SQL'de temel türler, karmaşık türler ve kullanıcı tanımlı türler de dahil olmak üzere kullanılabilir veri türleri.
Sıra Tek tek alan değerlerine erişim sağlayarak DataFrame'deki bir veri satırını temsil eder.
Functions Veri işleme, dönüştürme ve toplama işlemleri için yerleşik işlevler.
Pencere Geçerli satırla ilgili bir tablo satırları kümesinde hesaplamalar yapmak için pencere işlevleri.
Gruplandırma Verileri gruplandırma ve gruplandırılmış DataFrame'lerde toplama işlemleri gerçekleştirme yöntemleri.
Katalog Veritabanlarını, tabloları, işlevleri ve diğer katalog meta verilerini yönetme arabirimi.
Avro Apache Avro biçiminde veri okuma ve yazma desteği.
Gözlem İzleme ve hata ayıklama için ölçümleri toplar ve sorgu yürütme sırasında DataFrame'leri gözlemler.
UDF DataFrame sütunlarına özel Python mantığı uygulamak için kullanıcı tanımlı işlevler.
UDTF Her giriş satırı için birden çok satır döndüren kullanıcı tanımlı tablo işlevleri.
VariantVal Yarı yapılandırılmış verileri esnek şemayla işler ve dinamik türleri ve iç içe yapıları destekler.
ProtoBuf Protokol Buffers formatını kullanarak verilerin serileştirilmesi ve seriden çıkarılması desteği.
Python DataSource Dış sistemlerden okunacak özel veri kaynaklarını uygulamaya yönelik API'ler. Özel veri kaynakları hakkında bilgi için bkz. PySpark özel veri kaynakları.
Durum Bilgisi Olan İşlemci Yapılandırılmış akışta, karmaşık durum bilgisine sahip işlemler için akış içindeki toplu işlemlerin durumunu yönetir.