Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfada, Spark için Python API'si olan PySpark için kullanılabilir başvuruya genel bir bakış sağlanmaktadır. PySpark hakkında daha fazla bilgi için bkz. Azure Databricks üzerinde PySpark.
| Reference | Description |
|---|---|
| Çekirdek Sınıflar | SparkSession ve DataFrame temelleri de dahil olmak üzere PySpark SQL ile çalışmaya yönelik ana sınıflar. |
| Spark Oturumu | PySpark uygulamalarında verileri okumak ve SQL sorguları yürütmek için giriş noktası. |
| Configuration | Yürütme ve iyileştirici ayarları da dahil olmak üzere Spark SQL için çalışma zamanı yapılandırma seçenekleri. Yalnızca Databricks'te kullanılabilen yapılandırma hakkında bilgi için bkz. Azure Databricks'te Spark yapılandırma özelliklerini ayarlama. |
| DataFrame | İlişkisel veritabanındaki bir tabloya benzer şekilde adlandırılmış sütunlar halinde düzenlenmiş dağıtılmış veri koleksiyonu. |
| Giriş/Çıkış | Çeşitli dosya biçimlerinden ve veri kaynaklarından veri okuma ve bu biçimlere veri yazma yöntemleri. |
| Sütun | Dönüştürmeler ve ifadeler de dahil olmak üzere DataFrame sütunlarıyla çalışmaya yönelik işlemler. |
| Veri Türleri | PySpark SQL'de temel türler, karmaşık türler ve kullanıcı tanımlı türler de dahil olmak üzere kullanılabilir veri türleri. |
| Sıra | Tek tek alan değerlerine erişim sağlayarak DataFrame'deki bir veri satırını temsil eder. |
| Functions | Veri işleme, dönüştürme ve toplama işlemleri için yerleşik işlevler. |
| Pencere | Geçerli satırla ilgili bir tablo satırları kümesinde hesaplamalar yapmak için pencere işlevleri. |
| Gruplandırma | Verileri gruplandırma ve gruplandırılmış DataFrame'lerde toplama işlemleri gerçekleştirme yöntemleri. |
| Katalog | Veritabanlarını, tabloları, işlevleri ve diğer katalog meta verilerini yönetme arabirimi. |
| Avro | Apache Avro biçiminde veri okuma ve yazma desteği. |
| Gözlem | İzleme ve hata ayıklama için ölçümleri toplar ve sorgu yürütme sırasında DataFrame'leri gözlemler. |
| UDF | DataFrame sütunlarına özel Python mantığı uygulamak için kullanıcı tanımlı işlevler. |
| UDTF | Her giriş satırı için birden çok satır döndüren kullanıcı tanımlı tablo işlevleri. |
| VariantVal | Yarı yapılandırılmış verileri esnek şemayla işler ve dinamik türleri ve iç içe yapıları destekler. |
| ProtoBuf | Protokol Buffers formatını kullanarak verilerin serileştirilmesi ve seriden çıkarılması desteği. |
| Python DataSource | Dış sistemlerden okunacak özel veri kaynaklarını uygulamaya yönelik API'ler. Özel veri kaynakları hakkında bilgi için bkz. PySpark özel veri kaynakları. |
| Durum Bilgisi Olan İşlemci | Yapılandırılmış akışta, karmaşık durum bilgisine sahip işlemler için akış içindeki toplu işlemlerin durumunu yönetir. |