Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
DataFrame'in içeriğini ilk kez hesaplandıktan sonra işlemler arasında kalıcı hale getirmek için depolama düzeyini ayarlar. Bu yalnızca DataFrame'de henüz bir depolama düzeyi ayarlanmamışsa yeni bir depolama düzeyi atamak için kullanılabilir. Herhangi bir depolama düzeyi belirtilmezse varsayılan olarak () ayarlanırMEMORY_AND_DISK_DESER.
Sözdizimi
persist(storageLevel: StorageLevel = StorageLevel.MEMORY_AND_DISK_DESER)
Parametreler
| Parametre | Türü | Açıklama |
|---|---|---|
storageLevel |
StorageLevel | Kalıcılık için ayarlanacağı depolama düzeyi. Varsayılan değer MEMORY_AND_DISK_DESER. |
İadeler
DataFrame: Kalıcı DataFrame.
Notlar
Varsayılan depolama düzeyi, 3.0'da Scala ile eşleşecek şekilde MEMORY_AND_DISK_DESER değiştirildi.
Önbelleğe alınan veriler kümedeki tüm Spark oturumlarında paylaşılır.
Örnekler
df = spark.range(1)
df.persist()
# DataFrame[id: bigint]
df.explain()
# == Physical Plan ==
# InMemoryTableScan ...
from pyspark.storagelevel import StorageLevel
df.persist(StorageLevel.DISK_ONLY)
# DataFrame[id: bigint]