Aracılığıyla paylaş


Koalas

Önemli

Bu belge kullanımdan kaldırılmıştır ve güncelleştirilmeyebilir. Bu içerikte belirtilen ürünler, hizmetler veya teknolojiler artık desteklenmemektedir. Bkz. Spark üzerinde Pandas API'si.

Dekont

Koalas kullanımdan kaldırıldı. Databricks Runtime 10.0 (desteklenmeyen) ve üzerini çalıştıran kümelerde Koalas kullanmayı denerseniz, bunun yerine Spark'ta Pandas API'sini kullanmanızı öneren bir bilgilendirme iletisi görüntülenir.

Koalas, pandas yerine bir açılan menü sağlar. Veri bilimcileri tarafından yaygın olarak kullanılan pandas, Python programlama dili için kullanımı kolay veri yapıları ve veri çözümleme araçları sağlayan bir Python paketidir. Ancak pandas büyük veri ölçeğini genişletmez. Koalas, Apache Spark üzerinde çalışan pandas eşdeğer API'leri sağlayarak bu boşluğu doldurur. Koalas yalnızca pandas kullanıcıları için değil PySpark kullanıcıları için de yararlıdır çünkü Koalas, pyspark ile yapılması zor olan birçok görevi destekler; örneğin doğrudan pyspark DataFrame'den veri çizme.

Gereksinimler

  • Koalas, Databricks Runtime 7.3 ile 9.1 arasında çalışan kümelere dahil edilir. Databricks Runtime 10.0 ve üzerini çalıştıran kümeler için bunun yerine Spark üzerinde Pandas API'sini kullanın.
  • Koalas'ı Databricks Runtime 7.0 veya üzerini çalıştıran bir kümede kullanmak için Koalas'ı Azure Databricks PyPI kitaplığı olarak yükleyin.
  • Koalas'ı bir IDE, not defteri sunucusu veya Azure Databricks kümesine bağlanan diğer özel uygulamalarda kullanmak için Databricks Bağlan yükleyin ve Koalas yükleme yönergelerini izleyin.

Not Defteri

Aşağıdaki not defteri pandas'tan Koalas'a nasıl geçiş yapılacağını gösterir.

pandas to Koalas notebook

Not defterini alma

Kaynaklar