Koalas
Önemli
Bu belge kullanımdan kaldırılmıştır ve güncelleştirilmeyebilir. Bu içerikte belirtilen ürünler, hizmetler veya teknolojiler artık desteklenmemektedir. Bkz. Spark üzerinde Pandas API'si.
Not
Koalas kullanımdan kaldırıldı. Databricks Runtime 10.0 (EoS) ve üzerini çalıştıran kümelerde Koalas kullanmayı denerseniz, bunun yerine Spark'ta Pandas API'sini kullanmanızı öneren bir bilgilendirme iletisi görüntülenir.
Koalas, pandas yerine bir açılan menü sağlar. Veri bilimcileri tarafından yaygın olarak kullanılan pandas, Python programlama dili için kullanımı kolay veri yapıları ve veri çözümleme araçları sağlayan bir Python paketidir. Ancak pandas büyük veri ölçeğini genişletmez. Koalas, Apache Spark üzerinde çalışan pandas eşdeğer API'leri sağlayarak bu boşluğu doldurur. Koalas yalnızca pandas kullanıcıları için değil PySpark kullanıcıları için de yararlıdır çünkü Koalas, pyspark ile yapılması zor olan birçok görevi destekler; örneğin doğrudan pyspark DataFrame'den veri çizme.
Gereksinimler
- Koalas, Databricks Runtime 7.3 ile 9.1 arasında çalışan kümelere dahil edilir. Databricks Runtime 10.0 ve üzerini çalıştıran kümeler için bunun yerine Spark üzerinde Pandas API'sini kullanın.
- Koalas'ı Databricks Runtime 7.0 veya üzerini çalıştıran bir kümede kullanmak için Koalas'ı Azure Databricks PyPI kitaplığı olarak yükleyin.
- Azure Databricks kümesine bağlanan IDE, not defteri sunucusu veya diğer özel uygulamalarda Koalas'ı kullanmak için Databricks Connect'i yükleyin ve Koalas yükleme yönergelerini izleyin.
Not Defteri
Aşağıdaki not defteri pandas'tan Koalas'a nasıl geçiş yapılacağını gösterir.