Sdílet prostřednictvím


Koalas

Důležité

Tato dokumentace byla vyřazena a nemusí být aktualizována. Produkty, služby nebo technologie uvedené v tomto obsahu se už nepodporují. Viz rozhraní PANDAS API ve Sparku.

Poznámka:

Koalas je zastaralý. Pokud se pokusíte použít Koalas v clusterech, na kterých běží Databricks Runtime 10.0 (nepodporované) a vyšší, zobrazí se informační zpráva s doporučením, abyste místo toho používali rozhraní Pandas API ve Sparku .

Koalas poskytuje náhradu za knihovnu pandas. Knihovnu pandas běžně používají datoví vědci, pandas je balíček Pythonu, který poskytuje snadno použitelné datové struktury a nástroje pro analýzu dat pro programovací jazyk Python. Knihovna pandas se ale škáluje na velké objemy dat. Koalas tuto mezeru vyplní tím, že poskytuje ekvivalentní rozhraní API pandas, která pracují na Apache Sparku. Koalas je užitečný nejen pro uživatele knihovny pandas, ale také pro uživatele PySpark, protože Koalas podporuje mnoho úloh, které se obtížně provádějí s PySparkem, například vykreslení dat přímo z datového rámce PySpark.

Požadavky

  • Koalas je součástí clusterů, na kterých běží Databricks Runtime 7.3 až 9.1. Pro clustery s Modulem Databricks Runtime 10.0 a novějším použijte místo toho rozhraní Pandas API ve Sparku .
  • Pokud chcete použít Koalas v clusteru s Modulem Databricks Runtime 7.0 nebo nižším, nainstalujte Koalas jako knihovnu PyPI služby Azure Databricks.
  • Pokud chcete používat Koalas v integrovaném vývojovém prostředí, serveru poznámkových bloků nebo jiných vlastních aplikacích, které se připojují ke clusteru Azure Databricks, nainstalujte Databricks Připojení a postupujte podle pokynů k instalaci Koalas.

Poznámkový blok

Následující poznámkový blok ukazuje, jak migrovat z pandas na Koalas.

Pandas do poznámkového bloku Koalas

Získat poznámkový blok

Zdroje informací