xml (DataFrameReader)

Läser in en XML-fil och returnerar resultatet som en DataFrame. Om schema inte anges läser den här funktionen indata en gång för att fastställa indataschemat.

Syntax

xml(path, schema=None, **options)

Parameters

Parameter Type Beskrivning
path str, list eller RDD En eller flera indatasökvägar eller en RDD med strängar som lagrar XML-rader.
schema StructType eller str, valfritt Ett valfritt indataschema som ett StructType objekt eller en DDL-formaterad sträng (till exempel 'col0 INT, col1 DOUBLE').

Retur

DataFrame

Exempel

Skriv en DataFrame till en XML-fil och läs tillbaka den.

import tempfile
with tempfile.TemporaryDirectory(prefix="xml") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.mode("overwrite").option("rowTag", "person").format("xml").save(d)

    spark.read.option("rowTag", "person").xml(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+