Processo di generazione di record (SQLXML 4.0)

Articolo
05/07/2013

Il caricamento bulk XML elabora i dati di input XML e prepara record per le tabelle appropriate in Microsoft SQL Server. La logica nel caricamento bulk XML determina il momento in cui generare un nuovo record, i valori di elemento o attributo figlio da copiare nei campi del record e il momento in cui il record è completo e pronto per essere inviato a SQL Server per l'inserimento.

Il caricamento bulk XML non carica tutti i dati di input XML in memoria e non produce set di record completi prima di inviare dati a SQL Server. Ciò è dovuto al fatto che i dati di input XML possono essere costituiti da un documento di grandi dimensioni, il cui caricamento in memoria può risultare dispendioso. Al contrario, il caricamento bulk XML esegue le operazioni seguenti:

Analizza lo schema di mapping e prepara il piano di esecuzione necessario.
Applica il piano di esecuzione ai dati nel flusso di input.

Questa elaborazione sequenziale rende essenziale fornire i dati di input XML in un modo specifico. È necessario comprendere il modo in cui il caricamento bulk XML analizza lo schema di mapping e la modalità di esecuzione del processo di generazione di record. Una volta compresi questi elementi, è possibile fornire uno schema di mapping al caricamento bulk XML che produca i risultati desiderati.

Il caricamento bulk XML gestisce annotazioni dello schema di mapping, inclusi i mapping di colonne e tabelle (specificati in modo esplicito utilizzando annotazioni o in modo implicito tramite il mapping predefinito), e relazioni di join comuni.

[!NOTA]

Si presuppone una certa familiarità con gli schemi di mapping XSD o XDR con annotazioni. Per ulteriori informazioni sugli schemi, vedere Introduzione agli schemi XSD con annotazioni (SQLXML 4.0) o Schemi XDR con annotazioni (deprecati in SQLXML 4.0).

La comprensione della generazione di record richiede una certa familiarità con i concetti seguenti:

Ambito di un nodo
Regola di generazione di record
Subset di record e regola di ordinamento delle chiavi
Eccezioni alla regola di generazione di record

Ambito di un nodo

Un nodo (un elemento o un attributo) in un documento XML entra nell'ambito quando il caricamento bulk XML lo rileva nel flusso di dati di input XML. Per un nodo elemento, il tag di inizio dell'elemento inserisce l'elemento nell'ambito. Per un nodo attributo, il nome di attributo inserisce l'attributo nell'ambito.

Un nodo abbandona l'ambito quando non include più dati in corrispondenza del tag di fine (nel caso di un nodo elemento) o alla fine di un valore di attributo (nel caso di un nodo attributo).

Regola di generazione di record

Quando un nodo (elemento o attributo) entra nell'ambito, è possibile che venga generato un record dal nodo. Il record dura fino a quando il nodo associato resta nell'ambito. Quando il nodo abbandona l'ambito, il caricamento bulk XML considera completo il record generato (con i dati) e lo invia a SQL Server per l'inserimento.

Si consideri ad esempio il seguente frammento di schema XSD:

<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema"
            xmlns:sql="urn:schemas-microsoft-com:mapping-schema">
  <xsd:element name="Customer" sql:relation="Customers" >
   <xsd:complexType>
     <xsd:attribute name="CustomerID" type="xsd:string" />
     <xsd:attribute name="CompanyName" type="xsd:string" />
    </xsd:complexType>
  </xsd:element>
</xsd:schema>

Lo schema specifica un elemento <Customer> con gli attributi CustomerID e CompanyName. L'annotazione sql:relation esegue il mapping dell'elemento <Customer> alla tabella Customers.

Si consideri il frammento seguente di un documento XML:

<Customer CustomerID="1" CompanyName="xyz" />
<Customer CustomerID="2" CompanyName="abc" />
...

Quando il caricamento bulk XML riceve lo schema descritto nei paragrafi precedenti e i dati XML come input, elabora i nodi (elementi e attributi) nei dati di origine nel modo seguente:

Il tag di inizio del primo elemento <Customer> inserisce l'elemento nell'ambito. Questo nodo viene mappato alla tabella Customers. Il caricamento bulk XML genera pertanto un record per la tabella Customers.
Nello schema viene eseguito il mapping di tutti gli attributi dell'elemento <Customer> a colonne della tabella Customers. Poiché questi attributi entrano nell'ambito, il caricamento bulk XML ne copia i valori nel record del cliente già generato dall'ambito padre.
Quando il caricamento bulk XML raggiunge il tag di fine per l'elemento <Customer>, l'elemento abbandona l'ambito. Di conseguenza, il caricamento bulk XML considera il record completo e lo invia a SQL Server.

Il caricamento bulk XML segue questo processo per ogni elemento <Customer> successivo.

Importante
In questo modello, poiché viene inserito un record quando viene raggiunto il tag di fine (o il nodo è esterno all'ambito), è necessario definire tutti i dati associati al record all'interno dell'ambito del nodo.

Subset di record e regola di ordinamento delle chiavi

Quando si specifica uno schema di mapping che utilizza <sql:relationship>, il termine subset si riferisce al set di record generato sul lato esterno della relazione. Nell'esempio seguente i record CustOrder sono sul lato esterno, <sql:relationship>.

Si supponga, ad esempio, un database contenente le tabelle seguenti:

Cust (CustomerID, CompanyName, City)
CustOrder (CustomerID, OrderID)

CustomerID nella tabella CustOrder è una chiave esterna che fa riferimento alla chiave primaria CustomerID nella tabella Cust.

Si consideri a questo punto la vista XML specificata nello schema XSD con annotazioni seguente. Questo schema utilizza <sql:relationship> per specificare la relazione tra le tabelle Cust e CustOrder.

<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema"
            xmlns:sql="urn:schemas-microsoft-com:mapping-schema">
<xsd:annotation>
  <xsd:appinfo>
    <sql:relationship name="CustCustOrder"
          parent="Cust"
          parent-key="CustomerID"
          child="CustOrder"
          child-key="CustomerID" />
  </xsd:appinfo>
</xsd:annotation>

  <xsd:element name="Customers" sql:relation="Cust" >
   <xsd:complexType>
     <xsd:sequence>
       <xsd:element name="CustomerID"  type="xsd:integer" />
       <xsd:element name="CompanyName" type="xsd:string" />
       <xsd:element name="City"        type="xsd:string" />
       <xsd:element name="Order" 
                          sql:relation="CustOrder"
                          sql:relationship="CustCustOrder" >
         <xsd:complexType>
          <xsd:attribute name="OrderID" type="xsd:integer" />
         </xsd:complexType>
       </xsd:element>
     </xsd:sequence>
    </xsd:complexType>
  </xsd:element>
</xsd:schema>

I dati XML di esempio e la procedura per creare un esempio reale vengono forniti di seguito.

Quando un nodo elemento <Customer> nel file di dati XML entra nell'ambito, il caricamento bulk XML genera un record per la tabella Cust. Il caricamento bulk XML copia quindi i valori di colonna necessari (CustomerID, CompanyName e City) dagli elementi figlio <CustomerID>, <CompanyName> e <City> mentre gli elementi entrano nell'ambito.
Quando un nodo elemento <Order> entra nell'ambito, il caricamento bulk XML genera un record per la tabella CustOrder. Il caricamento bulk XML copia il valore dell'attributo OrderID in questo record. Il valore richiesto per la colonna CustomerID viene ottenuto dall'elemento figlio <CustomerID> dell'elemento <Customer>. Il caricamento bulk XML utilizza le informazioni specificate in <sql:relationship> per ottenere il valore della chiave esterna CustomerID per il record, a meno che non sia stato specificato l'attributo CustomerID nell'elemento <Order>. La regola generale prevede che se l'elemento specifica in modo esplicito un valore per l'attributo chiave esterna, il caricamento bulk XML utilizza tale valore e non ottiene il valore dall'elemento padre tramite l'annotazione <sql:relationship> specificata. Poiché il nodo elemento <Order> abbandona l'ambito, il caricamento bulk invia il record a SQL Server, quindi elabora tutti i nodi elemento <Order> successivi allo stesso modo.
Il nodo elemento <Customer>, infine, abbandona l'ambito. A questo punto, il caricamento bulk XML invia il record del cliente a SQL Server. Il caricamento bulk XML segue questo processo per tutti i clienti successivi nel flusso di dati XML.

Di seguito sono riportate due osservazioni sullo schema di mapping:

Quando lo schema soddisfa la regola di "contenimento", ad esempio quando tutti i dati associati al cliente e all'ordine vengono definiti all'interno dell'ambito dei nodi elemento <Customer> e <Order> associati, il caricamento bulk viene eseguito correttamente.
Nel descrivere l'elemento <Customer>, i relativi elementi figlio vengono specificati nell'ordine appropriato. In questo caso, l'elemento figlio <CustomerID> viene specificato prima dell'elemento figlio <Order>. Ciò significa che nel file di dati XML di input il valore dell'elemento <CustomerID> è disponibile come valore di chiave esterna quando l'elemento <Order> entra nell'ambito. Gli attributi chiave vengono specificati per primi. Questo comportamento è denominato "regola di ordinamento delle chiavi".

Se si specifica l'elemento figlio <CustomerID> dopo l'elemento figlio <Order>, il valore non è disponibile quando l'elemento <Order> entra nell'ambito. Quando viene letto il tag di fine </Order>, il record per la tabella CustOrder viene considerato completo e viene inserito nella tabella CustOrder con un valore NULL per la colonna CustomerID. Tale risultato non è quello desiderato.

Per creare un esempio reale

Salvare lo schema fornito in questo esempio come SampleSchema.xml.

Creare le tabelle seguenti:

CREATE TABLE Cust (
              CustomerID     int         PRIMARY KEY,
              CompanyName    varchar(20) NOT NULL,
              City           varchar(20) DEFAULT 'Seattle')
GO
CREATE TABLE CustOrder (
             OrderID        int         PRIMARY KEY,
             CustomerID     int         FOREIGN KEY REFERENCES                                          Cust(CustomerID))
GO

Salvare i dati di input XML di esempio seguenti come file SampleXMLData.xml:

<ROOT>
  <Customers>
    <CustomerID>1111</CustomerID>
    <CompanyName>Hanari Carnes</CompanyName>
    <City>NY</City> 
    <Order OrderID="1" />
    <Order OrderID="2" />
  </Customers>

  <Customers>
    <CustomerID>1112</CustomerID>
    <CompanyName>Toms Spezialitten</CompanyName>
    <City>LA</City>
    <Order OrderID="3" />
  </Customers>
  <Customers>
    <CustomerID>1113</CustomerID>
    <CompanyName>Victuailles en stock</CompanyName>
    <Order OrderID="4" />
</Customers>
</ROOT>

Per eseguire il caricamento bulk XML, salvare ed eseguire l'esempio (BulkLoad.vbs) di Microsoft Visual Basic, Scripting Edition (VBScript) seguente:

set objBL = CreateObject("SQLXMLBulkLoad.SQLXMLBulkload.4.0")
objBL.ConnectionString = "provider=SQLOLEDB;data source=localhost;database=tempdb;integrated security=SSPI"
objBL.ErrorLogFile = "c:\error.log"
objBL.CheckConstraints = True
objBL.Execute "c:\SampleSchema.xml", "c:\SampleXMLData.xml"
set objBL=Nothing

Eccezioni alla regola di generazione di record

Il caricamento bulk XML non genera un record per un nodo quando entra nell'ambito se il nodo è un tipo IDREF o IDREFS. È necessario verificare che sia presente una descrizione completa del record in un punto dello schema. Le annotazioni dt:type="nmtokens" vengono ignorate, come viene ignorato il tipo IDREFS.

Si consideri, ad esempio, lo schema XSD seguente che descrive gli elementi <Customer> e <Order>. L'elemento <Customer> include un attributo OrderList del tipo IDREFS. Il tag <sql:relationship> specifica la relazione uno-a-molti tra il cliente e l'elenco di ordini.

Lo schema è il seguente:

<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema"
            xmlns:sql="urn:schemas-microsoft-com:mapping-schema">
<xsd:annotation>
  <xsd:appinfo>
    <sql:relationship name="CustCustOrder"
                 parent="Cust"
                 parent-key="CustomerID"
                 child="CustOrder"
                 child-key="CustomerID" />
  </xsd:appinfo>
</xsd:annotation>

  <xsd:element name="Customers" sql:relation="Cust" >
   <xsd:complexType>
    <xsd:attribute name="CustomerID" type="xsd:integer" />
    <xsd:attribute name="CompanyName" type="xsd:string" />
    <xsd:attribute name="City" type="xsd:string" />
    <xsd:attribute name="OrderList" 
                       type="xsd:IDREFS" 
                       sql:relation="CustOrder" 
                       sql:field="OrderID"
                       sql:relationship="CustCustOrder" >
    </xsd:attribute>
  </xsd:complexType>
 </xsd:element>

  <xsd:element name="Order" sql:relation="CustOrder" >
   <xsd:complexType>
    <xsd:attribute name="OrderID" type="xsd:string" />
    <xsd:attribute name="CustomerID" type="xsd:integer" />
    <xsd:attribute name="OrderDate" type="xsd:date" />
  </xsd:complexType>
 </xsd:element>
</xsd:schema>

Poiché il caricamento bulk ignora i nodi di tipo IDREFS, non viene eseguita alcuna generazione di record quando il nodo attributo OrderList entra nell'ambito. Se pertanto si desidera che i record relativi agli ordini vengano aggiunti alla tabella Orders, è necessario descrivere tali ordini in un punto dello schema. In questo schema la definizione dell'elemento <Order> fa in modo che il caricamento bulk aggiunga i record relativi agli ordini alla tabella Orders. L'elemento <Order> descrive tutti gli attributi necessari per riempire il record per la tabella CustOrder.

È necessario verificare che i valori CustomerID e OrderID nell'elemento <Customer> corrispondano a quelli nell'elemento <Order>. L'utente è responsabile del mantenimento dell'integrità referenziale.

Per testare un esempio reale

Creare le tabelle seguenti:

CREATE TABLE Cust (
              CustomerID     int          PRIMARY KEY,
              CompanyName    varchar(20)  NOT NULL,
              City           varchar(20)  DEFAULT 'Seattle')
GO
CREATE TABLE CustOrder (
              OrderID        varchar(10) PRIMARY KEY,
              CustomerID     int         FOREIGN KEY REFERENCES                                          Cust(CustomerID),
              OrderDate      datetime DEFAULT '2000-01-01')
GO

Salvare lo schema di mapping fornito in questo esempio come file SampleSchema.xml.

Salvare i dati XML di esempio seguenti come file SampleXMLData.xml:

<ROOT>
  <Customers CustomerID="1111" CompanyName="Sean Chai" City="NY"
             OrderList="Ord1 Ord2" />
  <Customers CustomerID="1112" CompanyName="Dont Know" City="LA"
             OrderList="Ord3 Ord4" />
  <Order OrderID="Ord1" CustomerID="1111" OrderDate="1999-01-01" />
  <Order OrderID="Ord2" CustomerID="1111" OrderDate="1999-02-01" />
  <Order OrderID="Ord3" CustomerID="1112" OrderDate="1999-03-01" />
  <Order OrderID="Ord4" CustomerID="1112" OrderDate="1999-04-01" />
</ROOT>

Per eseguire il caricamento bulk XML, salvare ed eseguire l'esempio (SampleVB.vbs) di VBScript seguente:

set objBL = CreateObject("SQLXMLBulkLoad.SQLXMLBulkload.4.0")
objBL.ConnectionString = "provider=SQLOLEDB;data source=localhost;database=tempdb;integrated security=SSPI"
objBL.ErrorLogFile = "c:\error.log"
objBL.CheckConstraints=True
objBL.Execute "c:\SampleSchema.xml", "c:\SampleXMLData.xml"
set objBL=Nothing

Condividi tramite