Condividi tramite


Inserimento SAP con analisi su scala cloud in Azure

Azure è in grado di supportare molti approcci per l'estrazione e l'inserimento di dati da origini dati SAP, tra cui BusinessWare e SAP ERP Central Component (ECC). I sistemi SAP sono complessi perché la struttura monolitica attraversa diversi domini. Il criterio consigliato prevede che ogni gruppo aziendale inserisca i propri dati da SAP nella zona di destinazione dei dati. I dati vengono presentati nel livello arricchito (dopo essere passati attraverso raw) ed è accessibile ai controlli di accesso al gruppo Entra di Microsoft. I team finanziari centrali possono curare e inserire gli oggetti finanziari in un singolo asset di dati, in modo da soddisfare i requisiti della zona di destinazione dei dati.

A seconda dei volumi di dati e dei requisiti di latenza dell'organizzazione, uno dei tre modelli può supportare i requisiti di inserimento.

Azure Data Factory

Data Factory offre diversi connettori ai sistemi SAP e a vari database (tra cui SAP HANA). Questi possono essere usati per compilare trasformazioni di dati semplici e senza codice in pochi minuti. La replica differenziale non è disponibile, ma può essere ottenuta con una certa programmazione. Azure Data Factory è supportato solo per l'elaborazione batch o microbatch a intervalli di almeno 15 minuti.

Descritta come opzione PULL, questa opzione Data Factory supporta l'accesso Single Sign-On e l'autenticazione Secure Network Communication in SAP. Offre anche la possibilità di usare trasformazioni dei dati senza codice per compilare flussi di dati resilienti in grado di integrarsi con Azure Databricks per la preparazione flessibile dei dati e la codifica di arricchimento. È limitata all'elaborazione batch e richiede la logica di codifica per supportare estratti delta. È anche possibile valutare il nuovo connettore SAP ODP, che sfrutta il framework ODP (Operational Data Provisioning) di SAP. Questo nuovo connettore può connettersi a tutti i sistemi SAP che supportano ODP per eseguire carichi di dati completi e incrementali.

Servizi dati di oggetti aziendali e server di replica SAP Landscape Transformation

Il server di replica SAP Landscape Transformation (SLT) è un componente aggiuntivo SAP NetWeaver che usa la replica basata su trigger per estrarre i dati. Questo servizio si integra con Business Objects Data Services (BODS) nell'origine per fornire funzionalità di estrazione, caricamento e trasformazione e creare i file del set di dati da trasferire. Questa opzione può essere considerata sia per l'inserimento in batch che per l'inserimento quasi in tempo reale.

Descritta come opzione PUSH, questa opzione basata su SAP facilita la replica basata su trigger e l'estrazione quasi in tempo reale con una configurazione semplice e unificata per tutti i dati SAP. Questo richiede licenze SAP, passaggi downstream aggiuntivi e operazioni di pianificazione per spostare i dati in Azure, inclusi diversi hop di rete basati su uno strumento di copia file come AzCopy.

Strumenti di terze parti

Sono disponibili molti strumenti di terze parti in grado di fornire l'estrazione e l'inserimento a valore aggiunto dalle origini SAP in tempo reale. Microsoft consiglia Qlik Replicate (noto in precedenza come Attunity), Simplement Data Liberator e Kagool Velocity. Ognuno di essi offre funzionalità simili e può estrarre i dati da SAP quasi in tempo reale e garantire un contesto aziendale e intelligence predefiniti.

Questi servizi differiscono per l'architettura tecnica. Qlik Replicate e Simplement Data Liberator offrono la replica quasi in tempo reale identificando le modifiche nei log del database di origine. Kagool Velocity usa un componente aggiuntivo per SAP NetWeaver e invia una richiesta di commenti a livello applicazione per esporre i dati. Rispetto alle opzioni citate in precedenza, queste opzioni offrono funzionalità predefinite migliori e supporto quasi in tempo reale, ma richiedono tecnologie di terze parti.

Consiglio

  • La raccomandazione principale consiste nell'usare il connettore SAP ODP come segue:

    • Fornisce un singolo connettore per connettersi a estrattori SAP ECC, viste CDS SAP S/4HANA, SAP BW, SAP BW4/HANA, SAP SLT, SAP HANA Views.

    • Usa le viste CDS esistenti e le viste create personalizzate già fornite, semplificando l'estrazione dei dati da SAP S/4HANA e SAP BW.

    • Può usare SLT che consente l'acquisizione dei dati basata su trigger a livello di tabella.

    • L'uso dei flussi di dati in Azure Data Factory e nelle pipeline di Synapse semplifica l'estrazione dei dati senza bisogno di filigrana.

    • I flussi di dati offrono funzionalità predefinite per l'applicazione di modifiche nel sink usando l'ordine corretto in base ai metadati ODP e nasconde completamente le complessità necessarie per gli sviluppatori per creare codice personalizzato per gestire inserimenti/aggiornamenti/eliminazioni/upsert.

    • I flussi di dati usano il meccanismo di ripristino del framework ODQ in modo trasparente che non richieda logica personalizzata per l'esecuzione del ripristino durante le estrazione non riuscite.

    • I flussi di dati offrono vantaggi di velocità effettiva elevata (tramite letture parallele, partizione e così via) per migliorare le prestazioni delle estrazioni di dati.

  • L'uso di un approccio ibrido è anche un'opzione disponibile e può essere costituita da diverse opzioni che fungono da strategia di inserimento per i dati SAP. SAP SLT, BODS e Qlik vengono usati per estrarre i dati dai sistemi transazionali SAP (ad esempio SAP ECC) e Data Factory esegue il pull dei dati in Azure per convertirli nel formato Parquet prima di scrivere in Azure Data Lake Storage. Sfrutta il framework esistente estraendo in modo indipendente i dati da SAP NetWeaver Business Warehouse.

Passaggi successivi

Come i framework di inserimento automatizzato supportano l'analisi su scala cloud in Azure