Szerkesztés

Megosztás a következőn keresztül:


Az ügyfél élettartamának és változásának meghatározása az Azure AI-szolgáltatásokkal

Azure Data Lake Storage
Azure Databricks
Azure Machine Learning
Azure Analysis Services

Ez a forgatókönyv egy olyan megoldást mutat be, amellyel prediktív modelleket hozhat létre az ügyfelek élettartamának értékéről és az adatváltozási arányról az Azure AI-technológiák használatával.

Architektúra

Architektúradiagram az ügyfelek élettartamának és változásának meghatározásához az Azure AI-szolgáltatások használatával

Töltse le az architektúra Visio-fájlját.

Adatfolyam

  1. Betöltés és vezénylés: Az ügyfél helyszíni adatforrásokból származó előzményadatai, tranzakciós és harmadik féltől származó adatai. Használja az Azure Data Factoryt, és tárolja az eredményeket az Azure Data Lake Storage-ban.

  2. Adatfeldolgozás: Az Azure Databricks használatával veheti fel és tisztíthatja meg a nyers adatokat a Data Lake Storage-ból. Tárolja az adatokat az Ezüst rétegben az Azure Data Lake Storage-ban.

  3. Szolgáltatásfejlesztés: Az Azure Databricks használatával adatokat tölthet be a Data Lake Storage ezüstrétegéből. A PySpark használatával bővítse az adatokat. Az előkészítés után a funkciófejlesztéssel jobban ábrázolhatja az adatokat. A funkciófejlesztés a gépi tanulási algoritmus teljesítményét is javíthatja.

  4. Modellbetanítás: A modellbetanításban az ezüstszintű adatok a modell betanítási adatkészlete. Az MLflow használatával kezelheti a gépi tanulási kísérleteket. Az MLflow nyomon követi a gépi tanulási kísérlet kiértékeléséhez szükséges összes metrikát.

    Az MLflow-paraméterek modellekkel kapcsolatos paramétereket, például betanítási hiperparamétereket tárolnak. Az MLflow-metrikák a modell teljesítménymetrikáit tárolják. A gépi tanulási modell iteratív módon újratanul az Azure Data Factory-folyamatok használatával. A modell újratanítási folyamata frissített betanítási adatokat kap az Azure Data Lake Storage-ból, és újratanítást ad a modellnek. A modell újratanítási folyamata a következő feltételekkel indul el:

    • Ha az aktuális modell pontossága az éles környezetben az MLflow által nyomon követett küszöbérték alá csökken.
    • Amikor a naptár eseményindítói az ügyfél által meghatározott szabályok alapján érnek el.
    • Adateltolódás észlelése esetén.
  5. Gépi tanulási beállításjegyzék: Egy Azure Data Factory-folyamat a kiválasztott metrikák alapján regisztrálja a legjobb gépi tanulási modellt az Azure Machine Learning Service-ben. A gépi tanulási modell üzembe helyezése az Azure Kubernetes Service használatával történik.

  6. Kiszolgálási fázis: A kiszolgálási fázisban jelentéskészítő eszközökkel dolgozhat a modell előrejelzéseivel. Ezek közé az eszközök közé tartozik a Power BI és az Azure Analysis Services.

Összetevők

  • Az Azure Analysis Services nagyvállalati szintű adatmodelleket biztosít a felhőben.

  • Az Azure Data Factory olyan adatintegrációs és átalakítási réteget biztosít, amely a digitális átalakítási kezdeményezéseken keresztül működik.

  • Az Azure Databricks a Microsoft Azure felhőplatformhoz optimalizált adatelemzési platform.

  • Az Azure Machine Learning számos olyan élményt tartalmaz, amely gépi tanulási modelleket készít, tanít be és helyez üzembe, és elősegíti a csapatmunkát.

  • Az Azure SQL Database egy adatbázismotor, amely a legtöbb felügyeleti funkciót az Ön közreműködése nélkül kezeli. Az Azure SQL Database lehetővé teszi, hogy a vállalata számára a tartományspecifikus adatbázis-adminisztrációs és -optimalizálási tevékenységekre összpontosítson.

  • Az MLflow egy nyílt forráskódú platform a gépi tanulási életciklus kezelésére.

Alternatívák

  • A Data Factory vezényli az adatfolyam munkafolyamatait. Ha csak egyszer vagy igény szerint szeretne adatokat betölteni, használjon olyan eszközöket, mint az SQL Server tömeges másolása és az AzCopy, hogy adatokat másoljon az Azure Blob Storage-ba. Ezután közvetlenül betöltheti az adatokat az Azure Synapse Analyticsbe a PolyBase használatával.

  • Előfordulhat, hogy egyes üzletiintelligencia-eszközök nem támogatják az Azure Analysis Servicest. A válogatott adatok ehelyett közvetlenül az Azure SQL Database-ből érhetők el. Az adatok tárolása az Azure Data Lake Storage használatával történik, és az Azure Databricks Storage használatával érhető el adatfeldolgozás céljából.

Forgatókönyv részletei

Az ügyfél élettartamának értéke az ügyfél nettó nyereségét méri. Ez a metrika magában foglalja az ügyfél és a vállalat közötti teljes kapcsolatból származó nyereséget. Az adatváltozási vagy adatváltozási ráta azt méri, hogy egy adott időszakban hány személy vagy elem költözik ki a csoportból.

Ez a kiskereskedelmi ügyfélforgatókönyv marketing- és gazdasági intézkedések alapján sorolja be az ügyfeleket. Ez a forgatókönyv több metrikán alapuló ügyfélszegmentálást is létrehoz. Egy többosztályos osztályozót képez be új adatokra. Az eredményként kapott modell egy rendszeresen ütemezett Azure Databricks-jegyzetfüzetfeladaton keresztül pontozza az új ügyfélrendelések kötegeit.

Ez a megoldás a következő Azure AI-technológiák összekapcsolásának módját mutatja be:

  • Az Azure Data Lake és az Azure Databricks használatával implementálhatja az adatműveletek ajánlott eljárásait.
  • Az Azure Databricks használatával feltáró adatelemzést hajthat végre.
  • Gépi tanulási kísérletek nyomon követéséhez használja az MLflow-t.
  • Batch score machine learning models on Azure Databricks.
  • Az Azure Machine Learning használatával modellezheti a regisztrációt és az üzembe helyezést.
  • Az MLOps-folyamat vezényléséhez használja az Azure Data Factoryt és az Azure Databricks-jegyzetfüzeteket.

Lehetséges használati esetek

Ez a megoldás ideális a kiskereskedelem számára. A következő használati esetekben hasznos:

  • A marketingben annak meghatározásához, hogy mennyit kell költeni egy ügyfél beszerzésére.
  • A termékcsapatok számára a legjobb ügyfeleknek szánt termékek és szolgáltatások testreszabása.
  • Az ügyféltámogatás érdekében döntse el, hogy mennyit költ a szolgáltatásra, és tartsa meg az ügyfelet.
  • Az értékesítési képviselők számára annak eldöntése, hogy milyen típusú ügyfelek töltik a legtöbb időt a beszerzéssel.

Megfontolások

Ezek a szempontok implementálják az Azure Well-Architected Framework alappilléreit, amely a számítási feladatok minőségének javítására használható vezérelvek halmaza. További információ: Microsoft Azure Well-Architected Framework.

Elérhetőség

Az Azure-összetevők redundancián keresztül és a szolgáltatásiszint-szerződésekben (SLA-k) meghatározottak szerint kínálják a rendelkezésre állást:

  • A Data Factory-folyamatokról további információt a Data Factory SLA-jában talál.
  • Az Azure Databricksről további információt az Azure Databricksben talál.
  • A Data Lake Storage redundancián keresztül biztosítja a rendelkezésre állást. További információ: Azure Storage-redundancia.

Méretezhetőség

Ez a forgatókönyv az Azure Data Lake Storage használatával tárolja a gépi tanulási modellek és előrejelzések adatait. Az Azure Storage méretezhető. Sok exabájtnyi adatot képes tárolni és kiszolgálni. Ez a tárterület gigabites /másodpercben (Gbp) mért átviteli sebességgel érhető el. A feldolgozás kérelemenként közel állandó késéssel fut. A késéseket a szolgáltatás, a fiók és a fájl szintjén méri a rendszer.

Ez a forgatókönyv Azure Databricks-fürtöket használ, amelyek alapértelmezés szerint engedélyezik az automatikus skálázást. Az automatikus skálázás lehetővé teszi, hogy a Databricks futásidőben dinamikusan újratelepítse az erőforrásokat. Az automatikus skálázással nem kell olyan fürtöt indítania, amely megfelel egy számítási feladatnak, ami megkönnyíti a magas fürthasználat elérését.

Biztonság

A biztonság biztosítékokat nyújt a szándékos támadások és az értékes adatokkal és rendszerekkel való visszaélés ellen. További információ: A biztonsági pillér áttekintése.

Az eszközök védelme az Azure-ból származó hálózati forgalom, a helyszíni és az Azure által üzemeltetett erőforrások, valamint az Azure-ba érkező és onnan érkező forgalom vezérlésével. Az Azure saját üzemeltetésű integrációs modulja például biztonságosan helyezi át az adatokat a helyszíni adattárból az Azure-ba.

Az Azure Key Vault és a Databricks hatókörön belüli titkos kód használatával érheti el az Azure Data Lake Storage-ban tárolt adatokat.

Az Azure-szolgáltatások biztonságos virtuális hálózaton vannak üzembe helyezve, vagy az Azure Private Link szolgáltatással érhetők el. Szükség esetén a sorszintű biztonság részletes hozzáférést biztosít az Azure Analysis Services vagy az SQL Database egyes felhasználói számára.

Költségoptimalizálás

A költségoptimalizálás a szükségtelen kiadások csökkentésének és a működési hatékonyság javításának módjairól szól. További információ: A költségoptimalizálási pillér áttekintése.

Az Azure Databricks egy prémium Szintű Apache Spark-ajánlat, amelyhez kapcsolódó költségek tartoznak.

Standard és prémium Szintű Databricks tarifacsomagok érhetők el. Ebben a forgatókönyvben a Standard tarifacsomag elegendő. Ha az alkalmazás a nagyobb számítási feladatok vagy interaktív Databricks-irányítópultok kezeléséhez automatikusan skálázási fürtöket igényel, előfordulhat, hogy a prémium szintű rétegre van szüksége.

A használati esettel kapcsolatos költségek az alábbi szolgáltatások általános díjszabásától függnek a használathoz:

Az Azure-termékek és -konfigurációk költségeinek becsléséhez látogasson el az Azure díjkalkulátorára.

Közreműködők

Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.

Fő szerző:

Következő lépések