Esittely

Valmis

Azure Databricks on pilvipohjainen tietoympäristö, joka yhdistää tietotekniikan, datatieteen ja koneoppimisen parhaat puolet yhteen yhtenäiseen työtilaan. Apache Sparkin päälle rakennetun sen avulla organisaatiot voivat helposti käsitellä, analysoida ja visualisoida valtavia tietomääriä reaaliajassa.

Kaavio, jossa on yleiskatsaus Azure Databricksiin.

Azure Databricks helpottaa tietojen integrointia ja muuntamista mistä tahansa muodostamalla yhteyden monenlaisiin tietolähteisiin pilvipalveluntarjoajista, kuten Azure SQL Databasesta, Amazon S3:sta ja Google Cloud Storagesta, yritysjärjestelmiin, kuten SAP ja Oracle.

Kun tiedot on käsitelty, myynnin, markkinoinnin, toiminnan, rahoituksen, HR:n ja kestävän kehityksen tiimit voivat käyttää Databricksiä kehittyneeseen analytiikkaan, koneoppimiseen, liiketoimintatietoihin ja tekoälypohjaisiin merkityksellisiin tietoihin.

Azure Databricks auttaa organisaatioita:

  • Integroi tietoja useista lähteistä
  • Suunnittele ja muunna raakadata käyttökelpoisiin muotoihin
  • Tallenna ja hallitse tietoja tehokkaasti hallinnon ja suojauksen avulla
  • Käytä reaaliaikaista analytiikkaa, koneoppimista ja tekoälymalleja
  • Paranna liiketoimintapäätöksiä ja tuloksia

Data Lakehouse

Data Lakehouse on tiedonhallinnan lähestymistapa, jossa yhdistyvät sekä tietoaltaiden että tietovarastojen vahvuudet. Se tarjoaa skaalautuvan tallennuksen ja käsittelyn, jonka avulla organisaatiot voivat käsitellä erilaisia työkuormia, kuten koneoppimista ja liiketoimintatietoja, turvautumatta erillisiin, irrallisiin järjestelmiin. Keskittämällä tiedot lakehouse tukee yhtä totuuden lähdettä, vähentää päällekkäisiä kustannuksia ja varmistaa, että tiedot pysyvät ajan tasalla.

Monet järvitalot noudattavat kerrostettua suunnittelumallia, jossa tietoja parannetaan vähitellen, rikastetaan ja tarkennetaan sen edetessä käsittelyn eri vaiheissa. Tämä kerrostettu lähestymistapa – jota kutsutaan yleisesti medaljonkiarkkitehtuuriksi – järjestää tiedot vaiheisiin, jotka rakentuvat toistensa varaan, mikä helpottaa niiden tehokasta hallintaa ja käyttöä.

Databricks-järvitalo käyttää kahta keskeistä teknologiaa:

  • Delta Lake: optimoitu tallennuskerros, joka tukee ACID-tapahtumia ja skeemojen täytäntöönpanoa.
  • Unity Catalog: yhtenäinen, hienojakoinen hallintaratkaisu tiedoille ja tekoälylle.