İngilizce dilinde oku

Aracılığıyla paylaş


Azure Databricks teknik terim sözlüğü

A

erişim denetimi listesi (ACL)

Çalışma alanına, kümeye, işe, tabloya veya denemeye eklenmiş izinlerin listesi. ACL, nesnelere hangi kullanıcılara veya sistem işlemlerine erişim verildiğini ve varlıklar üzerinde hangi işlemlere izin verildiğini belirtir. Tipik bir ACL'deki her girdi bir konu ve bir işlem belirtir. Bkz. Erişim denetim listeleri.

erişim modu

İşlem kaynağını kimlerin kullanabileceğini ve işlem kaynağını kullanırken erişebilecekleri verileri belirleyen bir güvenlik özelliği. Azure Databricks'teki her işlem kaynağının bir erişim modu vardır. Bkz. Erişim modları.

ACID işlemleri

Güvenilir bir şekilde işlenen veritabanı işlemleri. ACID, bölünmezlik, tutarlılık, yalıtım, dayanıklılık anlamına gelir. Bkz. Güvenilirlik için en iyi yöntemler.

yapay zeka (AI)

Bilgisayarın akıllı insan davranışlarını taklit etme yeteneği. Bkz . Databricks'te yapay zeka ve makine öğrenmesi.

Yapay zeka aracısı

Kendi planını oluşturmasına ve görevi emrindeki araçlara göre yürütmesine olanak tanıyan karmaşık akıl yürütme özelliklerine sahip bir uygulama. Bkz. Bileşik yapay zeka sistemleri ve yapay zeka aracıları nedir?.

Yapay zeka işlevleri

Azure Databricks'te doğrudan SQL'den verilerinize yapay zeka uygulamanıza olanak sağlayan yerleşik SQL işlevleri. Bkz. Azure Databricks AI İşlevleri'ni kullanarak veriye yapay zeka uygulama.

Yapay zeka oyun alanı

Kullanıcıların Azure Databricks çalışma alanınızda sunulan üretken yapay zeka modelleriyle etkileşim kurabileceği, test edebildiği ve karşılaştırabileceği bir Azure Databricks özelliği. bkz. AI Playgroundkullanarak LLM'lerle sohbet ve prototip oluşturma yapay zeka uygulamaları.

anomali algılama

Veri kümelerinde beklenen davranışa uymayan olağan dışı desenleri tanımlamak için kullanılan teknikler ve araçlar. Azure Databricks, makine öğrenmesi ve veri işleme özellikleri aracılığıyla anomali algılamayı kolaylaştırır.

Apache Spark

Büyük veri iş yükleri için kullanılan açık kaynaklı, dağıtılmış bir bilgi işlem sistemi. Bkz. Azure Databricks'te Apache Spark.

yapay sinir ağı (ANN)

İnsan beynindeki nöronların çalışmasına göre modellenmiş bir bilgi işlem sistemi.

Kıymet

Azure Databricks çalışma alanındaki bir varlık (örneğin, bir nesne veya dosya).

denetim günlüğü

Azure Databricks ortamındaki güvenlik, uyumluluk ve operasyonel izleme için kritik öneme sahip kullanıcı etkinliklerinin ve eylemlerinin kaydı. Bkz. Tanılama günlüğü referansı.

Otomatik Yükleyici

Ek kurulum olmadan bulut depolama alanına ulaşan yeni veri dosyalarını artımlı ve verimli bir şekilde işleyen veri alımı özelliği. Bkz. Otomatik Yükleyici nedir?.

AutoML

Sizin için en iyi algoritmayı ve hiper parametre yapılandırmasını otomatik olarak bularak veri kümelerinize makine öğrenmesi uygulama sürecini basitleştiren bir Azure Databricks özelliği. Bkz. AutoML nedir?.

otomatik veri silsilesi

Çeşitli dönüşümlerle kaynağından son biçimine veri akışını otomatik olarak izleme ve görselleştirme işlemi, hata ayıklama, uyumluluk ve veri bağımlılıklarını anlamak için gereklidir. Azure Databricks, veri kökeni araçlarıyla tümleştirmeler aracılığıyla bunu kolaylaştırır.

otomatik ölçeklendirme, yatay

Zamanlanmayı bekleyen görev sayısına göre yürütücü ekleme veya kaldırma. Bu, tek bir güncelleştirme sırasında dinamik olarak gerçekleşir.

otomatik ölçeklendirme, dikey

Bellek baskısına (veya eksikliklerine) göre makinenin (sürücü veya yürütücü) boyutunu artırma veya azaltma. Bu yalnızca yeni bir güncelleştirmenin başlangıcında gerçekleşir.

Azure Databricks

Microsoft Azure bulut platformu için iyileştirilmiş bir Databricks sürümü.

B

toplu işleme

Sabit miktarda statik, değişmeyen verileri tek bir işlem olarak işlemek için açık yönergeler tanımlamanıza olanak tanıyan bir veri işleme yöntemi. Azure Databricks, Spark SQL veya DataFrames kullanır. Bkz Akış ve artımlı veri alma.

sapma algılama ve azaltma

Eşitlik ve doğruluk sağlamak için veri ve makine öğrenmesi modellerindeki sapmaları tanımlama ve ele alma süreci. Databricks, yanlılığı algılamaya ve azaltmaya yardımcı olacak araçlar ve tümleştirmeler sunar. Bkz. sınıflandırma modelleri için eşitliği ve sapmayı izleme.

iş zekası (BI)

İşletmeler tarafından iş bilgilerinin veri analizi ve yönetimi için kullanılan stratejiler ve teknolojiler.

C

Catalog Explorer

Verileri, şemaları (veritabanları), tabloları, modelleri, işlevleri ve diğer yapay zeka varlıklarını keşfetmeye ve yönetmeye yönelik bir kullanıcı arabirimi sağlayan bir Azure Databricks özelliği. Veri nesnelerini ve sahiplerini bulmak, tablolar arasındaki veri ilişkilerini anlamak ve izinleri ve paylaşımı yönetmek için kullanabilirsiniz. Bkz. Katalog Gezgini nedir?.

CICD veya CI/CD

Sürekli tümleştirme (CI) ve sürekli teslimin (CD) birleşik uygulamaları. Bkz. Azure Databricks'te CI/CD nedir?.

verileri temizleme

Bir kayıt kümesi, tablo veya veritabanındaki bozuk veya yanlış kayıtları algılama ve düzeltme (veya kaldırma) işlemi olan ve verilerin eksik, yanlış, yanlış veya ilgisiz bölümlerini tanımlama ve ardından kirli veya kaba verileri değiştirme, değiştirme veya silme işlemi olan veri temizleme işleminden geçen veriler.

Odaları Temizle

Delta Sharing ve sunucusuz işlem kullanan bir Azure Databricks özelliği, birden çok tarafın hassas kurumsal verileri paylaşabileceği ve birbirlerinin verilerine doğrudan erişim olmadan işbirliği yapabilecekleri güvenli ve gizliliği koruyan bir ortam sağlar. Clean Rooms ile, diğer Databricks hesaplarından kullanıcılar, gizli temel verilere erişim paylaşmadan reklam kampanyaları, yatırım kararları veya araştırma ve geliştirme gibi paylaşılan projeler hakkında içgörüler oluşturmak için işbirliği yapabilir. Bkz. Azure Databricks Temiz Odalar nedir?.

bulut platformu sağlayıcısı

Bulut bilişim platformu sağlayan bir şirket. Örneğin, Microsoft Azure, Amazon Web Services (AWS) ve Google Cloud Platform (GCP).

küme

Not defterlerinde, işlerde ve DLT'de kullanılan sunucusuz işlem kaynağı. İşlem terimi, Azure Databricks kullanıcı arabirimi genelinde kümenin yerini almıştır, ancak kümeler API'sinde ve meta verilerde kullanılmaya devam eder.

bileşik yapay zeka sistemi

Birden çok etkileşim kuran bileşeni birleştirerek yapay zeka görevlerinin üstesinden gelen sistemler. Buna karşılık, yapay zeka modeli istatistiksel bir modeldir (örneğin, metinde bir sonraki belirteci tahmin eden transformer). Bkz. Bileşik yapay zeka sistemleri ve yapay zeka aracıları nedir?.

hesaplamak

İster donanım ister yazılım olsun, verileri alma, analiz etme ve depolama yoluyla sorun çözme ve çözüm oluşturmayı sağlayan altyapı öğeleri olan işlem kaynaklarını ifade eder. İşlem.

sürekli işlem hattı

Girişe durmadan yeni veriler geldiğinde tüm tabloları sürekli güncelleştiren bir işlem hattı. Bkz. Tetiklenen veya sürekli işlem hattı modu.

D

yönlendirilmiş ansiklik grafik (DAG)

bir iş akışı veya işlem hattındaki görevler arasındaki bağımlılıkları temsil eden bir yöntem. DAG işleme modelinde görevler, uçların görevler arasındaki bağımlılıkları temsil ettiği, yönlendirilmiş bir döngüsel grafikte düğümler olarak temsil edilir.

veri kataloğu

Veri kaynaklarını yönetmek için verilerin yapısı, konumu ve kullanımı hakkında bilgi sağlayan bir meta veri yönetimi aracı. Azure Databricks, gelişmiş meta veri yönetimi için dış veri kataloglarıyla tümleşir.

veri idaresi

Veri kalitesini ve uyumluluğunu sağlamak için ilkeler, yordamlar ve teknolojiler dahil olmak üzere verilerin kullanılabilirliğini, bütünlüğünü, güvenliğini ve kullanılabilirliğini yönetme uygulaması.

veri alımı

Depolama, analiz ve işleme için çeşitli kaynaklardan Azure Databricks'e veri aktarma, aktarma, yükleme ve işleme süreci.

data lake

Gerekli olana kadar büyük miktarda ham veriyi yerel biçiminde tutan büyük bir depolama deposu.

Data Lakehouse

Veri göllerinin ve veri ambarlarının avantajlarını birleştiren bir veri yönetimi sistemi. Data Lakehouse, makine öğrenmesi (ML) ve iş zekası (BI) gibi farklı iş yüklerini işlemek için yalıtılmış sistemlerden kaçınmak isteyen modern kuruluşlar için ölçeklenebilir depolama ve işleme özellikleri sağlar. Data Lakehouse tek bir gerçeklik kaynağı oluşturmaya, gereksiz maliyetleri ortadan kaldırmaya ve verilerin güncelliğini sağlamaya yardımcı olabilir. Bkz. Data Lakehouse nedir?.

veri işlem hattı

Verilerin oluşturulduğu, toplandığı, işlendiği ve bir hedefe taşındığı bir dizi aşama. Databricks, toplu ve gerçek zamanlı veri işleme için karmaşık veri işlem hatlarının oluşturulmasını ve yönetilmesini kolaylaştırır.

veri gizliliği

Kişisel verileri yetkisiz erişim, kullanım, ifşa veya hırsızlıktan koruma uygulaması. Azure Databricks, hassas bilgileri korumak ve veri idaresini sağlamak için uçtan uca şifreleme, rol tabanlı erişim denetimi ve önemli veri koruma düzenlemeleriyle uyumluluk gibi güçlü veri gizliliği ve güvenlik özelliklerini vurgular.

veri görselleştirme

Bir uygulamanın, verilerin nasıl biçimlendirildiği veya fiziksel olarak nerede olduğu gibi teknik ayrıntılara gerek kalmadan verileri almasına ve işlemesine olanak tanıyan bir veri yönetimi yaklaşımı. Azure Databricks, farklı kaynaklardaki verilere sorunsuz erişim ve analiz olanağı sağlayarak veri sanallaştırma katmanının bir parçası olarak görev yapabilir.

veri ambarı

İş içgörüleri ve raporlama için hızlı bir şekilde erişilebilir olması için birden çok kaynaktan veri toplamayı ve depolamayı ifade eder. Lakehouse mimarisi ve Databricks SQL, veri göllerinize bulut veri ambarı özellikleri getirir. Bkz. Azure Databricks'te veri ambarı nedir?

Databricks

Kurumsal düzeydeki verileri, analizleri ve yapay zeka çözümlerini büyük ölçekte oluşturmaya, dağıtmaya, paylaşmaya ve korumaya yönelik birleşik, açık bir analiz platformu. Databricks Veri Zekası Platformu, bulut hesabınızdaki bulut depolama ve güvenlikle tümleştirilir ve bulut altyapısını sizin adınıza yönetir ve dağıtır. Bkz. Azure Databricks nedir?.

Databricks AI/BI

Verilerinizin semantiğini anlamanızı sağlayan ve self servis veri analizini sağlayan bir iş zekası ürünü. AI/BI, ETL işlem hatları, köken ve diğer sorgular dahil olmak üzere Databricks platformundaki verilerinizin tüm yaşam döngüsünden içgörüler elde eden birleşik bir yapay zeka sistemi üzerine kurulmuştur. Bkz . Databricks AI/BI nedir?.

Databricks Varlık Paketleri (DABs)

Veri ve yapay zeka projeleriniz için kaynak denetimi, kod gözden geçirme, test ve sürekli tümleştirme ve teslim (CI/CD) dahil olmak üzere yazılım mühendisliği en iyi uygulamalarının benimsenmesini kolaylaştıran bir araç. Paketler, işler, işlem hatları ve not defterleri gibi Azure Databricks kaynaklarını kaynak dosya olarak açıklamayı mümkün hale getirir. Bkz . Databricks Varlık Paketleri nedir?.

Databricks Yardımcısı

Yapay zeka tabanlı bir ikili programcı ve not defterleri, sorgular, panolar ve dosyalar oluştururken sizi daha verimli hale getiren bir destek temsilcisi. Kod ve sorgular oluşturarak, iyileştirerek, tamamlayarak, açıklayarak ve düzelterek soruları hızla yanıtlamanıza yardımcı olabilir. Bkz. Databricks Yardımcısı nedir?.

Databricks CLI

Azure Databricks için kullanıcıların Databricks çalışma alanlarını yönetmesine ve otomatikleştirmesine ve işleri, not defterlerini ve kitaplıkları dağıtmasına olanak tanıyan bir komut satırı arabirimi. Bkz . Databricks CLI nedir?.

Databricks Connect

Geliştiricilerin sık kullandıkları IDE'leri, not defterlerini ve diğer araçları Azure Databricks işlem ile bağlamasına ve Spark kodunu uzaktan yürütmesine olanak tanıyan bir istemci kitaplığı. Bkz. Databricks Connect nedir?.

Databricks Container Services

İşlem oluştururken Docker görüntüsü belirtmenize olanak tanıyan bir Azure Databricks özelliği. Bakınız Databricks Container Service ile kapsayıcıları özelleştirme.

Databricks Pazaryeri

Veri ürünleri alışverişi için açık bir forum. Sağlayıcıların bir Azure Databricks hesabına sahip olması gerekir, ancak alıcılar herkes olabilir. Market varlıkları arasında veri kümeleri, Azure Databricks not defterleri, Azure Databricks Çözüm Hızlandırıcıları ve makine öğrenmesi (AI) modelleri bulunur. Veri kümeleri genellikle tablosal verilerin katalogları olarak kullanılabilir hale getirilirken, Azure Databricks birimleri biçimindeki tablosal olmayan veriler de desteklenir. Bkz . Databricks Market nedir?.

Databricks Runtime

Büyük veri analizi için iyileştirilmiş bir çalışma zamanı. Databricks ayrıca makine öğrenmesi iş yükleri için iyileştirilmiş Machine Learning için Databricks Runtime da sunar. Bkz Databricks Runtime ve Databricks Runtime sürüm notları ve uyumluluğu.

Databricks SQL (DBSQL)

Veri ambarı özelliklerini ve performansını mevcut veri göllerinize getiren hizmetlerin koleksiyonu. Azure Databricks SQL açık biçimleri ve standart ANSI SQL'i destekler. Platform içi SQL düzenleyicisi ve pano araçları, ekip üyelerinin doğrudan çalışma alanında diğer Azure Databricks kullanıcıları ile işbirliği yapmasına olanak tanır. Bkz. Azure Databricks'te veri ambarı nedir?

DatabricksIQ

Databricks Platformunu güçlendiren veri zekası altyapısı. Kuruluşunuzun veri ve kullanım desenlerinin semantiğini anlamak için yapay zeka modellerinin, alma, derecelendirme ve kişiselleştirme sistemlerinin kullanımını birleştiren birleşik bir yapay zeka sistemidir. Bkz . DatabricksIQ destekli özellikler.

DBU'lar

Databricks Birimi (DBU), ölçüm ve fiyatlandırma amacıyla kullanılan Databricks Lakehouse Platformu'nda normalleştirilmiş bir işlem gücü birimidir. Bir iş yükünün kullandığı DBU sayısı, kullanılan işlem kaynakları ve işlenen veri miktarı gibi ölçümler işlenerek belirlenir. Bkz. Azure Databricks kavramları.

DataFrame

Verileri elektronik tablo gibi iki boyutlu bir satır ve sütun tablosu halinde düzenleyen bir veri yapısı. DataFrame'ler, verileri depolamanın ve verilerle çalışmanın esnek ve sezgisel bir yolu olduğundan modern veri analizinde kullanılan en yaygın veri yapılarından biridir. Bkz . Öğretici: Apache Spark DataFrames kullanarak verileri yükleme ve dönüştürme.

Dataset

Analiz veya işleme için birlikte düzenlenmiş ve depolanmış yapılandırılmış bir veri koleksiyonu. Bir veri kümesindeki veriler genellikle bir şekilde ilişkilidir ve tek bir kaynaktan alınır veya tek bir proje için tasarlanmıştır.

Delta Lake

Veri göllerine güvenilirlik getiren bir açık kaynak depolama katmanı. Delta Lake, ACID işlemleri ve ölçeklenebilir meta veri işleme sağlar, akışla aktarmayı ve toplu veri işlemeyi birleştirir. Bkz . Delta Lake nedir?.

DLT (DLT)

Güvenilir, sürdürülebilir ve test edilebilir veri işleme işlem hatları oluşturmaya yönelik bildirim temelli bir çerçeve. Verileriniz üzerinde gerçekleştirilecek dönüştürmeleri tanımlarsınız ve DLT görev düzenleme, küme yönetimi, izleme, veri kalitesi ve hata işlemeyi yönetir. Bkz. DLT nedir?.

DLT veri kümeleri.

Akış tabloları, maddileştirilmiş görünümler ve görünümler, bildirim temelli sorguların sonuçları olarak korunur.

Delta Paylaşımı

Azure Databricks'teki verileri ve yapay zeka varlıklarını kuruluşunuzun dışındaki kullanıcılarla (bu kullanıcıların Azure Databricks kullanıp kullanmadığı) paylaşmanızı sağlar. Tablosal verileri paylaşmak için açık kaynak bir proje olarak da kullanılabilir. Bunu Azure Databricks'te kullanmak tablosal olmayan, yapılandırılmamış verileri (birimler), yapay zeka modellerini, görünümleri, filtrelenmiş verileri ve not defterlerini paylaşma olanağı sağlar. Bkz . Delta Sharing nedir?.

Delta tabloları

Azure Databricks'te varsayılan veri tablosu biçimidir ve Delta Lake açık kaynak veri çerçevesinin bir özelliğidir. Delta tabloları genellikle verilerin akış yoluyla veya büyük toplu işlemler aracılığıyla alındığı veri gölleri için kullanılır. Bkz. Tablo nedir?.

E

ETL (Ayıklama, Dönüştürme, Yükleme)

Kaynaklardan verileri ayıklayan, hedef sisteme yükleyen ve ardından hedef sistem içinde dönüştüren modern bir veri tümleştirme yaklaşımı. Bkz. Azure Databricks'te ilk ETL iş yükünüzü çalıştırma.

F

Özellik Mağazası

Makine öğrenmesi modellerine yönelik özellikleri depolama, yönetme ve sunma için merkezi bir depo. Bkz. Özellik mühendisliği ve hizmet.

akış

Akış, bir DLT işlem hattındaki verileri okuyan, dönüştüren ve bir hedefe yazan bir kenardır.

temel modeller

Dil anlama ve üretme görevleri için daha özel olarak ince ayar yapılması amaçlanan büyük ML modelleri önceden eğitimden geçirilmiştir. Bkz. Databricks Foundation Model API'leri.

G

üretken yapay zeka

Bilgisayarların görüntüler, metin, kod ve yapay veriler gibi içerik oluşturmak için modelleri kullanabilmesine odaklanan bir yapay zeka türü. Üretken yapay zeka uygulamaları, büyük dil modelleri (LLM' ler) ve temel modeller olmak üzere üretken yapay zeka modellerinin üzerine kurulmuştur. Bkz . Databricks'te yapay zeka ve makine öğrenmesi.

J

Azure Databricks'te üretim iş yüklerini zamanlamaya ve düzenlemeye yönelik birincil birim. Azure Databricks İşleri bir veya daha fazla görevden oluşur. Databricks üzerinde orkestrasyona genel bakış için bkz. .

L

Lakeflow Connect

Kurumsal uygulamalardan ve veritabanlarından alım için yerleşik bağlayıcılar sunar. Sonuçta elde edilen veri alma işlem hattı, Unity Catalog tarafından yönetilir ve sunucusuz hesaplama ile DLT (Dağıtık Defter Teknolojisi) tarafından desteklenir. Bkz. Lakeflow Connect.

Lakehouse Federasyonu

Azure Databricks için sorgu federasyon platformu. Sorgu federasyonu terimi, kullanıcıların ve sistemlerin tüm verileri birleşik bir sisteme geçirmeye gerek kalmadan birden çok veri kaynağında sorgu çalıştırmasına olanak tanıyan bir özellik koleksiyonunu açıklar. Azure Databricks, sorgu federasyonunu yönetmek için Unity Kataloğu'nu kullanır. Bkz. Lakehouse Federasyonu nedir?.

Lakehouse İzleme

Hesabınızdaki tüm tablolardaki verilerin istatistiksel özelliklerini ve kalitesini izler. Model girişleri ve tahminleri içeren çıkarım tablolarını izleyerek makine öğrenmesi modellerinin ve model sunma uç noktalarının performansını izlemek için de kullanabilirsiniz. Bakınız Databricks Lakehouse İzlemeye Giriş.

büyük dil modeli (LLM)

Açık uçlu soruları yanıtlama, sohbet, içerik özetleme, neredeyse rastgele yönergelerin yürütülmesi, çeviri, içerik ve kod oluşturma gibi görevler için tasarlanmış bir doğal dil işleme (NLP) modeli. LLM'ler, insan dilinin desenlerini ve yapılarını öğrenmek için gelişmiş makine öğrenmesi algoritmaları kullanılarak büyük veri kümelerinden eğitilir. Bkz . Databricks'te büyük dil modelleri (LLM'ler).

kütüphane

Kümenizde çalışan not defteri veya iş için kullanılabilen bir kod paketi. Databricks runtime'ları birçok kitaplık içerir ve kendi kitaplığınızı da yükleyebilirsiniz. Bkz. Kitaplıklar.

M

gerçekleştirilmiş görünüm

Daha düşük gecikme süresiyle veya yedekli hesaplama olmadan tekrar tekrar sorgulanabilmesi için önceden derlenmiş ve depolanmış bir görünüm. Bkz. Databricks SQL'de materyalize edilmiş görünümleri kullanma.

madalyon mimarisi

Lakehouse'daki verileri mantıksal olarak düzenlemek amacıyla kullanılan bir veri tasarımı deseni, mimarinin her katmanında (Bronz ⇒ Gümüş ⇒ Altın katman tablolarından) akan verilerin yapısını ve kalitesini artımlı ve aşamalı olarak geliştirme hedefini taşır. Madalyon göl evi mimarisi nedir?.

metastore

Sütun ve sütun türü bilgileri, verileri okumak ve yazmak için gerekli seri hale getiriciler ve seri durumdan çıkarıcılar ve verilerin depolandığı ilgili dosyalar dahil olmak üzere veri ambarında çeşitli tabloların ve bölümlerin tüm yapı bilgilerini depolayan bileşen. Bkz. Meta veri depoları.

MLflow

Deneme, yeniden üretilebilirlik ve dağıtım dahil olmak üzere uçtan uca makine öğrenmesi yaşam döngüsünü yönetmeye yönelik açık kaynak bir platform. Azure Databricks'te MLflow, kurumsal müşteriler için ek işlevlere sahip, ölçeklenebilir ve güvenli bir yönetilen MLflow dağıtımı sağlayan, tam olarak yönetilen bir hizmettir. Genel AI etkeni ve ML model yaşam döngüsü için MLflow'a bakın.

model eğitimi

Birçok popüler açık kaynak kitaplığını kullanarak Azure Databricks'te makine öğrenmesi ve derin öğrenme modellerini eğitma süreci. Bkz Yapay zeka ve ML modellerini eğitme.

Mozaik yapay zeka

Tahmine dayalı ML modellerinden en son üretken yapay zeka uygulamalarına kadar yapay zeka ve ML çözümleri oluşturmak, dağıtmak, değerlendirmek ve yönetmek için birleşik araçlar sağlayan özellik. Bkz . Databricks'te yapay zeka ve makine öğrenmesi.

Mozaik AI Model Sunucusu

Gerçek zamanlı ve toplu çıkarım için yapay zeka modellerini dağıtmaya, idare etmeye ve sorgulamaya yönelik birleşik arabirim. Bkz. Mozaik Yapay Zeka Modeli Sunmakullanarak modelleri dağıtma.

Mozaik Yapay Zeka Modeli Eğitimi

Bu özellik, verilerinizi kullanarak bir temel modeli özelleştirerek uygulamanızın performansını iyileştirmenizi sağlar. Tam parametre ince ayarı yaparak veya temel modelin eğitimine devam ederek, modeli sıfırdan eğitmeye kıyasla çok daha az veri, zaman ve işlem kaynağı kullanarak kendi modelinizi eğitebilirsiniz. Bkz. Temel Model İnce Ayarlama.

Mozaik AI Vektör Arama

Databricks Veri Zekası Platformu'na yerleşik olan ve idare ve üretkenlik araçlarıyla tümleştirilmiş bir vektör veritabanı. Bkz. Mozaik AI Vektör Araması.

N

notebook

Veri bilimcileri ve mühendisleri tarafından aynı belgede birden çok dilde (Python, Scala, SQL gibi) kod yazmak ve yürütmek için kullanılan etkileşimli bir web arabirimi. Bkz . Databricks not defterlerine giriş.

O

OAuth

OAuth, internet kullanıcılarının diğer web sitelerindeki bilgilerine erişim izni vermek için, ancak parolalarını paylaşmadan, web sitelerine veya uygulamalara erişim yetkilendirmesi yapmalarını sağlayan açık bir standarttır. Bkz. Azure Databricks kaynaklarına erişimi yetkilendirme.

P

İş Ortağı Bağlantısı

Çoğu kurumsal veri sistemine bağlanmak için bağımsız yazılım satıcıları tarafından sürdürülen tümleştirmeler sağlayan bir Databricks programı. Bkz Databricks İş Ortağı Bağlantısı nedir?.

kişisel erişim belirteci (PAT)

Parola yerine bilgisayar sistemine erişirken kullanıcının kimliğini doğrulamak için kullanılan karakter dizesi. Bkz. Azure Databricks kaynaklarına erişimi yetkilendirme.

Foton

SQL iş yüklerinizi ve DataFrame API'sini daha hızlı çağırarak iş yükü başına toplam maliyetinizi azaltan yüksek performanslı Databricks yerel vektörleştirilmiş sorgu altyapısı. Photon, Apache Spark API'leriyle uyumlu olduğundan mevcut kodunuzla çalışır. Bkz . Photon nedir?.

pipeline

Sistem tarafından belirlenen bir bağımlılık sırasına göre tembel bir şekilde güncellenen tablo, görünüm, maddileştirilmiş görünüm, akış ve çıktılardan oluşan bir DAG.

R

geri getirme destekli üretim (RAG)

Büyük bir dil modelinin (LLM) bir kullanıcının istemini dış bilgi kaynağından alınan destekleyici verilerle genişleterek zenginleştirilmiş yanıtlar oluşturmasını sağlayan teknik. RAG, alınan bu bilgileri birleştirerek LLM'nin istemleri ek bağlamla artırmamaya kıyasla daha doğru, daha yüksek kaliteli yanıtlar oluşturmasını sağlar. Bkz. Yapay zeka geliştirmede RAG'e giriş.

S

şeması (Unity Kataloğu)

Unity Catalog'da yer alan, tablolar, görünümler, birimler, modeller ve işlevleri içerebilen bir kataloğun çocuğu. Şema, Unity Kataloğu'nun üç düzeyli ad alanının (catalog.schema.table-etc) ikinci düzeyidir. Bkz. Unity Kataloğu nedir?.

sunucusuz işlem

Azure Databricks tarafından yönetilen işlem, yönetim yükünü azaltır ve kullanıcı üretkenliğini artırmak için anında işlem sağlar. Bkz Sunucusuz hesaplamaya bağlanma.

hizmet sorumlusu

Otomasyon araçları, iş süreçleri ve uygulamalarla kullanılmak üzere oluşturulmuş bir kimlik. Azure Databricks kullanıcısı ile aynı şekilde izinleri kullanarak bir hizmet sorumlusunun kaynaklara erişimini kısıtlayabilirsiniz. Azure Databricks kullanıcılarından farklı olarak hizmet sorumlusu yalnızca API'ye yönelik bir kimliktir; Azure Databricks kullanıcı arabirimine veya Databricks CLI'ya doğrudan erişemez. Bkz. Hizmet sorumlularını yönetme.

havuz (işlem hatları)

Havuz, dış sisteme (kafka, Kinesis, Delta gibi) yazan bir akışın hedefidir.

SQL ambarı

Azure Databricks'te verileri sorgulamanıza ve keşfetmenize olanak tanıyan bir işlem kaynağı. Bkz Bir SQL ambarına bağlanma.

akış işleme

İlişkisiz, sürekli büyüyen bir veri kümesine yönelik bir sorgu tanımlamanıza ve ardından küçük, artımlı toplu işlerde verileri işlemenize olanak tanıyan bir veri işleme yöntemi. Azure Databricks akış işleme, Yapılandırılmış Akış'ı kullanır. Bkz Akış ve artımlı veri alma.

streaming

Akış, bilgisayarlara ve mobil cihazlara İnternet üzerinden teslim edilen ve gerçek zamanlı olarak oynatılan tüm medya içeriklerini (canlı veya kaydedilmiş) (yani bir veri akışı) ifade eder. Bkz . Yapılandırılmış Akış kavramları.

akış analizi

Farklı kaynaklar tarafından sürekli oluşturulan verileri analiz etme işlemi. Azure Databricks, Yapılandırılmış Akış aracılığıyla akış analizini destekler ve gerçek zamanlı içgörüler için canlı verilerin işlenmesine ve analizine olanak sağlar.

Yapılandırılmış Akış

Spark SQL altyapısı üzerinde oluşturulmuş ölçeklenebilir ve hataya dayanıklı bir akış işleme altyapısı, akış sorguları olarak karmaşık hesaplamalar sağlar. Bkz . Yapılandırılmış Akış kavramları.

akış tabloları

Üzerine akış yazılan yönetilen tablo.

T

tablo

Tablo bir şemada bulunur ve veri satırları içerir. Databricks'te oluşturulan tüm tablolar varsayılan olarak Delta Lake kullanır. Delta Lake tarafından desteklenen tablolara Delta tabloları da denir. Bkz. Tablo nedir?.

tetiklenen işlem hattı

Her tablo için güncelleştirmenin başlangıcında kullanılabilir olan tüm verileri alan, bağımlılık sırasına göre çalışan ve sonra sonlandıran bir işlem hattı. Bkz. Tetiklenen ve sürekli işlem hattı modu.

U

Unity Kataloğu

Azure Databricks çalışma alanlarında merkezi erişim denetimi, denetleme, şecere ve veri bulma özellikleri sağlayan bir Azure Databricks özelliği. Bkz. Unity Kataloğu nedir?.

V

vektör veritabanı

Eklemeleri depolamak ve almak için iyileştirilmiş bir veritabanı. Eklemeler, genellikle metin veya görüntü verileri olan verilerin anlamsal içeriğinin matematiksel temsilleridir. Bkz. Mozaik AI Vektör Araması.

görünüm

SQL sorgusu tarafından tanımlanan sanal tablo. Verileri depolamaz, ancak bir veya daha fazla tablodaki verileri belirli bir biçimde veya soyutlamada sunmanın bir yolunu sağlar. Bkz. Görünüm nedir?.

veri kümeleri (Unity Kataloğu)

Tablosal olmayan veri kümeleri üzerinde idareyi etkinleştiren Unity Kataloğu nesneleri. Birimler, bulut nesnesi depolama konumundaki mantıksal depolama birimini temsil eder. Birimler dosyalara erişme, dosyaları depolama, yönetme ve düzenleme özellikleri sağlar. Bkz. Unity Kataloğu birimleri nelerdir?.

V

İş akışları

Azure Databricks'te veri işleme görevlerini zamanlamanıza ve düzenlemenize olanak sağlayan araçlar kümesi. Azure Databricks İş Akışlarını Azure Databricks İşleri'ni yapılandırmak için kullanırsınız. Databricks üzerinde orkestrasyona genel bakış için bkz. .

İş yükü

Bir görevi veya görev grubunu gerçekleştirmek için gereken işleme yeteneği miktarı. Azure Databricks iki tür iş yükü tanımlar: veri mühendisliği (iş) ve veri analizi (çok amaçlı). Bkz. Azure Databricks kavramları.

çalışma alanı

Databricks kullanıcılarının not defterleri, denemeler, sorgular ve panolar gibi nesneleri geliştirmesine, göz atmasına ve paylaşmasına olanak tanıyan bir kuruluş ortamı. Bkz. Çalışma alanında gezinme.