Penyimpanan vektor yang terintegrasi dalam Azure DocumentDB

Gunakan database vektor terintegrasi di Azure DocumentDB untuk menyambungkan aplikasi berbasis AI dengan data Anda yang disimpan di Azure DocumentDB dengan lancar. Integrasi ini dapat mencakup aplikasi yang Anda buat dengan menggunakan embedding Azure OpenAI. Database vektor terintegrasi asli memungkinkan Anda menyimpan, mengindeks, dan mengkueri data vektor dimensi tinggi secara efisien yang disimpan langsung di Azure DocumentDB, bersama dengan data asli tempat data vektor dibuat. Ini menghilangkan kebutuhan untuk mentransfer data Anda ke penyimpanan vektor alternatif dan dikenakan biaya tambahan.

Apa itu penyimpanan vektor?

Penyimpanan vektor atau database vektor adalah database yang dirancang untuk menyimpan dan mengelola penyematan vektor, yang merupakan representasi matematika data dalam ruang dimensi tinggi. Dalam ruang ini, setiap dimensi sesuai dengan fitur data, dan puluhan ribu dimensi mungkin digunakan untuk mewakili data canggih. Posisi vektor dalam ruang ini mewakili karakteristiknya. Kata, frasa, atau seluruh dokumen, dan gambar, audio, dan jenis data lainnya semuanya dapat di-vektorisasi.

Bagaimana cara kerja penyimpanan vektor?

Di penyimpanan vektor, algoritma pencarian vektor digunakan untuk mengindeks dan meminta embedding. Beberapa algoritma pencarian vektor terkenal termasuk Hierarkis Navigable Small World (HNSW), Inverted File (IVF), dan DiskANN. Pencarian vektor adalah metode yang membantu Anda menemukan item serupa berdasarkan karakteristik data mereka, bukan dengan mencocokkan secara tepat pada bidang properti. Teknik ini berguna dalam aplikasi seperti mencari teks serupa, menemukan gambar terkait, membuat rekomendasi, atau bahkan mendeteksi anomali. Ini digunakan untuk mengkueri penyematan vektor (daftar angka) dari data yang Anda buat dengan model pembelajaran mesin menggunakan API penyematan. Contoh API penyematan adalah penyematan Azure OpenAI atau Hugging Face di Azure. Pencarian vektor mengukur jarak antara vektor data dan vektor kueri Anda. Vektor data yang paling dekat dengan vektor kueri Anda adalah vektor yang ditemukan paling mirip secara semantik.

Dalam database vektor terintegrasi di Azure DocumentDB, Anda dapat menyimpan, mengindeks, dan melakukan kueri embedding bersamaan dengan data asli. Pendekatan ini menghilangkan biaya tambahan untuk mereplikasi data dalam database vektor murni terpisah. Selain itu, arsitektur ini menjaga penyematan vektor dan data asli bersama-sama, yang lebih memfasilitasi operasi data multimodal, dan memungkinkan konsistensi, skala, dan performa data yang lebih besar.

Kasus penggunaan database vektor

Database vektor digunakan di banyak area AI dan analisis data. Mereka membantu dengan tugas seperti memahami bahasa alami, mengenali gambar dan video, membangun sistem rekomendasi, dan mendukung fitur pencarian. Anda dapat menemukannya di aplikasi AI analitik dan AI generatif.

Misalnya, Anda dapat menggunakan database vektor untuk:

Identifikasi gambar, dokumen, dan lagu serupa berdasarkan konten, tema, sentimen, dan gayanya.
Identifikasi produk serupa berdasarkan karakteristik, fitur, dan grup pengguna mereka.
Merekomendasikan konten, produk, atau layanan berdasarkan preferensi individu.
Merekomendasikan konten, produk, atau layanan berdasarkan kesamaan grup pengguna.
Identifikasi opsi potensial yang paling sesuai dari kumpulan pilihan besar untuk memenuhi persyaratan yang kompleks.
Identifikasi anomali data atau aktivitas penipuan yang berbeda dari pola dominan atau normal.
Terapkan memori persisten untuk agen AI.
Aktifkan retrieval-augmented generation (RAG).

Database vektor terintegrasi vs. database vektor murni

Ada dua jenis umum implementasi database vektor: database vektor murni dan database vektor terintegrasi dalam database NoSQL atau relasional.

Database vektor murni secara efisien menyimpan dan mengelola penyematan vektor bersama dengan sejumlah kecil metadata. Ini terpisah dari sumber data yang darinya embedding berasal.

Database vektor yang terintegrasi dalam NoSQL berkinerja tinggi atau database relasional menyediakan kemampuan ekstra. Database vektor terintegrasi dalam database NoSQL atau relasional dapat menyimpan, mengindeks, dan melakukan kueri embedding bersama dengan data asli yang sesuai. Pendekatan ini menghilangkan biaya tambahan untuk mereplikasi data dalam database vektor murni terpisah. Selain itu, menjaga penyematan vektor dan data asli bersama-sama lebih memfasilitasi operasi data multimodal dan memungkinkan konsistensi, skala, dan performa data yang lebih besar.

Database vektor sumber terbuka

Saat pengembang memilih database vektor, opsi sumber terbuka memberikan banyak manfaat. Sumber terbuka berarti bahwa kode sumber perangkat lunak tersedia secara bebas, memungkinkan pengguna untuk menyesuaikan database sesuai dengan kebutuhan spesifik mereka. Fleksibilitas ini bermanfaat bagi organisasi yang tunduk pada persyaratan peraturan unik untuk data, seperti perusahaan di industri jasa keuangan.

Keuntungan lain dari database vektor sumber terbuka adalah dukungan komunitas yang kuat yang mereka nikmati. Komunitas pengguna aktif sering berkontribusi pada pengembangan database ini, memberikan dukungan, dan berbagi praktik terbaik, mempromosikan inovasi.

Beberapa individu memilih database vektor sumber terbuka karena mereka "gratis", yang berarti tidak ada biaya untuk memperoleh atau menggunakan perangkat lunak. Alternatifnya adalah menggunakan tingkat gratis yang ditawarkan oleh layanan database vektor terkelola. Layanan terkelola ini tidak hanya menyediakan akses bebas biaya hingga batas penggunaan tertentu tetapi juga menyederhanakan beban operasional dengan menangani pemeliharaan, pembaruan, dan skalabilitas. Oleh karena itu, dengan menggunakan tingkat gratis layanan database vektor terkelola, Anda dapat mencapai penghematan biaya sambil mengurangi overhead manajemen. Pendekatan ini memungkinkan Anda untuk lebih fokus pada aktivitas inti Anda daripada pada administrasi database.

Pilih database vektor sumber terbuka terbaik

Memilih database vektor sumber terbuka terbaik perlu mempertimbangkan beberapa faktor. Performa dan skalabilitas database sangat penting, karena memengaruhi apakah database dapat menangani persyaratan beban kerja spesifik Anda. Database dengan kemampuan pengindeksan dan kueri yang efisien biasanya menawarkan performa optimal. Faktor lain adalah dukungan dan dokumentasi komunitas yang tersedia untuk database. Komunitas yang kuat dan dokumentasi yang cukup dapat memberikan bantuan yang berharga. Misalnya, DocumentDB adalah database vektor sumber terbuka yang populer:

Opsi paling populer mungkin bukan pilihan terbaik untuk Anda. Dengan demikian, Anda harus membandingkan opsi yang berbeda berdasarkan fitur, jenis data yang didukung, dan kompatibilitas dengan alat dan kerangka kerja yang ada yang Anda gunakan. Anda juga harus mengingat tantangan database vektor sumber terbuka.

Tantangan database vektor sumber terbuka

Sebagian besar database vektor sumber terbuka, termasuk yang tercantum sebelumnya, adalah database vektor murni. Dengan kata lain, mereka dirancang untuk menyimpan dan mengelola penyematan vektor saja, bersama dengan sejumlah kecil metadata. Karena bekerja secara terpisah dari data asli Anda, Anda perlu memindahkan data di antara layanan yang berbeda. Kompleksitas ini menambah biaya tambahan, membuat semuanya lebih kompleks, dan dapat memperlambat sistem produksi Anda.

Mereka juga menimbulkan tantangan yang khas dari database sumber terbuka:

Penyiapan: Anda memerlukan pengetahuan mendalam untuk menginstal, mengonfigurasi, dan mengoperasikan database, terutama untuk penyebaran yang kompleks. Mengoptimalkan sumber daya dan konfigurasi saat meningkatkan skala operasi memerlukan pemantauan dan penyesuaian yang ketat.
Pemeliharaan: Anda harus mengelola pembaruan, patch, dan pemeliharaan Anda sendiri. Keahlian pembelajaran mesin tidak cukup; Anda juga harus memiliki pengalaman luas dalam administrasi database.
Dukungan: Dukungan resmi dapat dibatasi dibandingkan dengan layanan terkelola, mengandalkan lebih banyak bantuan komunitas.

Oleh karena itu, meskipun awalnya gratis, database vektor sumber terbuka dikenakan biaya yang signifikan saat meningkatkan skala. Memperluas operasi membutuhkan lebih banyak perangkat keras, staf IT terampil, dan manajemen infrastruktur canggih, yang menyebabkan pengeluaran yang lebih tinggi dalam perangkat keras, personel, dan biaya operasional. Penskalaan database vektor sumber terbuka bisa memerlukan biaya besar meskipun tidak ada biaya lisensi.

Mengatasi tantangan database vektor sumber terbuka

Database vektor yang dikelola sepenuhnya yang terintegrasi dalam database NoSQL atau relasional yang sangat berkinerja tinggi menghindari biaya tambahan dan kompleksitas database vektor sumber terbuka. Sebuah database semacam itu menyimpan, mengindeks, dan mengkueri penyematan bersama data asli yang sesuai. Pendekatan ini menghilangkan biaya tambahan untuk mereplikasi data dalam database vektor murni terpisah. Selain itu, menjaga penyematan vektor dan data asli bersama-sama lebih memfasilitasi operasi data multimodal, dan memungkinkan konsistensi, skala, dan performa data yang lebih besar. Sementara itu, layanan yang dikelola sepenuhnya membantu pengembang menghindari kerepotan dalam menyiapkan, memelihara, dan mengandalkan bantuan komunitas untuk database vektor sumber terbuka. Selain itu, beberapa layanan database vektor terkelola menawarkan tingkat gratis seumur hidup.

Contohnya adalah database vektor terintegrasi di Azure DocumentDB. Penyiapan ini memungkinkan pengembang untuk menghemat uang seperti yang mereka lakukan dengan database vektor sumber terbuka. Tetapi tidak seperti opsi sumber terbuka, penyedia layanan mengurus pemeliharaan, pembaruan, dan penskalaan untuk Anda. Peningkatan cepat dan mudah sambil menjaga total biaya kepemilikan (TCO) yang rendah ketika saatnya untuk meningkatkan operasi. Anda juga dapat menggunakan layanan ini untuk menskalakan aplikasi MongoDB dengan mudah yang sudah dalam produksi.

Melakukan pencarian kesamaan vektor

Azure DocumentDB menyediakan kemampuan pencarian vektor yang kuat, memungkinkan Anda melakukan pencarian kesamaan berkecepatan tinggi di seluruh himpunan data yang kompleks. Untuk melakukan pencarian vektor di Azure DocumentDB, Anda harus terlebih dahulu membuat indeks vektor. Meskipun Azure DocumentDB menawarkan beberapa opsi, berikut adalah beberapa panduan umum untuk membantu Anda memulai berdasarkan ukuran himpunan data Anda:

	IVF	HNSW	DiskANN (disarankan)
Deskripsi	Indeks IVFFlat membagi vektor menjadi daftar, lalu mencari subset yang paling dekat dengan vektor kueri.	Indeks HNSW membuat grafik multilayer.	DiskANN adalah algoritma pencarian tetangga terdekat secara perkiraan yang dirancang untuk pencarian vektor yang efisien pada skala apa pun.
Trade-off penting	Pro: Waktu build yang lebih cepat, penggunaan memori yang lebih rendah. Kontra: Performa kueri yang lebih rendah (dalam hal kompromi antara kecepatan dan pengingatan).	Kelebihan: Performa kueri yang lebih baik (dalam hal trade-off antara kecepatan dan recall) dapat dicapai pada tabel kosong. Kontra: Waktu build yang lebih lambat, penggunaan memori yang lebih tinggi.	Pro: Efisien dalam skala apa pun, pengenalan tinggi, throughput tinggi, latensi rendah.
Jumlah vektor	Di bawah 10.000	Hingga 50.000	Hingga 500.000+
Tingkat kluster yang direkomendasikan	M10 atau M20	M30 dan yang lebih tinggi	M30 dan yang lebih tinggi

Anda dapat menggunakan indeks DiskANN pada M30 dan tingkat yang lebih tinggi. Untuk membuat indeks DiskANN, atur "kind" parameter ke "vector-diskann" mengikuti templat ini:

{ 
    "createIndexes": "<collection_name>",
    "indexes": [
        {
            "name": "<index_name>",
            "key": {
                "<path_to_property>": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-diskann", 
                "dimensions": <integer_value>,
                "similarity": <string_value>,
                "maxDegree" : <integer_value>, 
                "lBuild" : <integer_value>, 
            } 
        } 
    ] 
}

Ladang	Tipe	Description
`index_name`	string	Nama unik indeks.
`path_to_property`	string	Jalur ke properti yang berisi vektor. Jalur ini bisa menjadi properti tingkat atas atau jalur notasi titik ke properti . Vektor harus menjadi `number[]` agar dapat diindeks dan digunakan dalam hasil pencarian vektor. Vektor yang menggunakan jenis lain, seperti `double[]`, mencegah dokumen diindeks. Dokumen yang tidak diindeksa tidak dikembalikan dalam hasil pencarian vektor.
`kind`	string	Jenis indeks vektor yang akan dibuat. Opsinya adalah `vector-ivf`, , `vector-hnsw`dan `vector-diskann`.
`dimensions`	integer	Jumlah dimensi untuk kesamaan vektor. DiskANN mendukung hingga 16.000 dimensi (dengan kuantisasi produk), dengan dukungan masa depan direncanakan untuk mencapai lebih dari 40.000.
`similarity`	string	Metrik kesamaan untuk digunakan dengan indeks. Opsi yang mungkin adalah `COS` (jarak kosinus), `L2` (jarak Euclidean), dan `IP` (produk dalam).
`maxDegree`	integer	Jumlah maksimum tepi per simpul dalam grafik. Parameter ini berkisar dari 20 hingga 2048 (defaultnya adalah 32). Lebih tinggi `maxDegree` cocok untuk himpunan data dengan dimensi tinggi dan/atau persyaratan akurasi tinggi.
`lBuild`	integer	Menetapkan jumlah tetangga kandidat yang dievaluasi selama konstruksi indeks DiskANN. Parameter ini, yang berkisar dari 10 hingga 500 (defaultnya adalah 50), menyeimbangkan akurasi dan overhead komputasi: nilai yang lebih tinggi meningkatkan kualitas dan akurasi indeks tetapi meningkatkan waktu build

Melakukan pencarian vektor dengan DiskANN

Untuk melakukan pencarian vektor, gunakan $search tahap alur agregasi, dan kueri dengan cosmosSearch operator. DiskANN memungkinkan pencarian berkinerja tinggi di seluruh himpunan data besar dengan pemfilteran opsional seperti filter geospasial atau berbasis teks.

{
  "$search": {
    "cosmosSearch": {
      "path": "<path_to_property>",
      "query": "<query_vector>",  
      "k": <num_results_to_return>,  
      "filter": {"$and": [
        { "<attribute_1>": { "$eq": <value> } },
        {"<location_attribute>": {"$geoWithin": {"$centerSphere":[[<longitude_integer_value>, <latitude_integer_value>], <radius>]}}}
      ]}
    }
  }
},

Ladang	Tipe	Description
`lSearch`	integer	Menentukan ukuran daftar kandidat dinamis untuk pencarian. Nilai defaultnya adalah 40, dengan rentang yang dapat dikonfigurasi dari 10 hingga 1000. Meningkatkan nilai meningkatkan pengenalan tetapi dapat mengurangi kecepatan pencarian.
`k`	integer	Menentukan jumlah hasil pencarian yang akan dikembalikan. Nilai `k` harus kurang dari atau sama dengan `lSearch`.

Contoh menggunakan indeks DiskANN dengan pemfilteran

Menambahkan vektor ke database Anda

Untuk menggunakan pencarian vektor dengan filter geospasial, tambahkan dokumen yang menyertakan penyematan vektor dan koordinat lokasi. Anda dapat membuat embeddings dengan menggunakan model Anda sendiri, Azure OpenAI embeddings, atau API seperti Hugging Face di Azure.

from pymongo import MongoClient

client = MongoClient("<your_connection_string>")
db = client["test"]
collection = db["testCollection"]

documents = [
    {"name": "Eugenia Lopez", "bio": "CEO of AdventureWorks", "is_open": 1, "location": [-118.9865, 34.0145], "contentVector": [0.52, 0.20, 0.23]},
    {"name": "Cameron Baker", "bio": "CFO of AdventureWorks", "is_open": 1, "location": [-0.1278, 51.5074], "contentVector": [0.55, 0.89, 0.44]},
    {"name": "Jessie Irwin", "bio": "Director of Our Planet initiative", "is_open": 0, "location": [-118.9865, 33.9855], "contentVector": [0.13, 0.92, 0.85]},
    {"name": "Rory Nguyen", "bio": "President of Our Planet initiative", "is_open": 1, "location": [-119.0000, 33.9855], "contentVector": [0.91, 0.76, 0.83]}
]

collection.insert_many(documents)

Membuat indeks vektor DiskANN

Contoh berikut menunjukkan cara menyiapkan indeks vektor DiskANN dengan kemampuan pemfilteran. Contoh ini termasuk membuat indeks vektor untuk pencarian kesamaan, menambahkan dokumen dengan properti vektor dan geospasial, dan bidang pengindeksan untuk pemfilteran lebih lanjut.

db.command({
    "createIndexes": "testCollection",
    "indexes": [
        {
            "name": "DiskANNVectorIndex",
            "key": {
                "contentVector": "cosmosSearch"
            },
            "cosmosSearchOptions": {
                "kind": "vector-diskann",
                "dimensions": 3,
                "similarity": "COS",
                "maxDegree": 32,
                "lBuild": 64
            }
        },
        { 
            "name": "is_open",
            "key": { 
                "is_open": 1 
            }      
        },
        {
            "name": "locationIndex",
            "key": {
                "location": 1
            }
        }
    ]
})

Perintah ini membuat indeks vektor DiskANN pada contentVector bidang di exampleCollection, memungkinkan pencarian kesamaan. Ini juga menambahkan:

Indeks pada kolom is_open, Anda dapat memfilter hasil berdasarkan apakah bisnis sedang buka.
Indeks geospasial pada location bidang untuk memfilter berdasarkan kedekatan geografis.

Melakukan pencarian vektor

Untuk menemukan dokumen dengan vektor serupa dalam radius geografis tertentu, tentukan untuk pencarian kesamaan queryVector dan sertakan filter geospasial.

query_vector = [0.52, 0.28, 0.12]
pipeline = [
    {
        "$search": {
            "cosmosSearch": {
                "path": "contentVector",
                "vector": query_vector,
                "k": 5,
                "filter": {
                    "$and": [
                        {"is_open": {"$eq": 1}},
                        {"location": {"$geoWithin": {"$centerSphere": [[-119.7192861804, 34.4102485028], 100 / 3963.2]}}}
                    ]
                }
            }
        }
    }
]

results = list(collection.aggregate(pipeline))
for result in results:
    print(result)

Dalam contoh ini, pencarian kesamaan vektor mengembalikan vektor terdekat teratas k berdasarkan metrik kesamaan yang ditentukan COS , sementara memfilter hasil untuk hanya menyertakan bisnis terbuka dalam radius 100 mil.

[
  {
    similarityScore: 0.9745354109084544,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'CEO of AdventureWorks',
      is_open: 1,
      location: [-118.9865, 34.0145],
      contentVector: [0.52, 0.20, 0.23]
    }
  },
  {
    similarityScore: 0.9006955671333992,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'President of Our Planet initiative',
      is_open: 1,
      location: [-119.7302, 34.4005],
      contentVector: [0.91, 0.76, 0.83]
    }
  }
]

Hasil ini menunjukkan dokumen paling mirip dengan queryVector; dibatasi dalam radius 100 mil dan bisnis yang beroperasi. Setiap hasil mencakup skor kesamaan dan metadata, menunjukkan bagaimana DiskANN di Azure DocumentDB mendukung kueri vektor dan geospasial gabungan untuk pengalaman pencarian yang diperkaya dan sensitif lokasi.

Anda dapat membuat indeks HNSW pada M30 dan tingkat kluster yang lebih tinggi. Untuk membuat indeks dunia kecil yang dapat dinavigasi hierarkis (HNSW), Anda perlu membuat indeks vektor dengan parameter yang "kind" diatur untuk "vector-hnsw" mengikuti templat ini:

{ 
    "createIndexes": "<collection_name>",
    "indexes": [
        {
            "name": "<index_name>",
            "key": {
                "<path_to_property>": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-hnsw", 
                "m": <integer_value>, 
                "efConstruction": <integer_value>, 
                "similarity": "<string_value>", 
                "dimensions": <integer_value> 
            } 
        } 
    ] 
}

Ladang	Tipe	Description
`m`	integer	Jumlah maksimum koneksi per lapisan (16 secara default, nilai minimum adalah 2, nilai maksimum adalah 100). M yang lebih tinggi cocok untuk himpunan data dengan dimensi tinggi dan/atau persyaratan akurasi tinggi.
`efConstruction`	integer	ukuran daftar kandidat dinamis untuk membuat grafik (64 secara default, nilai minimum adalah 4, nilai maksimum adalah 1000). Hasil `efConstruction` yang lebih tinggi memberikan kualitas indeks yang lebih baik dan akurasi yang lebih tinggi, tetapi juga menambah waktu yang diperlukan untuk membangun indeks. `efConstruction` harus setidaknya `2 * m`

Melakukan pencarian vektor dengan HNSW

Untuk melakukan pencarian vektor, gunakan $search tahap alur agregasi dan cosmosSearch operator.

{
    "$search": {
        "cosmosSearch": {
            "vector": <query_vector>,
            "path": "<path_to_property>",
            "k": <num_results_to_return>,
            "efSearch": <integer_value>
        },
    }
}

Ladang	Tipe	Description
`efSearch`	integer	Ukuran daftar kandidat dinamis untuk pencarian (40 secara default). Nilai yang lebih tinggi memberikan pengenalan yang lebih baik dengan biaya kecepatan.

Nota

Membuat indeks HNSW dengan himpunan data besar dapat mengakibatkan sumber daya Azure DocumentDB Anda kehabisan memori, atau dapat membatasi performa operasi lain yang berjalan di database Anda. Jika Anda mengalami masalah tersebut, skalakan sumber daya Anda ke tingkat kluster yang lebih tinggi, atau buat indeks vektor DiskANN baru.

Contoh menggunakan indeks HNSW

Contoh berikut menunjukkan kepada Anda cara mengindeks vektor, menambahkan dokumen yang memiliki properti vektor, melakukan pencarian vektor, dan mengambil konfigurasi indeks.

use test;

db.createCollection("exampleCollection");

db.runCommand({ 
    "createIndexes": "exampleCollection",
    "indexes": [
        {
            "name": "VectorSearchIndex",
            "key": {
                "contentVector": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-hnsw", 
                "m": 16, 
                "efConstruction": 64, 
                "similarity": "COS", 
                "dimensions": 3
            } 
        } 
    ] 
});

Perintah ini membuat indeks HNSW pada properti contentVector dalam dokumen yang disimpan di dalam koleksi yang disebutkan, exampleCollection. Properti cosmosSearchOptions menentukan parameter untuk indeks vektor HNSW. Jika dokumen Anda memiliki vektor yang disimpan di properti berlapis, Anda dapat mengatur properti ini dengan menggunakan jalur notasi titik. Misalnya, Anda dapat menggunakan text.contentVector jika contentVector merupakan subproperti dari text.

Menambahkan vektor ke database Anda

Untuk menambahkan vektor ke koleksi database Anda, pertama-tama Anda perlu membuat embeddings dengan menggunakan model Anda sendiri, Azure OpenAI embeddings, atau API seperti Hugging Face on Azure. Dalam contoh ini, Anda menambahkan dokumen baru melalui penyematan sampel:

db.exampleCollection.insertMany([
  {name: "Eugenia Lopez", bio: "Eugenia is the CEO of AdvenureWorks.", contentVector: [0.51, 0.12, 0.23]},
  {name: "Cameron Baker", bio: "Cameron Baker CFO of AdvenureWorks.", contentVector: [0.55, 0.89, 0.44]},
  {name: "Jessie Irwin", bio: "Jessie Irwin is the former CEO of AdventureWorks and now the director of the Our Planet initiative.", contentVector: [0.13, 0.92, 0.85]},
  {name: "Rory Nguyen", bio: "Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.", contentVector: [0.91, 0.76, 0.83]},
]);

Melakukan pencarian vektor

Melanjutkan dengan contoh terakhir, buat vektor lain, queryVector. Pencarian vektor mengukur jarak antara queryVector dan vektor di contentVector jalur dokumen Anda. Anda dapat mengatur jumlah hasil yang dikembalikan pencarian dengan mengatur parameter k, yang diatur ke 2 di sini. Anda juga dapat mengatur efSearch, yang merupakan bilangan bulat yang mengontrol ukuran daftar vektor kandidat. Nilai yang lebih tinggi mungkin meningkatkan akurasi, tetapi pencarian lebih lambat sebagai hasilnya. Parameter ini bersifat opsional dengan nilai default 40.

const queryVector = [0.52, 0.28, 0.12];
db.exampleCollection.aggregate([
  {
    "$search": {
        "cosmosSearch": {
            "vector": queryVector,
            "path": "contentVector",
            "k": 2,
            "efSearch": 40
        },
    }
  }
}
]);

Dalam contoh ini, Anda melakukan pencarian vektor dengan menggunakan queryVector sebagai input melalui shell Mongo. Hasil pencarian adalah daftar dua item yang paling mirip dengan vektor kueri, diurutkan berdasarkan skor kesamaannya.

[
  {
    similarityScore: 0.9465376,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'Eugenia is the CEO of AdvenureWorks.',
      vectorContent: [ 0.51, 0.12, 0.23 ]
    }
  },
  {
    similarityScore: 0.9006955,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.',
      vectorContent: [ 0.91, 0.76, 0.83 ]
    }
  }
]

Untuk membuat indeks vektor menggunakan algoritma IVF, gunakan templat berikut createIndexes dan atur "kind" parameter ke "vector-ivf":

{
  "createIndexes": "<collection_name>",
  "indexes": [
    {
      "name": "<index_name>",
      "key": {
        "<path_to_property>": "cosmosSearch"
      },
      "cosmosSearchOptions": {
        "kind": "vector-ivf",
        "numLists": <integer_value>,
        "similarity": "<string_value>",
        "dimensions": <integer_value>
      }
    }
  ]
}

Ladang	Tipe	Description
`numLists`	integer	Bilangan bulat ini adalah jumlah kluster yang digunakan indeks IVF untuk mengelompokkan data vektor. Atur `numLists` ke `documentCount/1000` hingga 1 juta dokumen dan atur ke `sqrt(documentCount)` untuk lebih dari 1 juta dokumen. Menggunakan nilai `numLists` sebesar 1 mirip dengan melakukan metode pencarian brute-force, yang memiliki kinerja terbatas.

Important

numLists Mengatur parameter dengan benar penting untuk mencapai akurasi dan performa yang baik. Atur numLists ke documentCount/1000 hingga 1 juta dokumen. Untuk lebih dari 1 juta dokumen, gunakan indeks vektor DiskANN untuk hasil yang optimal.

Seiring bertambahnya jumlah item dalam database Anda, Anda harus menyetel numLists agar lebih besar untuk mencapai performa latensi yang baik untuk pencarian vektor.

Jika Anda bereksperimen dengan skenario baru atau membuat demo kecil, Anda dapat mulai dengan numLists disetel ke 1 untuk melakukan pencarian brute-force di semua vektor. Pengaturan ini memberikan hasil yang paling akurat dari pencarian vektor, tetapi kecepatan pencarian dan latensi lebih lambat. Setelah penyiapan awal Anda, sesuaikan parameter numLists menggunakan panduan sebelumnya.

Melakukan pencarian vektor dengan IVF

Untuk melakukan pencarian vektor, gunakan $search tahap alur agregasi dalam kueri MongoDB. Untuk menggunakan cosmosSearch indeks, gunakan operator baru cosmosSearch .

{
  {
  "$search": {
    "cosmosSearch": {
        "vector": <query_vector>,
        "path": "<path_to_property>",
        "k": <num_results_to_return>,
      },
      "returnStoredSource": True }},
  {
    "$project": { "<custom_name_for_similarity_score>": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
}

Untuk mengambil skor kesamaan (searchScore) bersama dengan dokumen yang ditemukan oleh pencarian vektor, gunakan $project operator untuk menyertakan searchScore dan mengganti namanya seperti <custom_name_for_similarity_score> dalam hasil. Kemudian dokumen juga diproyeksikan sebagai objek berlapis. Skor kesamaan dihitung menggunakan metrik yang ditentukan dalam indeks vektor.

Important

Untuk dapat diindeks, vektor harus merupakan number[]. Vektor yang menggunakan jenis lain, seperti double[], mencegah dokumen diindeks. Dokumen yang tidak diindeksa tidak dikembalikan dalam hasil pencarian vektor.

Contoh menggunakan indeks IVF

Pengindeksan File Terbalik (IVF) adalah metode yang mengatur vektor ke dalam kluster. Selama pencarian vektor, vektor kueri pertama kali dibandingkan dengan pusat kluster ini. Pencarian kemudian dilakukan dalam kluster yang pusatnya paling dekat dengan vektor kueri.

Parameter numLists menentukan jumlah kluster yang akan dibuat. Satu kluster menyiratkan bahwa pencarian dilakukan terhadap semua vektor dalam database; mirip dengan pencarian brute-force atau kNN. Pengaturan ini memberikan akurasi tertinggi tetapi juga latensi tertinggi.

Meningkatkan nilai numLists menghasilkan lebih banyak kluster, dengan setiap kluster berisi lebih sedikit vektor. Misalnya, jika numLists=2, setiap kluster berisi lebih banyak vektor daripada jika numLists=3, dan sebagainya. Lebih sedikit vektor per kluster mempercepat pencarian (latensi yang lebih rendah, kueri yang lebih tinggi per detik). Namun, ini meningkatkan kemungkinan kehilangan vektor paling mirip dalam database Anda ke vektor kueri. Masalah ini disebabkan oleh sifat pengklusteran yang tidak sempurna, di mana pencarian mungkin berfokus pada satu kluster sementara vektor "terdekat" aktual berada di kluster yang berbeda.

Parameter nProbes mengontrol jumlah kluster yang akan dicari. Secara default, nilainya adalah 1, yang berarti hanya mencari kluster dengan pusat yang paling dekat dengan vektor kueri. Meningkatkan nilai ini memungkinkan pencarian untuk mencakup lebih banyak kluster, meningkatkan akurasi tetapi juga meningkatkan latensi (sehingga mengurangi kueri per detik) karena lebih banyak kluster dan vektor sedang dicari.

Contoh berikut menunjukkan kepada Anda cara mengindeks vektor, menambahkan dokumen yang memiliki properti vektor, melakukan pencarian vektor, dan mengambil konfigurasi indeks.

Membuat indeks vektor

use test;

db.createCollection("exampleCollection");

db.runCommand({
  createIndexes: 'exampleCollection',
  indexes: [
    {
      name: 'vectorSearchIndex',
      key: {
        "vectorContent": "cosmosSearch"
      },
      cosmosSearchOptions: {
        kind: 'vector-ivf',
        numLists: 3,
        similarity: 'COS',
        dimensions: 3
      }
    }
  ]
});

Perintah ini membuat vector-ivf indeks terhadap vectorContent properti dalam dokumen yang disimpan dalam koleksi yang ditentukan, exampleCollection. Properti cosmosSearchOptions menentukan parameter untuk indeks vektor IVF. Jika dokumen Anda memiliki vektor yang disimpan di properti berlapis, Anda dapat mengatur properti ini dengan menggunakan jalur notasi titik. Misalnya, Anda dapat menggunakan text.vectorContent jika vectorContent merupakan subproperti dari text.

Menambahkan vektor ke database Anda

db.exampleCollection.insertMany([
  {name: "Eugenia Lopez", bio: "Eugenia is the CEO of AdvenureWorks.", vectorContent: [0.51, 0.12, 0.23]},
  {name: "Cameron Baker", bio: "Cameron Baker CFO of AdvenureWorks.", vectorContent: [0.55, 0.89, 0.44]},
  {name: "Jessie Irwin", bio: "Jessie Irwin is the former CEO of AdventureWorks and now the director of the Our Planet initiative.", vectorContent: [0.13, 0.92, 0.85]},
  {name: "Rory Nguyen", bio: "Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.", vectorContent: [0.91, 0.76, 0.83]},
]);

Melakukan pencarian vektor

Untuk melakukan pencarian vektor, gunakan $search tahap alur agregasi dalam kueri MongoDB. Untuk menggunakan cosmosSearch indeks, gunakan operator baru cosmosSearch .

{
  {
  "$search": {
    "cosmosSearch": {
        "vector": <vector_to_search>,
        "path": "<path_to_property>",
        "k": <num_results_to_return>,
      },
      "returnStoredSource": True }},
  {
    "$project": { "<custom_name_for_similarity_score>": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
}

Vektor pencarian dan jarak vektor (skor kesamaan) dengan menggunakan $search

Melanjutkan dengan contoh terakhir, buat vektor lain, queryVector. Pencarian vektor mengukur jarak antara queryVector dan vektor di vectorContent jalur dokumen Anda. Anda dapat mengatur jumlah hasil yang dikembalikan pencarian dengan mengatur parameter k, yang diatur ke 2 di sini. Anda juga dapat mengatur nProbes, yang merupakan bilangan bulat yang mengontrol jumlah kluster terdekat yang diperiksa di setiap pencarian. Nilai yang lebih tinggi dapat meningkatkan akurasi namun pencarian lebih lambat sebagai hasilnya. Parameter ini bersifat opsional dengan nilai default 1 dan tidak boleh lebih besar dari numLists nilai yang ditentukan dalam indeks vektor.

const queryVector = [0.52, 0.28, 0.12];
db.exampleCollection.aggregate([
  {
    $search: {
      "cosmosSearch": {
        "vector": queryVector,
        "path": "vectorContent",
        "k": 2
      },
    "returnStoredSource": true }},
  {
    "$project": { "similarityScore": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
]);

[
  {
    similarityScore: 0.9465376,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'Eugenia is the CEO of AdvenureWorks.',
      vectorContent: [ 0.51, 0.12, 0.23 ]
    }
  },
  {
    similarityScore: 0.9006955,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.',
      vectorContent: [ 0.91, 0.76, 0.83 ]
    }
  }
]

Mendapatkan definisi indeks vektor

Untuk mengambil definisi indeks vektor Anda dari koleksi, gunakan listIndexes perintah :

db.exampleCollection.getIndexes();

Dalam contoh ini, vectorIndex dikembalikan dengan semua cosmosSearch parameter yang digunakan untuk membuat indeks:

[
  { v: 2, key: { _id: 1 }, name: '_id_', ns: 'test.exampleCollection' },
  {
    v: 2,
    key: { vectorContent: 'cosmosSearch' },
    name: 'vectorSearchIndex',
    cosmosSearch: {
      kind: <index_type>, // options are `vector-ivf`, `vector-hnsw`, and `vector-diskann`
      numLists: 3,
      similarity: 'COS',
      dimensions: 3
    },
    ns: 'test.exampleCollection'
  }
]

Pencarian vektor yang difilter

Anda sekarang dapat menjalankan pencarian vektor dengan filter kueri yang didukung seperti $lt, , $lte, $eq, $neq$gte, $gt, $in, $nin, dan $regex.

Untuk menggunakan prafilter, Anda harus terlebih dahulu menentukan indeks standar pada properti yang ingin Anda filter, selain indeks vektor Anda. Berikut adalah contoh pembuatan indeks filter:

db.runCommand({
  "createIndexes": "<collection_name>",
  "indexes": [ {
    "key": {
      "<property_to_filter>": 1
    },
    "name": "<name_of_filter_index>"
  }
  ]
});

Setelah indeks filter Anda diberlakukan, Anda dapat menambahkan "filter" klausa langsung ke kueri pencarian vektor Anda. Contoh ini memperlihatkan cara memfilter hasil di mana "title" nilai properti tidak ada dalam daftar yang disediakan:

db.exampleCollection.aggregate([
  {
    '$search': {
      "cosmosSearch": {
        "vector": "<query_vector>",
        "path": <path_to_vector>,
        "k": num_results,
        "filter": {<property_to_filter>: {"$nin": ["not in this text", "or this text"]}}
      },
      "returnStoredSource": True }},
  {'$project': { 'similarityScore': { '$meta': 'searchScore' }, 'document' : '$$ROOT' }
}
]);

Important

Untuk mengoptimalkan performa dan akurasi pencarian vektor yang telah difilter, pertimbangkan untuk menyesuaikan parameter indeks vektor Anda. Untuk indeks DiskANN , meningkatkan maxDegree atau lBuild mungkin menghasilkan hasil yang lebih baik. Untuk indeks HNSW , bereksperimen dengan nilai yang lebih tinggi untuk m, efConstruction, atau efSearch dapat meningkatkan performa. Demikian pula, untuk indeks IVF , penyetelan numLists , atau nProbes dapat menyebabkan hasil yang lebih memuaskan. Sangat penting untuk menguji konfigurasi spesifik Anda dengan data Anda untuk memastikan hasilnya memenuhi kebutuhan Anda. Parameter ini memengaruhi struktur indeks dan perilaku pencarian, dan nilai optimal dapat bervariasi berdasarkan karakteristik data dan pola kueri Anda.

Menggunakan alat orkestrasi model bahasa besar (LLM)

Gunakan sebagai database vektor dengan Kernel Semantik

Gunakan Kernel Semantik untuk mengatur pengambilan informasi Anda dari Azure DocumentDB dan LLM Anda. Untuk informasi selengkapnya, lihat repositori GitHub.

Gunakan sebagai database vektor dengan LangChain

Gunakan LangChain untuk mengatur pengambilan informasi Anda dari Azure DocumentDB dan LLM Anda. Untuk informasi selengkapnya, lihat integrasi LangChain untuk Azure DocumentDB.

Gunakan sebagai cache semantik dengan LangChain

Gunakan LangChain dan Azure DocumentDB untuk mengatur Penembolokan Semantik, menggunakan respons LLM yang direkam sebelumnya yang dapat menghemat biaya LLM API Anda dan mengurangi latensi untuk respons. Untuk informasi selengkapnya, lihat integrasi LangChain dengan Azure DocumentDB.

Fitur dan batasan

Metrik jarak yang didukung: L2 (Euclidean), produk dalam, dan kosinus.
Metode pengindeksan yang didukung: IVFFLAT, HNSW, dan DiskANN.
Dengan DiskANN dan kuantisasi produk, Anda dapat mengindeks vektor hingga 16.000 dimensi.
Menggunakan HNSW atau IVF dengan presisi setengah memungkinkan pengindeksan vektor hingga 4.000 dimensi.
Tanpa pemadatan apa pun, dimensi vektor maksimum default untuk pengindeksan adalah 2.000.
Pengindeksan hanya berlaku untuk satu vektor per jalur.
Anda hanya dapat membuat satu indeks per jalur vektor.

RINGKASAN

Panduan ini menunjukkan cara membuat indeks vektor, menambahkan dokumen yang memiliki data vektor, melakukan pencarian kesamaan, dan mengambil definisi indeks. Dengan menggunakan database vektor terintegrasi kami, Anda dapat menyimpan, mengindeks, dan mengkueri data vektor dimensi tinggi secara efisien langsung di Azure DocumentDB. Ini memungkinkan Anda untuk membuka potensi penuh data Anda melalui penyematan vektor, dan memberdayakan Anda untuk membangun aplikasi yang lebih akurat, efisien, dan kuat.

.NET solusi referensi pola RAG untuk ritel
Pola C# RAG - Mengintegrasikan Layanan OpenAI dengan Cosmos
Pola Python RAG - Chatbot produk Azure
Python notebook tutorial - Integrasi database vektor melalui LangChain
Tutorial Notebook Python - Integrasi LLM Caching melalui LangChain
Integrasi Python - LlamaIndex
Python - integrasi memori Kernel Semantik

Langkah selanjutnya

Membuat kluster tingkat bebas seumur hidup untuk Azure DocumentDB

Saran dan Komentar

Apakah halaman ini membantu?

Last updated on 2026-04-27

Penyimpanan vektor yang terintegrasi dalam Azure DocumentDB

Apa itu penyimpanan vektor?

Bagaimana cara kerja penyimpanan vektor?

Kasus penggunaan database vektor

Database vektor terintegrasi vs. database vektor murni

Database vektor sumber terbuka

Pilih database vektor sumber terbuka terbaik

Tantangan database vektor sumber terbuka

Mengatasi tantangan database vektor sumber terbuka

Melakukan pencarian kesamaan vektor

Melakukan pencarian vektor dengan DiskANN

Contoh menggunakan indeks DiskANN dengan pemfilteran

Menambahkan vektor ke database Anda

Membuat indeks vektor DiskANN

Melakukan pencarian vektor

Mendapatkan definisi indeks vektor

Pencarian vektor yang difilter

Menggunakan alat orkestrasi model bahasa besar (LLM)

Gunakan sebagai database vektor dengan Kernel Semantik

Gunakan sebagai database vektor dengan LangChain

Gunakan sebagai cache semantik dengan LangChain

Fitur dan batasan

RINGKASAN

Konten terkait

Langkah selanjutnya

Saran dan Komentar

Sumber Daya Tambahan: