Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Penyimpanan vektor digunakan dalam berbagai domain dan situasi di seluruh AI analitik dan generatif, termasuk pemrosesan bahasa alami, pengenalan video dan gambar, sistem rekomendasi, dan pencarian.
Apa itu penyimpanan vektor?
Penyimpanan vektor (juga disebut database vektor) adalah database yang menyimpan dan mengelola penyematan vektor. Penyematan vektor adalah representasi matematika data dalam ruang dimensi tinggi.
Dalam ruang ini, setiap dimensi sesuai dengan fitur data. Puluhan ribu dimensi mungkin digunakan untuk mewakili data canggih. Posisi vektor dalam ruang ini mewakili karakteristiknya. Kata, frasa, seluruh dokumen, gambar, audio, dan jenis data lainnya semuanya dapat di-vektorisasi.
Bagaimana cara kerja penyimpanan vektor?
Di penyimpanan vektor, Anda menggunakan algoritma pencarian vektor untuk mengindeks dan mengkueri penyematan. Algoritma pencarian vektor yang terkenal meliputi Disk Approximate Nearest Neighbor (DiskANN), Hierarki Navigable Small World (HNSW), dan File Terbalik dengan Kompresi Rata (IVFFlat).
Pencarian vektor adalah metode yang membantu Anda menemukan item serupa berdasarkan karakteristik data mereka, bukan dengan mencocokkan secara tepat pada bidang properti. Teknik ini berguna dalam aplikasi seperti mencari teks serupa, menemukan gambar terkait, membuat rekomendasi, atau bahkan mendeteksi anomali.
Pencarian vektor digunakan untuk mengkueri penyematan vektor data yang Anda buat dengan menggunakan model pembelajaran mesin, melalui API penyematan. Contoh API penyematan adalah Azure OpenAI Embeddings dan Hugging Face di Azure.
Pencarian vektor mengukur jarak antara vektor data dan vektor kueri Anda. Vektor data yang paling dekat dengan vektor kueri Anda adalah vektor yang paling mirip secara semantik.
Saat Anda menggunakan Azure Database for PostgreSQL sebagai penyimpanan vektor, Anda dapat menyimpan, mengindeks, dan menyematkan kueri bersama data asli. Pendekatan ini menghilangkan biaya tambahan untuk mereplikasi data dalam database vektor murni yang terpisah.
Arsitektur ini juga menjaga penyematan vektor dan data asli bersama-sama. Menjaga penyematan dan data bersama-sama lebih memfasilitasi operasi data multimodal. Ini juga memungkinkan konsistensi, skala, dan performa data yang lebih besar.