Pendahuluan

Selesai

Pencarian semantik menambah pencarian kata kunci standar dengan kesamaan semantik. Kesamaan ini berarti kueri untuk "cerah" dapat mencocokkan teks "cahaya alami yang terang" meskipun tidak ada tumpang tindih kata lebih dari satu huruf. Alih-alih kesamaan karakter, pencarian semantik menggunakan vektor penyematan yang diproduksi oleh kecerdasan buatan (AI) untuk mengukur kesamaan kueri dan dokumen, memberikan hasil pencarian yang lebih relevan.

Modul ini menunjukkan cara mengaktifkan pencarian semantik di server fleksibel Azure Database for PostgreSQL dan cara menggunakan Azure OpenAI untuk menghasilkan penyematan vektor.

Diagram Azure Database dengan ekstensi vektor dan azure_ai.

Skenario

Misalkan Anda bekerja di perusahaan yang mengelola daftar properti liburan. Anda ingin mengizinkan pelanggan mencari dan memesan iklan secara online. Salah satu tantangannya adalah berbagai kata yang digunakan orang untuk menggambarkan hal yang sama. Anda memiliki sumber daya terbatas untuk mengembangkan dan memelihara daftar kata kunci saat deskripsi berubah dan properti datang dan pergi, dan entri kata kunci manual rawan kesalahan. Anda ingin memberikan hasil pencarian yang relevan tanpa daftar kata kunci manual.

Tujuan pembelajaran

Anda mendapatkan gambaran umum tentang pencarian semantik, penyematan, dan database vektor. Kemudian, Anda mengaktifkan ekstensi pgvector dan azure_ai. Dengan ekstensi ini, Anda akan menjalankan pencarian semantik melalui kolom vektor yang dihasilkan dari penyematan Azure OpenAI menggunakan azure_ai ekstensi. Terakhir, Anda menulis fungsi pencarian yang menerima string kueri, menghasilkan penyematan untuk kueri tersebut, dan menjalankan pencarian semantik terhadap database.

Pada akhir sesi ini, Anda dapat menjalankan pencarian semantik menggunakan database server fleksibel Azure Database for PostgreSQL terhadap penyematan vektor yang dihasilkan oleh Azure OpenAI.