Perubahan Perilaku pada Pencarian Full-Text
Topik ini menjelaskan perubahan perilaku dalam pencarian teks lengkap. Perubahan perilaku memengaruhi cara kerja fitur atau berinteraksi di SQL Server 2014 dibandingkan dengan versi SQL Server sebelumnya.
Perubahan Perilaku dalam Pencarian Full-Text di SQL Server 2014
Informasi untuk datang nanti.
Perubahan Perilaku dalam Pencarian Full-Text di SQL Server 2012
SQL Server 2012 menginstal versi baru pemecah kata dan stemmer untuk bahasa Inggris AS (LCID 1033) dan Inggris Inggris (LCID 2057). Namun Anda dapat beralih ke versi sebelumnya dari komponen-komponen ini jika Anda ingin mempertahankan perilaku sebelumnya. Untuk informasi selengkapnya, lihat Mengubah Word Breaker yang Digunakan untuk Bahasa Inggris AS dan Inggris Inggris.
Pemutus dan Stemmer Word Baru Terpasang
SQL Server 2012 memperbarui semua pemecah kata dan stemmer yang digunakan oleh pencarian Full-Text dan Pencarian Semantik. Untuk konsistensi antara konten indeks dan hasil kueri, kami sarankan Anda mengisi ulang indeks teks lengkap yang ada.
Ada pemecah kata baru untuk bahasa Inggris. Jika Anda harus mempertahankan perilaku sebelumnya, lihat Mengubah Word Breaker yang Digunakan untuk Bahasa Inggris AS dan Inggris Inggris Inggris.
Pemecah kata pihak ketiga untuk Denmark, Polandia, dan Turki yang disertakan dengan rilis SQL Server sebelumnya telah diganti dengan komponen Microsoft. Komponen baru diaktifkan secara default.
Ada pemecah kata baru untuk Ceko dan Yunani. Rilis SQL Server Full-Text Search sebelumnya tidak menyertakan dukungan untuk dua bahasa ini.
Perubahan Perilaku Pemutus dan Stemmer Word Baru
Komponen baru mungkin mengembalikan hasil yang berbeda dari komponen yang lebih lama saat Anda mengisi dan mengkueri indeks teks lengkap. Tabel berikut menunjukkan beberapa perbedaan yang dapat diharapkan dalam hasil bahasa Inggris.
Jika Anda harus mempertahankan perilaku pemecah kata dan stemmer sebelumnya, lihat topik berikut:
Mengubah Word Breaker yang Digunakan untuk Bahasa Inggris AS dan Inggris Inggris
Mengembalikan pemecah Word yang Digunakan oleh Pencarian ke Versi Sebelumnya
Dalam beberapa kasus, komponen baru mengembalikan lebih banyak hasil:
Jangka Waktu | Hasil dengan pemecah kata dan stemmer sebelumnya | Hasil dengan pemecah kata dan stemmer baru |
---|---|---|
kucing-anjing | cat anjing |
cat kucing-anjing anjing |
cat@dog.com | cat com anjing |
cat cat@dog.com com anjing |
12/11/2011 (di mana istilah adalah tanggal) |
12/11/2011 dd20111211 |
11 12 12/11/2011 2011 dd20111211 |
Dalam beberapa kasus, komponen baru mengembalikan hasil yang sama :
Jangka Waktu | Hasil dengan pemecah kata dan stemmer sebelumnya | Hasil dengan pemecah kata dan stemmer baru |
---|---|---|
$ 100 | $ 100 nn100$ |
$ 100 nn100usd |
022 | 022 nn022 |
022 nn22 |
10:49 (di mana istilahnya adalah waktu) |
10:49am tt1049 |
10:49am tt24104900 |
Dalam beberapa kasus, komponen baru mengembalikan lebih sedikit hasil atau hasil yang mungkin tidak terduga oleh aplikasi:
Jangka Waktu | Hasil dengan pemecah kata dan stemmer sebelumnya | Hasil dengan pemecah kata dan stemmer baru |
---|---|---|
jěˊÿqCžl (di mana istilah tersebut bukan karakter bahasa Inggris yang valid) |
'jěˊÿqCžl' | je yq zl |
tabel | tabel tabel |
tabel |
Kucing- | cat Kucing- |
cat |
v-z*(di mana v dan z adalah kata-kata kebisingan)* | (tidak ada hasil) | v-z |
$100 000 USD | $100 000 nn000 nn100$ Idr |
$100 000 USD nn100000usd |
tanah A.S yang indah | Cantik land Us us |
Cantik land |
Gunung. Kent dan Mt Challenger | Challenger Kent mt Gunung. |
mt Kent Challenger |
Perubahan Perilaku dalam Pencarian Full-Text di SQL Server 2008
Pada SQL Server 2008 dan versi yang lebih baru, mesin Full-Text terintegrasi sebagai layanan database ke dalam database relasional sebagai bagian dari kueri server dan infrastruktur mesin penyimpanan. Arsitektur pencarian teks lengkap baru mencapai tujuan berikut:
Penyimpanan terintegrasi dan pencarian management-Full-text sekarang terintegrasi langsung dengan fitur penyimpanan dan manajemen yang melekat SQL Server, dan layanan MSFTESQL tidak lagi ada.
Indeks teks lengkap disimpan di dalam grup file database, bukan dalam sistem file. Operasi administratif pada database, seperti membuat cadangan, secara otomatis memengaruhi indeks teks lengkapnya.
Katalog teks lengkap sekarang menjadi objek virtual yang bukan milik grup file apa pun; ini adalah konsep logis yang mengacu pada sekelompok indeks teks lengkap. Oleh karena itu, banyak fitur manajemen katalog telah ditolak, dan penghentian telah membuat perubahan yang melanggar untuk beberapa fitur. Untuk informasi selengkapnya, lihat Fitur Mesin Database yang Tidak Digunakan Lagi di SQL Server 2014 dan Melanggar Perubahan pada Pencarian Full-Text.
Catatan
SQL Server pernyataan DDL Transact-SQL 2005 yang menentukan katalog teks lengkap berfungsi dengan benar.
Pemrosesan kueri terintegrasi-Prosesor kueri pencarian teks lengkap baru adalah bagian dari Mesin Database dan sepenuhnya terintegrasi dengan prosesor kueri SQL Server. Ini berarti bahwa, pengoptimal kueri mengenali predikat kueri teks lengkap dan secara otomatis menjalankannya seefisien mungkin.
Administrasi yang disempurnakan dan pemecahan masalah-Pencarian teks lengkap terintegrasi menyediakan alat untuk membantu Anda menganalisis struktur pencarian seperti indeks teks lengkap, output pemecah kata tertentu, konfigurasi kata henti, dan sebagainya.
Stopwords dan stoplist telah menggantikan kata-kata kebisingan dan file noise-word. Daftar henti adalah objek database yang memfasilitasi tugas pengelolaan untuk stopword dan meningkatkan integritas antara instans server dan lingkungan yang berbeda. Untuk informasi selengkapnya, lihat Mengonfigurasi dan Mengelola Stopwords dan Stoplist untuk pencarian Full-Text.
SQL Server 2008 dan versi yang lebih baru menyertakan pemecah kata baru untuk banyak bahasa yang ada di SQL Server 2005. Hanya pemecah kata untuk bahasa Inggris, Korea, Thailand, dan Cina (semua bentuk) yang tetap sama. Untuk bahasa lain, jika katalog teks lengkap diimpor saat database SQL Server 2005 ditingkatkan ke SQL Server 2008 atau versi yang lebih baru, satu atau beberapa bahasa yang digunakan oleh indeks teks lengkap dalam katalog teks lengkap sekarang mungkin dikaitkan dengan pemecah kata baru yang mungkin bertingkah sedikit berbeda dari pemecah kata yang diimpor. Untuk informasi selengkapnya tentang cara memastikan konsistensi antara kueri dan konten indeks teks lengkap, lihat Meningkatkan Full-Text Pencarian.
Layanan FDHOST Launcher (MSSQLFDLauncher) baru telah ditambahkan. Untuk informasi selengkapnya, lihat Mulai menggunakan Full-Text Search.
Pengindeksan teks lengkap berfungsi dengan kolom FILESTREAM dengan cara yang sama seperti yang dilakukannya dengan
varbinary(max)
kolom. Tabel FILESTREAM harus memiliki kolom yang berisi ekstensi nama file untuk setiap BLOB FILESTREAM. Untuk informasi selengkapnya, lihat Kueri dengan pencarian Full-Text, Mengonfigurasi dan Mengelola Filter untuk Pencarian, dan sys.fulltext_document_types (Transact-SQL).Mesin teks lengkap mengindeks konten BLOB FILESTREAM. Mengindeks file seperti gambar mungkin tidak berguna. Ketika BLOB FILESTREAM diperbarui, blob tersebut diindeks ulang.
Lihat juga
Pencarian Teks Lengkap
Kompatibilitas Mundur Pencarian Teks Lengkap
Mutakhirkan Pencarian Full-Text
Mulai dengan Pencarian Teks Lengkap