Perubahan Perilaku pada Pencarian Full-Text

Topik ini menjelaskan perubahan perilaku dalam pencarian teks lengkap. Perubahan perilaku memengaruhi cara kerja fitur atau berinteraksi di SQL Server 2014 dibandingkan dengan versi SQL Server sebelumnya.

Perubahan Perilaku dalam Pencarian Full-Text di SQL Server 2014

Informasi untuk datang nanti.

Perubahan Perilaku dalam Pencarian Full-Text di SQL Server 2012

SQL Server 2012 menginstal versi baru pemecah kata dan stemmer untuk bahasa Inggris AS (LCID 1033) dan Inggris Inggris (LCID 2057). Namun Anda dapat beralih ke versi sebelumnya dari komponen-komponen ini jika Anda ingin mempertahankan perilaku sebelumnya. Untuk informasi selengkapnya, lihat Mengubah Word Breaker yang Digunakan untuk Bahasa Inggris AS dan Inggris Inggris.

Pemutus dan Stemmer Word Baru Terpasang

SQL Server 2012 memperbarui semua pemecah kata dan stemmer yang digunakan oleh pencarian Full-Text dan Pencarian Semantik. Untuk konsistensi antara konten indeks dan hasil kueri, kami sarankan Anda mengisi ulang indeks teks lengkap yang ada.

  1. Ada pemecah kata baru untuk bahasa Inggris. Jika Anda harus mempertahankan perilaku sebelumnya, lihat Mengubah Word Breaker yang Digunakan untuk Bahasa Inggris AS dan Inggris Inggris Inggris.

  2. Pemecah kata pihak ketiga untuk Denmark, Polandia, dan Turki yang disertakan dengan rilis SQL Server sebelumnya telah diganti dengan komponen Microsoft. Komponen baru diaktifkan secara default.

  3. Ada pemecah kata baru untuk Ceko dan Yunani. Rilis SQL Server Full-Text Search sebelumnya tidak menyertakan dukungan untuk dua bahasa ini.

Perubahan Perilaku Pemutus dan Stemmer Word Baru

Komponen baru mungkin mengembalikan hasil yang berbeda dari komponen yang lebih lama saat Anda mengisi dan mengkueri indeks teks lengkap. Tabel berikut menunjukkan beberapa perbedaan yang dapat diharapkan dalam hasil bahasa Inggris.

Jika Anda harus mempertahankan perilaku pemecah kata dan stemmer sebelumnya, lihat topik berikut:

Dalam beberapa kasus, komponen baru mengembalikan lebih banyak hasil:

Jangka Waktu Hasil dengan pemecah kata dan stemmer sebelumnya Hasil dengan pemecah kata dan stemmer baru
kucing-anjing cat

anjing
cat

kucing-anjing

anjing
cat@dog.com cat

com

anjing
cat

cat@dog.com

com

anjing
12/11/2011

(di mana istilah adalah tanggal)
12/11/2011

dd20111211
11

12

12/11/2011

2011

dd20111211

Dalam beberapa kasus, komponen baru mengembalikan hasil yang sama :

Jangka Waktu Hasil dengan pemecah kata dan stemmer sebelumnya Hasil dengan pemecah kata dan stemmer baru
$ 100 $ 100

nn100$
$ 100

nn100usd
022 022

nn022
022

nn22
10:49

(di mana istilahnya adalah waktu)
10:49am

tt1049
10:49am

tt24104900

Dalam beberapa kasus, komponen baru mengembalikan lebih sedikit hasil atau hasil yang mungkin tidak terduga oleh aplikasi:

Jangka Waktu Hasil dengan pemecah kata dan stemmer sebelumnya Hasil dengan pemecah kata dan stemmer baru
jěˊÿqCžl

(di mana istilah tersebut bukan karakter bahasa Inggris yang valid)
'jěˊÿqCžl' je yq zl
tabel tabel

tabel
tabel
Kucing- cat

Kucing-
cat
v-z*(di mana v dan z adalah kata-kata kebisingan)* (tidak ada hasil) v-z
$100 000 USD $100

000

nn000

nn100$

Idr
$100 000 USD

nn100000usd
tanah A.S yang indah Cantik

land

Us

us
Cantik

land
Gunung. Kent dan Mt Challenger Challenger

Kent

mt

Gunung.
mt

Kent

Challenger

Perubahan Perilaku dalam Pencarian Full-Text di SQL Server 2008

Pada SQL Server 2008 dan versi yang lebih baru, mesin Full-Text terintegrasi sebagai layanan database ke dalam database relasional sebagai bagian dari kueri server dan infrastruktur mesin penyimpanan. Arsitektur pencarian teks lengkap baru mencapai tujuan berikut:

  • Penyimpanan terintegrasi dan pencarian management-Full-text sekarang terintegrasi langsung dengan fitur penyimpanan dan manajemen yang melekat SQL Server, dan layanan MSFTESQL tidak lagi ada.

    • Indeks teks lengkap disimpan di dalam grup file database, bukan dalam sistem file. Operasi administratif pada database, seperti membuat cadangan, secara otomatis memengaruhi indeks teks lengkapnya.

    • Katalog teks lengkap sekarang menjadi objek virtual yang bukan milik grup file apa pun; ini adalah konsep logis yang mengacu pada sekelompok indeks teks lengkap. Oleh karena itu, banyak fitur manajemen katalog telah ditolak, dan penghentian telah membuat perubahan yang melanggar untuk beberapa fitur. Untuk informasi selengkapnya, lihat Fitur Mesin Database yang Tidak Digunakan Lagi di SQL Server 2014 dan Melanggar Perubahan pada Pencarian Full-Text.

      Catatan

      SQL Server pernyataan DDL Transact-SQL 2005 yang menentukan katalog teks lengkap berfungsi dengan benar.

  • Pemrosesan kueri terintegrasi-Prosesor kueri pencarian teks lengkap baru adalah bagian dari Mesin Database dan sepenuhnya terintegrasi dengan prosesor kueri SQL Server. Ini berarti bahwa, pengoptimal kueri mengenali predikat kueri teks lengkap dan secara otomatis menjalankannya seefisien mungkin.

  • Administrasi yang disempurnakan dan pemecahan masalah-Pencarian teks lengkap terintegrasi menyediakan alat untuk membantu Anda menganalisis struktur pencarian seperti indeks teks lengkap, output pemecah kata tertentu, konfigurasi kata henti, dan sebagainya.

  • Stopwords dan stoplist telah menggantikan kata-kata kebisingan dan file noise-word. Daftar henti adalah objek database yang memfasilitasi tugas pengelolaan untuk stopword dan meningkatkan integritas antara instans server dan lingkungan yang berbeda. Untuk informasi selengkapnya, lihat Mengonfigurasi dan Mengelola Stopwords dan Stoplist untuk pencarian Full-Text.

  • SQL Server 2008 dan versi yang lebih baru menyertakan pemecah kata baru untuk banyak bahasa yang ada di SQL Server 2005. Hanya pemecah kata untuk bahasa Inggris, Korea, Thailand, dan Cina (semua bentuk) yang tetap sama. Untuk bahasa lain, jika katalog teks lengkap diimpor saat database SQL Server 2005 ditingkatkan ke SQL Server 2008 atau versi yang lebih baru, satu atau beberapa bahasa yang digunakan oleh indeks teks lengkap dalam katalog teks lengkap sekarang mungkin dikaitkan dengan pemecah kata baru yang mungkin bertingkah sedikit berbeda dari pemecah kata yang diimpor. Untuk informasi selengkapnya tentang cara memastikan konsistensi antara kueri dan konten indeks teks lengkap, lihat Meningkatkan Full-Text Pencarian.

  • Layanan FDHOST Launcher (MSSQLFDLauncher) baru telah ditambahkan. Untuk informasi selengkapnya, lihat Mulai menggunakan Full-Text Search.

  • Pengindeksan teks lengkap berfungsi dengan kolom FILESTREAM dengan cara yang sama seperti yang dilakukannya dengan varbinary(max) kolom. Tabel FILESTREAM harus memiliki kolom yang berisi ekstensi nama file untuk setiap BLOB FILESTREAM. Untuk informasi selengkapnya, lihat Kueri dengan pencarian Full-Text, Mengonfigurasi dan Mengelola Filter untuk Pencarian, dan sys.fulltext_document_types (Transact-SQL).

    Mesin teks lengkap mengindeks konten BLOB FILESTREAM. Mengindeks file seperti gambar mungkin tidak berguna. Ketika BLOB FILESTREAM diperbarui, blob tersebut diindeks ulang.

Lihat juga

Pencarian Teks Lengkap
Kompatibilitas Mundur Pencarian Teks Lengkap
Mutakhirkan Pencarian Full-Text
Mulai dengan Pencarian Teks Lengkap