Linux に SQL Server フルテキスト検索をインストールする
適用対象:SQL Server - Linux
以下の手順では、Linux に SQL Server フルテキスト検索 (mssql-server-fts) をインストールします。 フルテキスト検索を使うと、SQL Server テーブル内の文字ベースのデータに対してフルテキスト クエリを実行できます。 このリリースの既知の問題については、リリース ノートをご覧ください。
注意
SQL Server フルテキスト検索をインストールする前に、まず SQL Server をインストールしてください。 これにより、mssql-server-fts パッケージをインストールするときに使うキーとリポジトリが構成されます。
ご自身のプラットフォームに合わせて SQL Server フルテキスト検索をインストールします。
RHEL へのインストール
次のコマンドを使って、Red Hat Enterprise Linux に mssql-server-fts をインストールします。
sudo yum install -y mssql-server-fts
既に mssql-server-fts をインストールしている場合は、次のコマンドを使って最新バージョンに更新できます。
sudo yum check-update
sudo yum update mssql-server-fts
オフライン インストールが必要な場合は、リリース ノートに記載されているフルテキスト検索のパッケージのダウンロードを探します。 次に、SQL Server のインストールの記事で説明されているのと同じオフライン インストール手順を使用します。
Ubuntu へのインストール
次のコマンドを使って、Ubuntu に mssql-server-fts をインストールします。
sudo apt-get update
sudo apt-get install -y mssql-server-fts
既に mssql-server-fts をインストールしている場合は、次のコマンドを使って最新バージョンに更新できます。
sudo apt-get update
sudo apt-get install -y mssql-server-fts
オフライン インストールが必要な場合は、リリース ノートに記載されているフルテキスト検索のパッケージのダウンロードを探します。 次に、SQL Server のインストールの記事で説明されているのと同じオフライン インストール手順を使用します。
SLES へのインストール
次のコマンドを使って、SUSE Linux Enterprise Server に mssql-server-fts をインストールします。
sudo zypper install mssql-server-fts
既に mssql-server-fts をインストールしている場合は、次のコマンドを使って最新バージョンに更新できます。
sudo zypper refresh
sudo zypper update mssql-server-fts
オフライン インストールが必要な場合は、リリース ノートに記載されているフルテキスト検索のパッケージのダウンロードを探します。 次に、SQL Server のインストールの記事で説明されているのと同じオフライン インストール手順を使用します。
サポートされている言語
フルテキスト検索では、言語に基づいて個々の単語の識別方法を決定する、ワード ブレーカーが使われています。 sys.fulltext_languages カタログ ビューに対してクエリを実行することで、登録されているワード ブレーカーの一覧を取得できます。 以下の言語のワード ブレーカーが SQL Server と共にインストールされます。
言語 | 言語 ID |
---|---|
中立 | 0 |
アラビア語 | 1025 |
ベンガル語 (インド) | 1093 |
ブークモール | 1044 |
ポルトガル語 (ブラジル) | 1046 |
英語 (U.K.) | 2057 |
ブルガリア語 | 1026 |
カタロニア語 | 1027 |
中国語 (中華人民共和国香港特別行政区) | 3076 |
中国語 (中華人民共和国マカオ特別行政区) | 5124 |
中国語 (シンガポール) | 4100 |
クロアチア語 | 1050 |
チェコ語 | 1029 |
デンマーク語 | 1030 |
オランダ語 | 1043 |
英語 | 1033 |
フランス語 | 1036 |
ドイツ語 | 1031 |
ギリシャ語 | 1032 |
グジャラート語 | 1095 |
ヘブライ語 | 1037 |
ヒンディー語 | 1081 |
アイスランド語 | 1039 |
インドネシア語 | 1057 |
イタリア語 | 1040 |
日本語 | 1041 |
カンナダ語 | 1099 |
韓国語 | 1042 |
ラトビア語 | 1062 |
リトアニア語 | 1063 |
マレー語 - マレーシア | 1086 |
マラヤーラム語 | 1100 |
マラーティー語 | 1102 |
ポーランド語 | 1045 |
ポルトガル語 | 2070 |
パンジャーブ語 | 1094 |
ルーマニア語 | 1048 |
ロシア語 | 1049 |
セルビア語 (キリル) | 3098 |
セルビア語 (ラテン) | 2074 |
簡体中国語 | 2052 |
スロバキア語 | 1051 |
スロベニア語 | 1060 |
スペイン語 | 3082 |
スウェーデン語 | 1053 |
タミル語 | 1097 |
テルグ語 | 1098 |
タイ語 | 1054 |
Traditional Chinese | 1028 |
トルコ語 | 1055 |
ウクライナ語 | 1058 |
ウルドゥ語 | 1056 |
ベトナム語 | 1066 |
フィルター
フルテキスト検索では、バイナリ ファイルに格納されているテキストも操作できます。 ただし、この場合は、ファイルを処理するためにインストール済みのフィルターが必要です。 フィルターの詳細については、「検索用フィルターの構成と管理」をご覧ください。
インストールされているフィルターの一覧を確認するには、sp_help_fulltext_system_components 'filter' を呼び出します。 SQL Server には、以下のフィルターがインストールされています。
[コンポーネント名] | クラス ID | Version |
---|---|---|
.a | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.ans | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.asc | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.ascx | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.asm | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.asp | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.aspx | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.asx | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.bas | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.bat | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.bcp | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.c | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.cc | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.cls | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.cmd | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.cpp | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.cs | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.csa | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.css | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.csv | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.cxx | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.dbs | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.def | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.dic | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.dos | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.dsp | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.dsw | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.ext | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.faq | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.fky | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.h | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.hhc | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.hpp | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.hta | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.htm | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.html | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.htt | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.htw | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.htx | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.hxx | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.i | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.ibq | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.ics | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.idl | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.idq | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.inc | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.inf | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.ini | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.inl | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.inx | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.jav | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.java | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.js | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.kci | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.lgn | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.log | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.lst | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.m3u | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.mak | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.mk | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.odc | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.odh | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.odl | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.pkgdef | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.pkgundef | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.pl | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.prc | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.rc | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.rc2 | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.rct | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.reg | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.rgs | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.rtf | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.rul | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.s | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.scc | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.shtm | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.shtml | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.snippet | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.sol | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.sor | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.srf | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.stm | E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.tab | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.tdl | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.tlh | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.tli | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.trg | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.txt | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.udf | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.udt | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.url | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.usr | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.vbs | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.viw | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.vsct | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.vsixlangpack | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.vsixmanifest | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.vspscc | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.vsscc | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.vssscc | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.wri | C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.wtx | C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.xml | 41B9BE05-B3AF-460C-BF0B-2CDD44A093B1 | 12.0.9735.0 |
セマンティック検索
フルテキスト検索の機能に基づくセマンティック検索では、統計的に関連性があるキー フレーズを抽出してインデックスを作成します。 これにより、データベースのドキュメント内の意味に対してクエリを実行できるようになります。 また、これは類似したドキュメントを識別するのにも役立ちます。
セマンティック検索を使用するためには、まず使用するコンピューターにセマンティック言語統計データベースを復元する必要があります。
sqlcmd などのツールを使い、Linux の SQL Server インスタンス上で次の Transact-SQL コマンドを実行します。 このコマンドによって、言語統計データベースが復元されます。
RESTORE DATABASE [semanticsdb] FROM DISK = N'/opt/mssql/misc/semanticsdb.bak' WITH FILE = 1, MOVE N'semanticsdb' TO N'/var/opt/mssql/data/semanticsDB.mdf', MOVE N'semanticsdb_log' TO N'/var/opt/mssql/data/semanticsdb_log.ldf', NOUNLOAD, STATS = 5 GO
注意
必要に応じて、使用する構成に合うように前の RESTORE コマンドに含まれているパスを更新してください。
次の Transact-SQL コマンドを実行して、セマンティック言語統計データベースを登録します。
EXEC sp_fulltext_semantic_register_language_statistics_db @dbname = N'semanticsdb'; GO
次のステップ
フルテキスト検索の詳細については、SQL Server フルテキスト検索に関する記事をご覧ください。