FILESTREAM (SQL Server)

適用対象:SQL Server - Windows のみ

FILESTREAM を使用すると、SQL Server ベースのアプリケーションで非構造化データ (ドキュメントやイメージなど) をファイル システムに格納できます。 これにより、ファイル システムの豊富なストリーミング API と高いパフォーマンスをアプリケーションで使用できるほか、非構造化データとそれに対応する構造化データの間でトランザクションの一貫性も維持されます。

FILESTREAM では、varbinary (max) BLOB (バイナリ ラージ オブジェクト) データをファイル システムにファイルとして格納することにより、SQL Server データベース エンジンと NTFS ファイル システムまたは ReFS ファイル システムが統合されます。 Transact-SQL ステートメントでは、FILESTREAM データの挿入、更新、クエリ、検索、バックアップを行うことができます。 Win32 ファイル システム インターフェイスによるデータへのストリーミング アクセスが可能になります。

FILESTREAM では、NT システム キャッシュを使用してファイル データをキャッシュします。 システム キャッシュ内のファイルをキャッシュすると、FILESTREAM データがデータベース エンジンのパフォーマンスに与える影響を軽減できます。 SQL Server のバッファー プールは使用されないため、そのメモリはクエリの処理に使用できます。

FILESTREAM は、SQL Server をインストールまたはアップグレードしたときに自動的には有効になりません。 FILESTREAM は、SQL Server 構成マネージャーと SQL Server Management Studio を使用して有効にする必要があります。 FILESTREAM を使用するには、特殊なファイル グループを格納するためにデータベースを作成または変更する必要があります。 次に、テーブルを作成または変更して、FILESTREAM 属性を格納する varbinary(max) 列を含めます。 これらの手順を完了すると、Transact-SQL および Win32 を使用して FILESTREAM データを管理できるようになります。

FILESTREAM を使用する場合

SQL Server では、BLOB を、データをテーブルに格納する標準の varbinary(max) データとして使用することも、データをファイル システムに格納する FILESTREAM varbinary(max) オブジェクトとして使用することもできます。 データベース ストレージとファイル システム ストレージのどちらを使用するかは、データのサイズと用途によって決まります。 次の条件が true の場合は、FILESTREAM を使用することを検討する必要があります。

  • 格納するオブジェクトの平均的なサイズが 1 MB より大きい。
  • 高速な読み取りアクセスが重要とされる。
  • アプリケーション ロジックに中間層を使用するアプリケーションを開発している。

比較的小さなオブジェクトの場合は、 varbinary(max) BLOB をデータベースに格納する方が一般に高いストリーミング パフォーマンスが得られます。

FILESTREAM ストレージ

FILESTREAM ストレージは、データを BLOB としてファイル システムに格納する varbinary(max) 列として実装されます。 BLOB のサイズはファイル システムのボリューム サイズによってのみ制限されます。 ファイル システムに格納される BLOB には、標準の varbinary(max) の制限 (ファイル サイズ 2 GB) は適用されません。

列のデータをファイル システムに格納するように指定するには、 varbinary(max) 列で FILESTREAM 属性を指定します。 データベース エンジンでは、この属性により、その列のすべてのデータがファイル システム (データベース ファイル以外の場所) に格納されるようになります。

FILESTREAM データは FILESTREAM ファイル グループに格納する必要があります。 FILESTREAM ファイル グループは特殊なファイル グループで、ファイルそのものではなくファイル システム ディレクトリが含まれます。 これらのファイル システム ディレクトリは、 データ コンテナーと呼ばれます。 データ コンテナーは、データベース エンジン ストレージとファイル システム ストレージの間のインターフェイスです。

FILESTREAM ストレージを使用する際は、以下の点を考慮してください。

  • テーブルに FILESTREAM 列が含まれている場合には、各行に NULL 以外の一意の行 ID が必要です。
  • FILESTREAM ファイル グループには、複数のデータ コンテナーを追加できます。
  • FILESTREAM データ コンテナーを入れ子にすることはできません。
  • フェールオーバー クラスタリングを使用している場合は、FILESTREAM ファイル グループが共有ディスク リソース上に存在する必要があります。
  • FILESTREAM ファイル グループは、圧縮されたボリューム上にあってもかまいません。

管理の統合

FILESTREAM は varbinary(max) 列として実装され、直接データベース エンジンに統合されているため、SQL Server の管理ツールや関数のほとんどを FILESTREAM データで使用できます。FILESTREAM データに変更を加える必要もありません。 たとえば、すべてのバックアップ モデルと復旧モデルを FILESTREAM データで使用できるため、FILESTREAM データをデータベースの構造化データと共にバックアップできます。 FILESTREAM データをリレーショナル データと共にバックアップしない場合は、部分バックアップを使用して FILESTREAM ファイル グループを除外できます。

Integrated Security

SQL Server の FILESTREAM データは、その他のデータと同じように、テーブルまたは列のレベルで権限を与えることによってセキュリティで保護されます。 テーブルの FILESTREAM 列に対する権限を持つユーザーは、関連付けられているファイルを開くことができます。

Note

FILESTREAM データでは暗号化はサポートされていません。

FILESTREAM コンテナーへのアクセス許可が与えられるのは、SQL Server サービス アカウントが実行されているアカウントだけです。 その他のアカウントにはデータ コンテナーに対するアクセス許可を与えないようにすることをお勧めします。

Note

SQL ログインは、FILESTREAM コンテナーで使用できません。 FILESTREAM コンテナーでは NTFS または ReFS 認証のみを使用できます。

Transact-SQL およびファイル システム ストリーミング アクセスによる BLOB データへのアクセス

FILESTREAM 列にデータを格納した後、それらのファイルにアクセスするには、Transact-SQL トランザクションか Win32 API を使用します。

Transact-SQL アクセス

Transact-SQL を使用して、FILESTREAM データの挿入、更新、および削除を行うことができます。

  • 挿入操作を使用すると、null 値、空の値、または比較的短いインライン データを FILESTREAM フィールドに事前設定することができます。 ただし、大量のデータをファイルにストリーミングする場合は、Win32 インターフェイスを使用する方が効率的です。
  • FILESTREAM フィールドを更新すると、その基となるファイル システムの BLOB データが変更されます。 FILESTREAM フィールドを NULL に設定すると、フィールドに関連付けられている BLOB データが削除されます。 UPDATE**.**Write() として実装されている Transact-SQL の大量の更新を使用してデータの部分更新を実行することはできません。
  • FILESTREAM データを含む行を削除したり、FILESTREAM データを含むテーブルを削除したり切り捨てたりすると、その基となるファイル システムの BLOB データが削除されます。

ファイル システム ストリーミング アクセス

Win32 のストリーミング サポートを SQL Server トランザクションのコンテキストで使用できます。 トランザクション内で、まず、FILESTREAM 関数を使用してファイルの論理 UNC ファイル システム パスを取得します。 次に、OpenSqlFilestream API を使用してファイル ハンドルを取得します。 そのハンドルを Win32 ファイル ストリーミング インターフェイス (ReadFile() や WriteFile() など) で使用することにより、ファイル システム経由でファイルにアクセスしてファイルを更新できます。

ファイル操作はトランザクション処理なので、ファイル システムを通じて FILESTREAM ファイルを削除したりその名前を変更したりすることはできません。

警告

FILESTREAM コンテナーは、SQL Server によって管理されるフォルダーです。 FILESTREAM フォルダー内のファイルを手動で、または他のアプリケーションを介して追加または削除しないでください。 その場合、バックアップと不整合エラーが発生します。 詳細については、「MSSQLSERVER_3056MSSQLSERVER_7908、および MSSQLSERVER_7906」を参照してください。

ステートメント モデル

FILESTREAM のファイル システム アクセスは、ファイルのオープンとクローズを使用して Transact-SQL ステートメントを実現しています。 ファイル ハンドルを開くとステートメントが開始され、ハンドルを閉じると終了します。 たとえば、書き込みハンドルを閉じると、UPDATE ステートメントが完了したときのように、テーブルに登録されている AFTER トリガーが起動します。

ストレージの名前空間

FILESTREAM では、データベース エンジンが BLOB の物理ファイル システムの名前空間を制御します。 新しい組み込み関数の PathNameを使用すると、テーブルの各 FILESTREAM セルに対応する BLOB の論理 UNC パスを取得できます。 アプリケーションでは、この論理パスを使用して Win32 ハンドルを取得し、標準の Win32 ファイル システム インターフェイスを使用して BLOB データを操作します。 この関数は、FILESTREAM 列の値が NULL の場合は NULL を返します。

ファイル システム アクセスのトランザクション処理

新しい組み込み関数の GET_FILESTREAM_TRANSACTION_CONTEXT()を使用すると、セッションが関連付けられている現在のトランザクションを表すトークンを取得できます。 このトランザクションは、既に開始され、まだ中止もコミットもされていないトランザクションである必要があります。 アプリケーションでは、トークンを取得することにより、FILESTREAM のファイル システム ストリーミング操作を、既に開始されているトランザクションにバインドできます。 この関数は、明示的に開始されたトランザクションがない場合は NULL を返します。

トランザクションをコミットしたり中止したりする前にすべてのファイル ハンドルを閉じる必要があります。 トランザクションのスコープを超えてもハンドルが開いたままになっていると、そのハンドルに対するその後の読み取りが失敗します。そのハンドルに対するその後の書き込みは成功しますが、ディスクに実際のデータが書き込まれません。 同様に、データベース エンジンのデータベースやインスタンスがシャットダウンすると、開いているハンドルはすべて無効になります。

トランザクションの持続性

FILESTREAM では、トランザクションのコミット時に、ファイル システム ストリーミング アクセスから変更された FILESTREAM BLOB データのトランザクションの持続性がデータベース エンジンによって確保されます。

分離のセマンティクス

分離のセマンティクスは、データベース エンジンのトランザクション分離レベルに従います。 Transact-SQL およびファイル システム アクセスでは、Read Committed 分離レベルがサポートされます。 Repeatable read 操作、serializable、および snapshot 分離レベルがサポートされます。 ダーティ リードはサポートされません。

ファイル システム アクセスのオープン操作はロックを待機しません。 トランザクション分離のためにデータにアクセスできない場合、オープン操作はすぐに失敗します。 分離違反が原因でオープン操作を続行できない場合は、ストリーミング API 呼び出しが ERROR_SHARING_VIOLATION で失敗します。

アプリケーションでは、部分更新を実行できるようにするために、デバイス FS 制御 (FSCTL_SQL_FILESTREAM_FETCH_OLD_CONTENT) を発行して、開いているハンドルが参照しているファイルに古い内容をフェッチすることができます。 これにより、サーバー側の古い内容がコピーされます。 アプリケーションのパフォーマンスが低下したり、非常に大きなファイルを操作する際にタイムアウトになったりしないように、非同期 I/O を使用することをお勧めします。

ハンドルへの書き込みが行われた後に FSCTL を発行すると、最後の書き込み操作は維持され、それより前の書き込みは失われます。

ファイル システム API とサポートされる分離レベル

分離違反が原因でファイル システム API がファイルを開くことができない場合、ERROR_SHARING_VIOLATION 例外が返されます。 この分離違反は、2 つのトランザクションが同じファイルにアクセスしようとしたときに発生します。 アクセス操作の結果は、ファイルが開かれたモードと、トランザクションが実行されている SQL Server のバージョンに依存します。 次の表に、同じファイルにアクセスする 2 つのトランザクションで得られる可能性のある結果を示します。

トランザクション 1 トランザクション 2 SQL Server 2008 (10.0.x) での結果 SQL Server 2008 R2 (10.50.x) 以降のバージョンでの結果
読み取り用に開く。 読み取り用に開く。 どちらも成功します。 どちらも成功します。
読み取り用に開く。 書き込み用に開く。 どちらも成功します。 トランザクション 2 の書き込み操作は、トランザクション 1 で実行される読み取り操作に影響しません。 どちらも成功します。 トランザクション 2 の書き込み操作は、トランザクション 1 で実行される読み取り操作に影響しません。
書き込み用に開く。 読み取り用に開く。 トランザクション 2 の開く操作は、ERROR_SHARING_VIOLATION 例外で失敗します。 どちらも成功します。
書き込み用に開く。 書き込み用に開く。 トランザクション 2 の開く操作は、ERROR_SHARING_VIOLATION 例外で失敗します。 トランザクション 2 の開く操作は、ERROR_SHARING_VIOLATION 例外で失敗します。
読み取り用に開く。 SELECT 用に開く。 どちらも成功します。 どちらも成功します。
読み取り用に開く。 UPDATE または DELETE 用に開く。 どちらも成功します。 トランザクション 2 の書き込み操作は、トランザクション 1 で実行される読み取り操作に影響しません。 どちらも成功します。 トランザクション 2 の書き込み操作は、トランザクション 1 で実行される読み取り操作に影響しません。
書き込み用に開く。 SELECT 用に開く。 トランザクション 2 は、トランザクション 1 がコミットまたは終了するか、トランザクション ロックがタイムアウトするまで、ブロックされます。 どちらも成功します。
書き込み用に開く。 UPDATE または DELETE 用に開く。 トランザクション 2 は、トランザクション 1 がコミットまたは終了するか、トランザクション ロックがタイムアウトするまで、ブロックされます。 トランザクション 2 は、トランザクション 1 がコミットまたは終了するか、トランザクション ロックがタイムアウトするまで、ブロックされます。
SELECT 用に開く。 読み取り用に開く。 どちらも成功します。 どちらも成功します。
SELECT 用に開く。 書き込み用に開く。 どちらも成功します。 トランザクション 2 の書き込み操作は、トランザクション 1 に影響しません。 どちらも成功します。 トランザクション 2 の書き込み操作は、トランザクション 1 に影響しません。
UPDATE または DELETE 用に開く。 読み取り用に開く。 トランザクション 2 の開く操作は、ERROR_SHARING_VIOLATION 例外で失敗します。 どちらも成功します。
UPDATE または DELETE 用に開く。 書き込み用に開く。 トランザクション 2 の開く操作は、ERROR_SHARING_VIOLATION 例外で失敗します。 トランザクション 2 の開く操作は、ERROR_SHARING_VIOLATION 例外で失敗します。
Repeatable Read の SELECT 用に開く。 読み取り用に開く。 どちらも成功します。 どちらも成功します。
Repeatable Read の SELECT 用に開く。 書き込み用に開く。 トランザクション 2 の開く操作は、ERROR_SHARING_VIOLATION 例外で失敗します。 トランザクション 2 の開く操作は、ERROR_SHARING_VIOLATION 例外で失敗します。

リモート クライアントからのライトスルー

FILESTREAM データへのリモート ファイル システム アクセスは、サーバー メッセージ ブロック (SMB) プロトコルによって実現されます。 クライアントがリモート クライアントの場合は、書き込み操作がクライアント側でキャッシュされず、 常にサーバーに送信されます。 サーバー側でデータをキャッシュできます。 リモート クライアントで実行されるアプリケーションでは、小さな書き込み操作をより大きなサイズの操作に統合することをお勧めします。 目標は、実行する書き込みの数を減らすることです。

FILESTREAM ハンドルを使用してメモリ マップ表示 (メモリ マップ I/O) を作成することはできません。 FILESTREAM データに対してメモリ マッピングを使用すると、データベース エンジンでデータの一貫性および持続性やデータベースの整合性を保証できなくなります。

FILESTREAM のパフォーマンスを向上させるための推奨事項とガイドライン

SQL Server FILESTREAM 機能を使用すると、varbinary (max) バイナリ ラージ オブジェクト データをファイル システムのファイルとして格納できます。 FILESTREAM 列と FileTable の両方の基になるストレージである FILESTREAM コンテナーに多数の行がある場合、ファイル システム ボリュームに多数のファイルが含まれることになります。 データベースおよびファイル システムから統合されたデータを処理するときに最高のパフォーマンスを実現するには、ファイル システムが最適にチューニングされるようにすることが重要です。 ファイル システムの観点から使用できるチューニング オプションの一部を次に示します。

  • SQL Server FILESTREAM フィルター ドライバー (rsfx0100.sys など) の高度チェック。 FILESTREAM 機能がファイルを格納するボリュームに関連付けられているストレージ スタック用に読み込まれたすべてのフィルター ドライバーを評価し、rsfx ドライバーがスタックの一番下に配置されていることを確認します。 FLTMC.EXE コントロール プログラムを使用して、特定のボリュームのフィルター ドライバーを列挙できます。 FLTMC ユーティリティからは C:\Windows\System32>fltMC.exe フィルターなどがサンプル出力されます

    フィルター名 インスタンスの数 高度 Frame
    Sftredir 1 406000 0
    MpFilter 9 328000 0
    luafv 1 135000 0
    FileInfo 9 45000 0
    RsFx0103 1 41001.03 0
  • サーバーのファイルに対して "last access time" プロパティが無効になっていることを確認します。 このファイル システム属性はレジストリ (キー名: HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem) に保持されます。
    Name: NtfsDisableLastAccessUpdate
    種類:REG_DWORD
    値: 1

  • サーバーで 8.3 の名前付けが無効になっていることを確認します。 このファイル システム属性はレジストリ (キー名: HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem) に保持されます。
    Name: NtfsDisable8dot3NameCreation
    種類:REG_DWORD
    値: 1

  • FILESTREAM ディレクトリ コンテナーでファイル システムの暗号化またはファイル システムの圧縮が有効になっていないことを確認してください。これらのファイルにアクセスするときに、一定レベルのオーバーヘッドが発生する可能性があるためです。

  • 管理者特権でのコマンド プロンプトで fltmc インスタンスを実行し、復元しようとしているボリュームにフィルター ドライバーがアタッチされていないことを確認します。

  • FILESTREAM ディレクトリ コンテナーに 30 万個を超えるファイルがないことを確認してください。 sys.database_files カタログ ビューの情報を使用して、どのファイル システムのディレクトリに FILESTREAM-related ファイルが格納されているかを調べることができます。 これは、複数のコンテナーを持つことで防止できます。 (詳細については、次の箇条書き項目を参照してください。)

  • FILESTREAM ファイル グループを 1 つだけ使用すると、すべてのデータ ファイルが同じフォルダーに作成されます。 作成されるファイルの数が多すぎると、大きな NTFS インデックスによる影響を受ける可能性があり、断片化されることもあります。

    • 通常、複数のファイル グループがあると、これを解決できます (アプリケーションでパーティション分割が使用されるか、複数のテーブルが含まれ、それぞれが独自のファイル グループに移動します)。

    • SQL Server 2012 (11.x) 以降のバージョンでは、FILESTREAM ファイル グループに複数のコンテナーまたはファイルを含めることができ、ラウンドロビン割り当てスキームが適用されます。 そのため、ディレクトリごとの NTFS ファイルの数が少なくなります。

  • コンテナーを格納する複数のボリュームが使用されている場合、複数の FILESTREAM コンテナーによってバックアップと復元がより高速になる可能性があります。

    SQL Server 2012 (11.x) では、ファイル グループごとに複数のコンテナーがサポートされているため、これがさらに簡単になります。 多数のファイルを管理するために、複雑なパーティション構成は必要ありません。

  • SQL インスタンスに非常に多くの FILESTREAM コンテナーがある場合、多くの FILESTREAM コンテナーを使用してデータベースを起動すると、FILESTREAM フィルター ドライバーへの登録に時間がかかる場合があります。 複数の異なるボリュームに分散すると、データベースの起動時間を短縮できます。

  • NTFS MFT が断片化され、パフォーマンスの問題が発生する可能性があります。 MFT で予約されているサイズはボリュームのサイズによって異なるため、これが発生する場合も、しない場合もあります。

    • MFT の断片化がないかを確認するには、defrag /A /V C: を使用します (C: は実際のボリューム名に変更してください)。

    • Fsutil behavior set mftzone 2 を使用して、より多くの MFT 領域を予約できます。

    • FILESTREAM データ ファイルは、ウイルス対策ソフトウェアのスキャンから除外する必要があります。

      Note

      Windows Server 2016 では、Windows Defender が自動的に有効になります。 Filestream ファイルを除外するように Windows Defender が構成されていることを確認します。 これを行わないと、バックアップと復元操作のパフォーマンスが低下する可能性があります。

      詳細については、「Windows Defender ウイルス対策スキャンの除外を構成および検証する」を参照してください。