チュートリアル: データ コピー サービスを使用してデータを Azure Data Box にコピーする
このチュートリアルでは、中間ホストを介さずにデータ コピー サービスを使用してデータを取り込む方法について説明します。 データ コピー サービスは、Azure Data Box 上でローカルに動作し、サーバー メッセージ ブロック (SMB) プロトコル経由でお客様のネットワーク接続ストレージ (NAS) デバイスに接続して、Data Box にデータをコピーします。
データ コピー サービスの用途:
- 中間ホストが必ずしも利用できない NAS 環境。
- データのインジェストとアップロードに数週間かかる小さなファイル。 データ コピー サービスを利用すると、小さなファイルのインジェストとアップロードにかかる時間を大幅に短縮できます。
Note
Windows NAS 以外のデバイスとのコピー サービスの互換性は公式にはサポートされていません。
このチュートリアルでは、次の作業を行う方法について説明します。
- Data Box にデータをコピーする
前提条件
このチュートリアルを開始する前に
- Azure Data Box の設定に関するチュートリアルを完了します。
- Data Box デバイスが配送されていて、ポータル内での注文の状態が [配送済み] であることを確認します。
- ソース データが格納されている NAS デバイスの資格情報があることを確認します。
- 高速ネットワークに接続していることを確認します。 10 ギガビット イーサネット (GbE) 接続を少なくとも 1 つ利用することを強くお勧めします。 10 GbE 接続を利用できない場合は 1 GbE データ リンクを使用できますが、コピー速度に影響があります。
Data Box にデータをコピーする
NAS デバイスに接続したら、次の手順はデータのコピーです。
重要
データの破損や紛失の可能性を回避するため、推奨されるベスト プラクティスに従ってください。
- データ コピー操作を開始する前に、そのサイズが Azure Storage と Data Box の制限の記事に記載されたサイズ制限に準拠していることを確認してください。
- Data Box 以外のアプリケーションから Data Box にデータがアップロードされないようにします。 同時にデータ コピー操作を行うと、アップロード ジョブが失敗したりデータが破損したりする可能性があります。
- データ コピー サービスによる読み取り中にソース データが変更されていないことを確認します。 コピー操作中にデータを変更すると、障害やデータ破損が発生する可能性があります。
- Data Box 転送プロセスが完了し、Azure Storage 内でデータにアクセスできるようになるまで、ソース データのコピーを維持するようにします。
データ コピー サービスを使用してデータをコピーするには、ジョブを作成する必要があります。
Data Box デバイスのローカル Web UI で、[管理]>[データのコピー] の順に移動します。
[データのコピー] ページで [作成] を選択します。
[ジョブの構成と開始] ダイアログ ボックスで、以下のフィールドを入力します。
フィールド 値 ジョブ名 ジョブの一意の名前を 230 文字未満で指定します。 <、>、|、?、*、\、:、/、\ の各文字は、ジョブの名前には使用できません。 ソースの場所 データ ソースの SMB パスを \\<ServerIPAddress>\<ShareName>
形式または\\<ServerName>\<ShareName>
形式で指定します。ユーザー名 データ ソースにアクセスするための \\<DomainName><UserName>
形式のユーザー名。 ローカル管理者には明示的なセキュリティ アクセス許可が必要です。 フォルダーを右クリックし、[プロパティ] を選択し、[セキュリティ] を選択して[セキュリティ] タブ内にローカル管理者を追加します。パスワード データ ソースにアクセスするためのパスワード。 コピー先ストレージ アカウント データのアップロード先となるターゲット ストレージ アカウントを一覧から選択します。 送信先の種類 ターゲット ストレージの種類を次のリストから選択します。ブロック BLOB、ページ BLOB、Azure Files、または ブロック BLOB (アーカイブ) コピー先コンテナー/共有 自分のコピー先ストレージ アカウントにおけるデータのアップロード先にしたいコンテナーまたは共有の名前を入力します。 この名前には、共有名またはコンテナー名を使用できます。 たとえば、 myshare
またはmycontainer
を使用します。sharename\directory_name
またはcontainername\virtual_directory_name
の形式で名前を入力することもできます。パターンに一致するファイルのコピー 次の 2 つの方法でファイル名の一致パターンを入力できます。 - ワイルドカード式を使用: ワイルドカード式でサポートされるのは
*
と?
だけです。 たとえば、*.vhd
という式は、拡張子が.vhd
であるすべてのファイルと一致します。 同様に、*.dl?
は、拡張詞が.dl
であるか、または.dl
で始まる (.dll
など) すべてのファイルと一致します。 さらに、*foo
は、名前がfoo
で終わるすべてのファイルと一致します。
ワイルドカード式はフィールドに直接入力することができます。 フィールドに入力する値は、既定でワイルドカード式として扱われます。 - 正規表現を使用: POSIX ベースの正規表現がサポートされます。 たとえば、
.*\.vhd
という正規表現は、拡張子が.vhd
であるすべてのファイルと一致します。 正規表現には、<pattern>
を直接regex(<pattern>)
として指定します。 正規表現の詳細については、正規表現言語のクイック リファレンスを参照してください。
ファイルの最適化 この機能が有効な場合、1 MB 未満のファイルがインジェスト中に圧縮されます。 この圧縮により、小さなファイルのデータをより高速にコピーできるようになります。 さらに、ファイル数がディレクトリ数を大幅に超えている場合は、時間が大幅に節約されます。
ファイルの最適化を使用する場合:- 発送準備を実行した後、元のファイル名を一覧表示する 部品表 (BOM) ファイルをダウンロードして、適切なファイルがすべてコピーされていることを確認できます。
ADB_PACK_
から始まる名前の圧縮ファイルは削除しないでください。 圧縮ファイルを削除した場合、今後のデータ コピー時に元のファイルはアップロードされません。- コピー サービスでコピーしたものと同じファイルを、SMB、NFS、REST API などの他のプロトコルを使用してコピーしないでください。 異なるプロトコルを使用すると、データのアップロード時に競合が発生し、エラーが発生する可能性があります。
- ファイルの最適化は、Azure Files ではサポートされていません。 最適化されていないデータ コピー ジョブに対してコピーされるタイムスタンプ、ファイル属性、アクセス制御リスト (ACL) を確認するには、転送されたメタデータの記事を参照してください。
- ワイルドカード式を使用: ワイルドカード式でサポートされるのは
[スタート] を選択します。 入力が検証され、検証が成功した場合にジョブが開始されます。 ジョブが開始されるまでに、数分かかる場合があります。
指定した設定のジョブが作成されます。 ジョブの一時停止、再開、取り消し、または再起動を実行できます。 ジョブ名の横にあるチェック ボックスをオンにして、適切なボタンを選択します。
ピーク時にジョブが NAS デバイスのリソースに影響を及ぼしている場合、それを一時停止できます。
ピーク時を避けてジョブを再開することができます。
ジョブはいつでも取り消すことができます。
ジョブを取り消す際には、確認が必要です。
コピー ジョブをキャンセルしても、ジョブ中に既にデバイスにコピーされたデータは削除されません。 自分の Data Box デバイスに既にコピーされたデータを削除するには、デバイスをリセットします。
Note
ジョブの取り消しまたは一時停止を行った場合、大きなファイルが部分的にのみコピーされる可能性があります。 部分的にコピーされたこれらのファイルは、同じ状態で Azure にアップロードされます。 ジョブの取り消しまたは一時停止を行う場合、ファイルが適切にコピーされたことを確認してください。 ファイルを確認するには、SMB 共有を調べるか、BOM ファイルをダウンロードします。
ネットワーク障害など、一時的なエラーが原因で失敗したジョブを再起動することができます。 ただし、[成功] や [完了 (エラーあり)] など、最終状態に達した後にジョブを再起動することはできません。 ファイルの名前付けやファイル サイズの問題に起因するエラーはログに記録されますが、ジョブの完了後にジョブを再開することはできません。
エラーが発生し、ジョブを再起動できない場合は、エラー ログをダウンロードして根本的なエラーを検出します。 問題を修正した後、新しいジョブを作成してファイルをコピーします。 あるいは、SMB 経由でファイルをコピーすることもできます。
現在のリリースでは、ジョブの削除はサポートされていません。
ジョブは無制限に作成できますが、任意の一時点に並列で実行できるジョブは最大 10 個だけです。
[ファイルの最適化] をオンにした場合、コピーのパフォーマンスを高めるために、小さなファイルは取り込み時に圧縮され、アップロード時に解凍されます。 圧縮されたこれらのファイルは、GUID を使用して名前が付けられます。 圧縮ファイルを削除しないでください。
ジョブの進行中、[データのコピー] ページには次のデータが表示されます。
- [状態] 列にはコピー ジョブの状態が表示されます。 有効な状態には次のようなものがあります。
- 実行中
- Failed
- Succeeded
- 一時停止中
- 一時停止
- キャンセル中
- Canceled
- 完了 (エラーあり)
- [ファイル] 列には、コピー中のファイルの数と合計サイズが表示されます。
- [処理済み] 列には、処理されたファイルの数と合計サイズが表示されます。
- [ジョブの詳細] 列には、ジョブの詳細を表示するためのリンクがあります。
- [# 件のエラー] 列には、コピーの進行中に発生したエラーの数が表示されます。 トラブルシューティングのためにエラー ログをダウンロードするには、対応する [エラー ログ] 列内のリンクを選択します。
- [状態] 列にはコピー ジョブの状態が表示されます。 有効な状態には次のようなものがあります。
コピー ジョブが完了するのを待ちます。 一部のエラーは [接続とコピー] ページにしかログが記録されないので、エラーなくコピー ジョブが完了し、エラーが報告されていないことを確認してから次の手順に進みます。
データ整合性を保証するため、データがコピーされるときにインラインでチェックサムが計算されます。 コピーが完了した後、 [ダッシュボードの表示] を選択して、デバイスで使用済み領域と空き領域を確認します。
コピー ジョブが完了した後、 [発送準備] を選択できます。
Note
コピー ジョブの進行中は [発送準備] を実行できません。
次のステップ
次のチュートリアルに進み、Data Box デバイスを Microsoft に返送する方法を学習してください。