Azure Kinect Sensor SDK イメージ変換を使用する

[アーティクル]
06/01/2023

特定の関数に従って、Azure Kinect DK のカメラ座標系間でイメージを使用および変換します。

k4a_transformation 関数

k4a_transformation が先頭に付けられたすべての関数は、イメージ全体で動作します。これらには、k4a_transformation_create() を介して取得され、k4a_transformation_destroy () を介して割り当て解除される変換ハンドル k4a_transformation_t が必要です。また、このトピックにある 3 つの関数を使用する方法を示す SDK 変換の例を参照することもできます。

次の関数を扱っています。

k4a_transformation_depth_image_to_color_camera

概要

関数 k4a_transformation_depth_image_to_color_camera() は、深度カメラの視点からカラーカメラの視点に深度マップを変換します。この関数は、いわゆる RGB-D イメージを生成するように設計されています。ここで、D は、深度値を記録する追加のイメージチャネルを表します。次の図に示すように、カラーイメージと k4a_transformation_depth_image_to_color_camera() の出力は、同じ視点 (つまり、カラーカメラの視点) から取得されたかのように見えます。

イメージ変換

実装

この変換関数は、すべてのピクセルに対して k4a_calibration_2d_to_2d () を呼び出すよりも複雑です。これは、深度カメラのジオメトリからカラーカメラのジオメトリに三角形メッシュをワープします。三角形メッシュは、変換された深度イメージに穴が生成されないようにするために使用されます。 Z バッファーは、オクルージョンが正しく処理されるようにします。既定では、この関数に対して GPU アクセラレーションが有効になっています。

パラメーター

入力パラメーターは、変換ハンドルおよび深度イメージです。深度イメージの解像度は、変換ハンドルの作成時に指定した depth_mode と一致する必要があります。たとえば、1024 x 1024 K4A_DEPTH_MODE_WFOV_UNBINNED モードを使用して変換ハンドルを作成した場合、深度イメージの解像度は 1024 x 1024 ピクセルである必要があります。出力は、ユーザーが k4a_image_create () の呼び出しを介して割り当てる必要のある変換された深度イメージです。変換した深度イメージの解像度は、変換ハンドルの作成時に指定した color_resolution と一致する必要があります。たとえば、色の解像度が K4A_COLOR_RESOLUTION_1080P に設定されていた場合、出力イメージの解像度は 1920 x 1080 ピクセルである必要があります。イメージは 16 ビットの深度値を格納するため、出力イメージのストライドは width * sizeof(uint16_t) に設定されます。

k4a_transformation_depth_image_to_color_camera_custom

概要

関数 k4a_transformation_depth_image_to_color_camera_custom() は、深度カメラの視点からカラーカメラの視点に深度マップとカスタムイメージを変換します。この関数は、k4a_transformation_depth_image_to_color_camera() の拡張として、変換された深度イメージ以外のカラーカメラの対応するピクセル座標と各ピクセルが一致する対応するカスタムイメージを生成するように設計されています。

実装

この変換関数は、k4a_transformation_depth_image_to_color_camera() と同じ方法で、変換した深度イメージを生成します。カスタムイメージを変換するために、この関数には、線形補間または最近傍補間を使用するオプションが用意されています。線形補間を使用すると、変換されたカスタムイメージに新しい値が作成される可能性があります。最近傍補間を使用すると、元のイメージに存在しない値が、出力イメージに表示されなくなりますが、イメージの滑らかさは低下します。カスタムイメージは、シングルチャネル 8 ビットまたは 16 ビットである必要があります。既定では、この関数に対して GPU アクセラレーションが有効になっています。

パラメーター

入力パラメーターは、変換ハンドル、深度イメージ、カスタムイメージ、および補間の種類です。深度イメージとカスタムイメージの解像度は、変換ハンドルの作成時に指定した depth_mode と一致する必要があります。たとえば、1024 x 1024 K4A_DEPTH_MODE_WFOV_UNBINNED モードを使用して変換ハンドルを作成した場合、深度イメージとカスタムイメージの解像度は 1024 x 1024 ピクセルである必要があります。 interpolation_type は K4A_TRANSFORMATION_INTERPOLATION_TYPE_LINEAR または K4A_TRANSFORMATION_INTERPOLATION_TYPE_NEAREST である必要があります。出力は、ユーザーが k4a_image_create () の呼び出しを介して割り当てる必要のある変換された深度イメージおよび変換されたカスタムイメージです。変換された深度イメージと変換されたカスタムイメージの解像度は、変換ハンドルの作成時に指定した color_resolution と一致する必要があります。たとえば、色の解像度が K4A_COLOR_RESOLUTION_1080P に設定されていた場合、出力イメージの解像度は 1920 x 1080 ピクセルである必要があります。出力深度イメージは、16 ビットの深度値を格納するため、そのイメージのストライドは width * sizeof(uint16_t) に設定されます。入力カスタムイメージと変換されたカスタムイメージの形式は、K4A_IMAGE_FORMAT_CUSTOM8 または K4A_IMAGE_FORMAT_CUSTOM16 である必要があり、対応するイメージストライドを適宜設定する必要があります。

k4a_transformation_color_image_to_depth_camera

概要

関数 k4a_transformation_color_image_to_depth_camera() は、カラーカメラの視点から深度カメラの視点にカラーイメージを変換します (上図参照)。これは、RGB D イメージを生成するために使用できます。

実装

深度マップのピクセルごとに、この関数はピクセルの深度値を使用して、カラーイメージ内の対応するサブピクセル座標を計算します。次に、カラーイメージにおけるこの座標での色の値を検索します。サブピクセルの精度で色の値を取得するために、カラーイメージでバイリニア補間が実行されます。深度読み取り値が関連付けられていないピクセルは、出力イメージにおいて [0,0,0,0] の BGRA 値に割り当てられます。既定では、この関数に対して GPU アクセラレーションが有効になっています。このメソッドは、変換されたカラーイメージに穴を生成し、オクルージョンを処理しないため、代わりに関数 k4a_transformation_depth_image_to_color_camera () を使用することをお勧めします。

パラメーター

入力パラメーターは、変換ハンドル、深度イメージ、およびカラーイメージです。深度イメージとカラーイメージの解像度は、変換ハンドルの作成時に指定した depth_mode および color_resolution に一致する必要があります。出力は、ユーザーが k4a_image_create () の呼び出しを介して割り当てる必要のある変換されたカラーイメージです。変換したカラーイメージの解像度は、変換ハンドルの作成時に一致した depth_resolution に一致する必要があります。出力イメージは、ピクセルごとに BGRA を表す 4 つの 8 ビット値を格納します。そのため、イメージのストライドは width * 4 * sizeof(uint8_t) になります。データの順序は、ピクセルインターリープ順 (青の値 - ピクセル 0、緑の値 - ピクセル 0、赤の値 - ピクセル 0、アルファ値 - ピクセル 0、青の値 - ピクセル 1 など) です。

k4a_transformation_depth_image_to_point_cloud

概要

関数 k4a_transformation_depth_image_to_point_cloud() は、カメラによって取得された 2D 深度マップを、同じカメラの座標系の 3D ポイントクラウドに変換します。このためカメラは深度カメラにもカラーカメラにもすることができます。

実装

この関数は、ピクセルごとに k4a_calibration_2d_to_2d () を実行した場合と同等の結果が得られますが、計算効率が向上します。 k4a_transformation_create () を呼び出すと、イメージピクセルごとに x および y スケールファクターを格納したいわゆる xy 参照テーブルが事前に計算されます。 k4a_transformation_depth_image_to_point_cloud () を呼び出すと、ピクセルの x スケールファクターとピクセルの Z 座標を乗算することによって、ピクセルの 3D X 座標が取得されます。同様に、3D Y 座標は、y スケールファクターの乗算によって計算されます。 SDK の高速ポイントクラウドの例では、xy テーブルの計算方法を示しています。ユーザーは、コード例に従って、たとえば GPU パイプラインの速度を上げるなど、この関数の独自のバージョンを実装できます。

パラメーター

入力パラメーターは、変換ハンドル、カメラ指定子、深度イメージです。カメラ指定子が深度に設定されている場合、深度イメージの解像度は、変換ハンドルの作成時に指定した depth_mode に一致する必要があります。それ以外の場合、指定子がカラーカメラに設定されている場合、解像度は選択した color_resolution の解像度と一致する必要があります。出力パラメーターは、ユーザーが k4a_image_create () を呼び出して割り当てる必要のある XYZ イメージです。 XYZ イメージの解像度は、入力深度マップの解像度に一致する必要があります。ピクセルごとに 3 つの符号付き 16 ビット座標値をミリメートル単位で格納します。したがって、XYZ イメージのストライドは width * 3 * sizeof(int16_t)に設定されます。データの順序は、ピクセルインターリーブ順 (X 座標 – ピクセル 0、Y 座標 – ピクセル 0、Z 座標 – ピクセル 0、X 座標 – ピクセル 1 など) です。ピクセルを 3D に変換できない場合、関数は [0,0,0] の値をピクセルに割り当てます。

サンプル

変換の例

次のステップ

これで Azure Kinect Sensor SDK イメージ変換関数の使用方法を学習したので、次の内容も学習できます

Azure Kinect Sensor SDK 調整関数

次の内容も確認できます

座標系

Azure Kinect Sensor SDK イメージ変換を使用する

k4a_transformation 関数

k4a_transformation_depth_image_to_color_camera

概要

実装

パラメーター

k4a_transformation_depth_image_to_color_camera_custom

概要

実装

パラメーター

k4a_transformation_color_image_to_depth_camera

概要

実装

パラメーター

k4a_transformation_depth_image_to_point_cloud

概要

実装

パラメーター

サンプル

次のステップ

その他のリソース