開發具有多個輸入的資料流程元件
如果具有多個輸入的資料流程元件其多個輸入會以不平均的速率產生資料,可能會耗用過多的記憶體。 當您開發支援兩個或多個輸入的自訂資料流程元件時,可以使用 Microsoft.SqlServer.Dts.Pipeline 命名空間中的下列成員來管理記憶體壓力:
DtsPipelineComponentAttribute 類別的 DtsPipelineComponentAttribute.SupportsBackPressure 屬性。 如果您想要實作為了讓自訂資料流程元件管理速率不平均之資料所需的程式碼,請將這個屬性的值設定為 true。
PipelineComponent 類別的 IsInputReady 方法。 如果您將 SupportsBackPressure 屬性設定為 true,就必須提供這個方法的實作。 如果您沒有提供實作,資料流程引擎會在執行階段引發例外狀況。
PipelineComponent 類別的 GetDependentInputs 方法。 如果您將 SupportsBackPressure 屬性設定為 true,而且自訂元件支援超過兩個的輸入,您也必須提供這個方法的實作。 如果您沒有提供實作,而且使用者附加超過兩個輸入,資料流程引擎會在執行階段引發例外狀況。
結合這些成員,即可讓您開發與 Microsoft 所開發之「合併」和「合併聯結」轉換方案類似的記憶體壓力方案。
設定 SupportsBackPressure 屬性
針對自訂支援多個輸入之資料流程元件實作更好的記憶體管理中的第一個步驟,就是在 DtsPipelineComponentAttribute 中將 SupportsBackPressure 屬性的值設定為 true。 當 SupportsBackPressure 的值為 true 時,資料流程引擎會呼叫 IsInputReady 方法,具有超過兩個輸入時,也會在執行階段呼叫 GetDependentInputs 方法。
範例
在下列範例中,DtsPipelineComponentAttribute 的實作會將 SupportsBackPressure 的值設定為 true。
[DtsPipelineComponent(ComponentType = ComponentType.Transform,
DisplayName = "Shuffler",
Description = "Shuffle the rows from input.",
SupportsBackPressure = true,
LocalizationType = typeof(Localized),
IconResource = "Microsoft.Samples.SqlServer.Dts.MIBPComponent.ico")
]
public class Shuffler : Microsoft.SqlServer.Dts.Pipeline.PipelineComponent
{
...
}
實作 IsInputReady 方法
當您在 DtsPipelineComponentAttribute 物件中將 SupportsBackPressure 屬性的值設定為 true 時,就必須提供 PipelineComponent 類別之 IsInputReady 方法的實作。
[!附註]
您的 IsInputReady 方法實作不應該呼叫基底類別中實作。 在基底類別中,這個方法的預設實作只會引發 NotImplementedException。
實作這個方法時,您會針對每個元件的輸入設定布林 (Boolean) canProcess 陣列中的項目狀態 (輸入會由它們在 inputIDs 陣列中的識別碼值所識別)。當您針對某個輸入,將 canProcess 陣列中的元素值設定為 true 時,資料流程引擎會呼叫元件的 ProcessInput 方法,並且為指定的輸入提供更多資料。
有更多的上游資料可供使用時,至少一個輸入的 canProcess 陣列元素值必須一律是 true,否則處理就會停止。
資料流程引擎會在傳送資料的每個緩衝區之前,呼叫 IsInputReady 方法,以判斷哪一個輸入正在等候接收更多資料。 當傳回值表示輸入遭到封鎖時,資料流程引擎就會為該輸入暫時快取資料的其他緩衝區,而不會將它們傳送到元件。
[!附註]
您不用在自己的程式碼中呼叫 IsInputReady 或 GetDependentInputs 方法。 資料流程引擎執行您的元件時,資料流程引擎會呼叫這些方法以及您所覆寫之 PipelineComponent 類別的其他方法。
範例
在下列的範例中,IsInputReady 方法的實作指出當下列條件成立時,輸入會等候接收更多資料:
有更多的上游資料可供輸入使用 (!inputEOR)。
元件目前沒有可用來處理元件已接收之緩衝區中的資料 (inputBuffers[inputIndex].CurrentRow() == null)。
如果輸入正在等候接收更多資料,資料流程元件會將與該輸入對應之 canProcess 陣列中的元素值設定為 true,以指出這項資訊。
相反地,當元件仍有可用於處理輸入的資料時,這個範例會暫停處理輸入。 這個範例會將與該輸入對應之 canProcess 陣列中的元素值設定為 false,以進行這項操作。
public override void IsInputReady(int[] inputIDs, ref bool[] canProcess)
{
for (int i = 0; i < inputIDs.Length; i++)
{
int inputIndex = ComponentMetaData.InputCollection.GetObjectIndexByID(inputIDs[i]);
canProcess[i] = (inputBuffers[inputIndex].CurrentRow() == null)
&& !inputEOR[inputIndex];
}
}
前面的範例會使用布林 (Boolean) inputEOR 陣列來指出是否有更多的上游資料可供每個輸入使用。 陣列名稱中的 EOR 代表「資料列集結束」,也會參考資料流程緩衝區的 EndOfRowset 屬性。 在這裡未包含的範例部分中,ProcessInput 方法會檢查它所接收資料的每個緩衝區之 EndOfRowset 屬性值。 當 true 的值表示沒有其他上游資料可供輸入使用時,範例會將該輸入的 inputEOR 陣列元素設定為 true。 當 inputEOR 陣列值指出沒有其他上游資料可供輸入使用時,這個 IsInputReady 方法會針對輸入來將 canProcess 陣列中的對應元素值設為 false。
實作 GetDependentInputs 方法
當您的自訂資料元件支援超過兩個輸入時,您也必須針對 PipelineComponent 類別的 GetDependentInputs 方法提供實作。
[!附註]
您的 GetDependentInputs 方法實作不應該呼叫基底類別中實作。 在基底類別中,這個方法的預設實作只會引發 NotImplementedException。
資料流程引擎只會在使用者將超過兩個輸入附加至元件時呼叫 GetDependentInputs 方法。 當元件只有兩個輸入,而且 IsInputReady 方法指出其中一個輸入遭到封鎖 (canProcess = false) 時,資料流程引擎就會得知另一個輸入正在等候接收更多資料。 但是,具有超過兩個輸入,而且 IsInputReady 方法指出其中一個輸入遭到封鎖時,GetDependentInputs 中額外的程式碼就會識別哪一個輸入正在等候接收更多資料。
[!附註]
您不用在自己的程式碼中呼叫 IsInputReady 或 GetDependentInputs 方法。 資料流程引擎執行您的元件時,資料流程引擎會呼叫這些方法以及您所覆寫之 PipelineComponent 類別的其他方法。
範例
針對遭到封鎖的特定輸入,下列 GetDependentInputs 方法的實作會傳回正在等候接收更多資料之輸入的集合,進而封鎖指定的輸入。 元件會檢查除了已封鎖輸入之外,目前在元件已接收緩衝區中,哪些輸入沒有可供處理的資料,以識別正在封鎖的輸入 (inputBuffers[i].CurrentRow() == null)。 然後,GetDependentInputs 方法會以輸入識別碼集合的方式傳回正在封鎖的輸入集合。
public override Collection<int> GetDependentInputs(int blockedInputID)
{
Collection<int> currentDependencies = new Collection<int>();
for (int i = 0; i < ComponentMetaData.InputCollection.Count; i++)
{
if (ComponentMetaData.InputCollection[i].ID != blockedInputID
&& inputBuffers[i].CurrentRow() == null)
{
currentDependencies.Add(ComponentMetaData.InputCollection[i].ID);
}
}
return currentDependencies;
}