自動平行處理和自動向量化

Auto-Parallelizer 和 Auto-Vectorizer 的設計目的是為您程式碼中的迴圈提供自動效能提升。

自動平行化程式

/Qpar 編譯器選項可讓您在程式代碼中自動化平行化迴圈。當您指定這個旗標而不變更現有的程式碼時，編譯器便會評估程式碼，以尋找可能受益於平行處理的迴圈。因為它可能會發現那些沒有什麼效果的迴圈，這些迴圈因此不會從平行化中受益，而每一個不必要的平行化可能會導致執行緒池生成、額外的同步處理，或其他可能妨礙效能的處理過程，因此編譯器在選擇進行平行化的迴圈時會採取保守的策略。下列範例中，在編譯期間，迴圈的上限為未知：

void loop_test(int u) {
   for (int i=0; i<u; ++i)
      A[i] = B[i] * C[i];
}

因為 u 可能是較小的值，所以編譯程式不會自動平行處理此迴圈。不過，您可能仍想將它平行處理，因為您知道 u 永遠會是大的值。若要啟用自動平行處理，請指定 #pragma 迴圈（hint_parallel（n），其中 n 是要平行處理的線程數目。在下列範例中，編譯器會嘗試在 8 個執行緒之間平行處理迴圈。

void loop_test(int u) {
#pragma loop(hint_parallel(8))
   for (int i=0; i<u; ++i)
      A[i] = B[i] * C[i];
}

如同所有 pragma 指示詞，也支援替代 pragma 語法 __pragma(loop(hint_parallel(n))) 。

即使您想要，編譯程式還是無法平行處理一些迴圈。以下是範例：

#pragma loop(hint_parallel(8))
for (int i=0; i<upper_bound(); ++i)
    A[i] = B[i] * C[i];

每次呼叫函式 upper_bound() 時，它可能會有所變更。由於無法得知上限，編譯程式可以發出診斷訊息，說明為何無法平行處理此迴圈。下列範例將展示可平行處理的迴圈、無法平行處理的迴圈、在命令提示字元中使用的編譯器語法，以及每個命令列選項的編譯器輸出：

int A[1000];
void test() {
#pragma loop(hint_parallel(0))
    for (int i=0; i<1000; ++i) {
        A[i] = A[i] + 1;
    }

    for (int i=1000; i<2000; ++i) {
        A[i] = A[i] + 1;
    }
}

使用下列命令進行編譯：

cl d:\myproject\mylooptest.cpp /O2 /Qpar /Qpar-report:1

會產生以下輸出：

--- Analyzing function: void __cdecl test(void)
d:\myproject\mytest.cpp(4) : loop parallelized

使用下列命令進行編譯：

cl d:\myproject\mylooptest.cpp /O2 /Qpar /Qpar-report:2

會產生以下輸出：

--- Analyzing function: void __cdecl test(void)
d:\myproject\mytest.cpp(4) : loop parallelized
d:\myproject\mytest.cpp(4) : loop not parallelized due to reason '1008'

請注意兩個不同的 /Qpar-report （自動平行化程序報告層級）選項之間的輸出差異。 /Qpar-report:1 只會針對平行處理成功的迴圈輸出平行化工具訊息。 /Qpar-report:2 會輸出平行化工具的訊息，無論迴圈平行化的成功與失敗。

如需原因碼和訊息的詳細資訊，請參閱 Vectorizer 和 Parallelizer 訊息。

自動向量化功能

自動向量化會分析您程式碼中的迴圈，並且如果可以，會在目標電腦上使用向量暫存器和指令來執行它們。這可以改善您程式碼的效能。根據 /arch 參數，編譯程式會以 Intel 或 AMD 處理器中的 SSE2、AVX 和 AVX2 指令或 ARM 處理器上的 NEON 指令為目標。

自動向量化工具可能會產生不同的指令，而非 /arch 參數所指定的指令。這些指令受執行階段檢查保護，以確定該程式碼仍然能夠正確執行。例如，當您編譯 /arch:SSE2 時，可能會發出 SSE4.2 指令。執行階段檢查會驗證目標處理器是否適用 SSE4.2，若該處理器不支援這些指令的話，便會跳到非 SSE4.2 版本的迴圈。

根據預設，會啟用自動向量化工具。如果您想要比較向量化下程式代碼的效能，您可以使用 #pragma 迴圈（no_vector）來停用任何指定迴圈的向量化。

#pragma loop(no_vector)
for (int i = 0; i < 1000; ++i)
   A[i] = B[i] + C[i];

如同所有 pragma 指示詞，也支援替代 pragma 語法 __pragma(loop(no_vector)) 。

如同自動平行化程式，您可以指定 /Qvec-report （Auto-Vectorizer 報告層級）命令行選項，只報告成功的向量化迴圈，/Qvec-report:1或成功且不成功的向量化迴圈 — — 。/Qvec-report:2

如需原因碼和訊息的詳細資訊，請參閱 Vectorizer 和 Parallelizer 訊息。

如需示範向量化工具實際運作方式的範例，請參閱 Project 奧斯丁第 2 部分 6：頁面捲曲

另請參閱

循環
 原生程式代碼中的平行程序設計
 /Qpar (自動平行化工具)
/Qpar-report (自動平行化程式報告級別)
/Qvec-report (自動向量化工具報告層級)
向量化工具和平行化工具訊息

意見反應

此頁面對您有幫助嗎？

Last updated on 2026-02-24