Gestione delle eccezioni ARM64

Windows in ARM64 usa lo stesso meccanismo di gestione delle eccezioni strutturate per le eccezioni generate dall'hardware asincrone e le eccezioni generate dal software sincrone. I gestori di eccezioni specifici per linguaggio si basano sulla gestione strutturata delle eccezioni di Windows utilizzando funzioni di supporto specifiche del linguaggio. Questo documento descrive la gestione delle eccezioni in Windows in ARM64. Illustra gli helper del linguaggio usati dal codice generato dall'assembler Microsoft ARM e dal compilatore MSVC.

Obiettivi e motivazione

Le convenzioni dei dati di rimozione delle eccezioni e questa descrizione sono destinate a:

Fornire una descrizione sufficiente per consentire la rimozione senza eseguire il probe del codice in tutti i casi.
- L'analisi del codice richiede che il codice venga caricato in memoria. Impedisce la rimozione in alcune circostanze in cui è utile (traccia, campionamento, debug).
- L'analisi del codice è complessa; il compilatore deve prestare attenzione a generare solo istruzioni che il disassemblatore può decodificare.
- Se lo srotolamento non può essere descritto completamente usando i codici di srotolamento, in alcuni casi deve passare alla decodifica delle istruzioni. La decodifica delle istruzioni aumenta la complessità complessiva e idealmente dovrebbe essere evitata.
Supporto della rimozione nel prologo intermedio e nell'epilogo intermedio.
- Il disimballo viene utilizzato in Windows per scopi oltre alla gestione delle eccezioni. È fondamentale che il codice possa riallinearsi accuratamente anche durante una sequenza di codice di prologo o epilogo.
Occupare una quantità minima di spazio.
- I codici di disimballo non devono essere combinati tanto da aumentare significativamente la dimensione del file binario.
- Poiché è probabile che i codici di rimozione siano bloccati in memoria, un footprint ridotto garantisce un sovraccarico minimo per ogni file binario caricato.

Presupposti

Questi presupposti vengono effettuati nella descrizione della gestione delle eccezioni:

I prologi e gli epilogi tendono a rispecchiarsi tra loro. Sfruttando questo tratto comune, le dimensioni dei metadati necessari per descrivere la rimozione possono essere notevolmente ridotte. All'interno del corpo della funzione, non importa se le operazioni del prologo vengono annullate o le operazioni dell'epilogo vengono eseguite in un modo avanti. Entrambi devono produrre risultati identici.
Le funzioni tendono a essere relativamente piccole. Diverse ottimizzazioni per lo spazio si basano su questo fatto per ottenere la compressione più efficiente dei dati.
Non esiste codice condizionale negli epilogi.
Registro puntatore frame dedicato: se l'oggetto viene salvato in un altro registro () nel prologo, tale registro rimane invariato in tutta la funzione. Significa che l'originale può essere recuperato in qualsiasi momento.
A meno che non venga salvato in un altro registro, tutte le manipolazioni del puntatore dello stack avvengono rigorosamente all'interno del prologo e dell'epilogo.
Il layout dello stack frame è organizzato come descritto nella sezione successiva.

Layout dello stack frame ARM64

Diagramma che mostra il layout dello stack frame per le funzioni.layout stack frame

Per le funzioni concatenate di frame, la coppia e possono essere salvate in qualsiasi posizione nell'area delle variabili locali, a seconda delle considerazioni sull'ottimizzazione. L'obiettivo è ottimizzare il numero di variabili locali che possono essere raggiunte da una singola istruzione in base al puntatore frame () o al puntatore dello stack (). Tuttavia, per le funzioni , deve essere concatenato e deve puntare alla parte inferiore dello stack. Per consentire una migliore copertura del *register-pair-addressing-mode*, le aree di salvataggio dei registri non volatili vengono posizionate nella parte superiore dello stack dell'area locale. Ecco alcuni esempi che illustrano diverse delle sequenze di prologo più efficienti. Per motivi di chiarezza e migliore localizzazione della cache, l'ordine di archiviazione dei registri salvati dal chiamato in tutti i prolog canonici è in ordine "crescente". sotto rappresenta le dimensioni dell'intero stack (escluso l'area ). e indicano le dimensioni dell'area locale (inclusa l'area di salvataggio per la coppia) e le dimensioni dei parametri in uscita, rispettivamente.

Concatenato, #localsz = 512

    stp    x19,x20,[sp,#-96]!        // pre-indexed, save in 1st FP/INT pair
    stp    d8,d9,[sp,#16]            // save in FP regs (optional)
    stp    x0,x1,[sp,#32]            // home params (optional)
    stp    x2,x3,[sp,#48]
    stp    x4,x5,[sp,#64]
    stp    x6,x7,[sp,#82]
    stp    x29,lr,[sp,#-localsz]!   // save <x29,lr> at bottom of local area
    mov    x29,sp                   // x29 points to bottom of local
    sub    sp,sp,#outsz             // (optional for #outsz != 0)

Concatenato, #localsz 512

    stp    x19,x20,[sp,#-96]!        // pre-indexed, save in 1st FP/INT pair
    stp    d8,d9,[sp,#16]            // save in FP regs (optional)
    stp    x0,x1,[sp,#32]            // home params (optional)
    stp    x2,x3,[sp,#48]
    stp    x4,x5,[sp,#64]
    stp    x6,x7,[sp,#82]
    sub    sp,sp,#(localsz+outsz)   // allocate remaining frame
    stp    x29,lr,[sp,#outsz]       // save <x29,lr> at bottom of local area
    add    x29,sp,#outsz            // setup x29 points to bottom of local area

Funzioni terminali scollegate ( non salvate)
```
    stp    x19,x20,[sp,#-80]!       // pre-indexed, save in 1st FP/INT reg-pair
    stp    x21,x22,[sp,#16]
    str    x23,[sp,#32]
    stp    d8,d9,[sp,#40]           // save FP regs (optional)
    stp    d10,d11,[sp,#56]
    sub    sp,sp,#(framesz-80)      // allocate the remaining local area
```
Tutte le variabili locali sono accessibili in base a . punta al frame precedente. Per le dimensioni del frame = 512, l'oggetto può essere ottimizzato se l'area salvata regs viene spostata nella parte inferiore dello stack. Lo svantaggio è che non è coerente con altri layout precedenti. Inoltre, i registri salvati occupano parte dello spazio riservato ai registri accoppiati e alle modalità di indirizzamento con offset pre- e post-indicizzati.

Funzioni non terminali svincolate (salvano nell'area int salvata)

    stp    x19,x20,[sp,#-80]!       // pre-indexed, save in 1st FP/INT reg-pair
    stp    x21,x22,[sp,#16]         // ...
    stp    x23,lr,[sp,#32]          // save last Int reg and lr
    stp    d8,d9,[sp,#48]           // save FP reg-pair (optional)
    stp    d10,d11,[sp,#64]         // ...
    sub    sp,sp,#(framesz-80)      // allocate the remaining local area

Oppure, con un numero pari di registri Int salvati,

    stp    x19,x20,[sp,#-80]!       // pre-indexed, save in 1st FP/INT reg-pair
    stp    x21,x22,[sp,#16]         // ...
    str    lr,[sp,#32]              // save lr
    stp    d8,d9,[sp,#40]           // save FP reg-pair (optional)
    stp    d10,d11,[sp,#56]         // ...
    sub    sp,sp,#(framesz-80)      // allocate the remaining local area

Salvato solo :

    sub    sp,sp,#16                // reg save area allocation*
    stp    x19,lr,[sp]              // save x19, lr
    sub    sp,sp,#(framesz-16)      // allocate the remaining local area

* L'allocazione dell'area di salvataggio reg non viene integrata in perché non è possibile rappresentare un reg-lr preindicizzato con i codici di unwind.

Tutte le variabili locali sono accessibili in base a . punta al frame precedente.

Concatenato, #framesz = 512, #outsz = 0
```
    stp    x29,lr,[sp,#-framesz]!       // pre-indexed, save <x29,lr>
    mov    x29,sp                       // x29 points to bottom of stack
    stp    x19,x20,[sp,#(framesz-32)]   // save INT pair
    stp    d8,d9,[sp,#(framesz-16)]     // save FP pair
```
Rispetto al primo esempio di prologo precedente, questo esempio presenta un vantaggio: tutte le istruzioni di salvataggio del registro sono pronte per l'esecuzione dopo una sola istruzione di allocazione dello stack. Ciò significa che non c'è alcuna anti-dipendenza da che impedisca il parallelismo a livello di istruzione.

Incatena, dimensione del frame 512 (facoltativo per le funzioni senza )

    stp    x29,lr,[sp,#-80]!            // pre-indexed, save <x29,lr>
    stp    x19,x20,[sp,#16]             // save in INT regs
    stp    x21,x22,[sp,#32]             // ...
    stp    d8,d9,[sp,#48]               // save in FP regs
    stp    d10,d11,[sp,#64]
    mov    x29,sp                       // x29 points to top of local area
    sub    sp,sp,#(framesz-80)          // allocate the remaining local area

A scopo di ottimizzazione, può essere inserito in qualsiasi posizione nell'area locale per offrire una copertura migliore per "reg-pair" e per la modalità di indirizzamento con offset pre-/post-indicizzato. È possibile accedere alle variabili locali sotto i puntatori di stack in base a .

Concatenato, dimensioni frame 4K, con o senza alloca(),

    stp    x29,lr,[sp,#-80]!            // pre-indexed, save <x29,lr>
    stp    x19,x20,[sp,#16]             // save in INT regs
    stp    x21,x22,[sp,#32]             // ...
    stp    d8,d9,[sp,#48]               // save in FP regs
    stp    d10,d11,[sp,#64]
    mov    x29,sp                       // x29 points to top of local area
    mov    x15,#(framesz/16)
    bl     __chkstk
    sub    sp,sp,x15,lsl#4              // allocate remaining frame
                                        // end of prolog
    ...
    sub    sp,sp,#alloca                // more alloca() in body
    ...
                                        // beginning of epilog
    mov    sp,x29                       // sp points to top of local area
    ldp    d10,d11,[sp,#64]
    ...
    ldp    x29,lr,[sp],#80              // post-indexed, reload <x29,lr>

Informazioni sulla gestione delle eccezioni ARM64

registrazioni

I record sono una matrice ordinata di elementi a lunghezza fissa che descrivono ogni funzione di modifica dello stack in un file binario PE. La frase "manipolazione dello stack" è significativa: le funzioni foglia che non richiedono alcuna risorsa di archiviazione locale e non devono salvare/ripristinare registri non volatili, non richiedono un record. Questi record devono essere omessi in modo esplicito per risparmiare spazio. Una districazione da una di queste funzioni può ottenere l'indirizzo di ritorno direttamente da per risalire fino al chiamante.

Ogni record per ARM64 ha una lunghezza di 8 byte. Il formato generale di ogni record inserisce l'RVA a 32 bit dell'inizio della funzione nella prima parola, seguita da una seconda parola che contiene un puntatore a un blocco a lunghezza variabile o una parola compressa che descrive una sequenza di ricalcolo di una funzione canonica.

Layout del record .pdata.Layout dei record .pdata

I campi sono i seguenti:

Indirizzo RVA di inizio della funzione è l'RVA a 32 bit dell'inizio della funzione.
Flag è un campo a 2 bit che indica come interpretare i 30 bit rimanenti della seconda parola. Se Flag è 0, i bit rimanenti formano un RVA delle informazioni sulle eccezioni (con i due bit più bassi in modo implicito 0). Se Flag è diverso da zero, i bit rimanenti formano una struttura di dati di ripristino compatti.
RVA delle informazioni sulle eccezioni è l'indirizzo della struttura delle informazioni sulle eccezioni a lunghezza variabile, archiviata nella sezione . Questi dati devono essere allineati a 4 byte.
I dati di rimozione compressi sono una descrizione compressa delle operazioni necessarie per la rimozione da una funzione, presupponendo una forma canonica. In questo caso, non è necessario alcun record.

registrazioni

Quando il formato di rimozione compresso non è sufficiente per descrivere la rimozione di una funzione, è necessario creare un record a lunghezza variabile. L'indirizzo di questo record viene archiviato nella seconda parola del record. Il formato di è un set di parole a lunghezza variabile compresso:

Layout di record xdata.Layout di record xdata

Questi dati sono suddivisi in quattro sezioni:

Un'intestazione di 1 parola o 2 parole che descrive le dimensioni complessive della struttura e fornisce i dati della funzione chiave. La seconda parola è presente solo se i campi Epilog Count e Code Words sono impostati su 0. L'intestazione include questi campi di bit:

a) La lunghezza della funzione è un campo a 18 bit. Indica la lunghezza totale della funzione in byte, divisa per 4. Se una funzione è maggiore di 1M, è necessario usare più record e per descrivere la funzione. Per altre informazioni, vedere la sezione Funzioni Large.

b. Vers è un campo a 2 bit. Descrive la versione della parte rimanente . Attualmente è definita solo la versione 0, quindi i valori di 1-3 non sono consentiti.

c. X è un campo a 1 bit. Indica la presenza (1) o l'assenza (0) dei dati delle eccezioni.

d. E è un campo a 1 bit. Indica che le informazioni che descrivono un singolo epilogo vengono compresse nell'intestazione (1) anziché richiedere più parole di ambito più avanti (0).

e. Epilog Count è un campo a 5 bit con due significati, a seconda dello stato di E bit:
1. Se E è 0, specifica il conteggio del numero totale di ambiti epilogi descritti nella sezione 2. Se nella funzione esistono più di 31 ambiti, il campo Parole codice deve essere impostato su 0 per indicare che è necessaria una parola di estensione.
2. Se E è 1, questo campo specifica l'indice del primo codice di disimballaggio che descrive l'unico epilogo.
f. Parole di codice è un campo a 5 bit che specifica il numero di parole a 32 bit necessarie per contenere tutti i codici di rimozione nella sezione 3. Se sono necessarie più di 31 parole (ovvero 124 codici di rimozione), questo campo deve essere 0 per indicare che è necessaria una parola di estensione.

g. Il Conteggio degli Epiloghi Estesi e le Parole di Codice Estese sono rispettivamente campi a 16 bit e a 8 bit. Forniscono più spazio per la codifica di un numero insolitamente elevato di epilogi o un numero insolitamente elevato di parole di codice di rimozione. La parola di estensione che contiene questi campi è presente solo se i campi Epilog Count e Code Words nella prima parola di intestazione sono 0.
Se il numero di epilogi non è zero, un elenco di informazioni sugli ambiti dell'epilogo, compattato uno a una parola, segue l'intestazione e l'eventuale intestazione estesa. Vengono archiviati in ordine di offset iniziale crescente. Ogni ambito contiene i bit seguenti:

a) Epilog Start Offset è un campo a 18 bit con offset in byte, diviso per 4, dell'epilogo rispetto all'inizio della funzione.

b. Res è un campo a 4 bit riservato per l'espansione futura. Il suo valore deve essere 0.

c. Epilog Start Index è un campo a 10 bit (2 bit in più rispetto alle parole di codice estese). Indica l'indice del byte del primo codice di rilascio che descrive questo epilogo.
Dopo l'elenco degli ambiti dell'epilogo segue una matrice di byte che contiene codici di ripristino, descritti in dettaglio in una sezione successiva. Questa matrice viene riempita alla fine fino al più vicino confine di parola completa. I codici di unwind vengono scritti in questa matrice. Iniziano con quello più vicino al corpo della funzione e si spostano verso i bordi della funzione. I byte per ogni codice di ripristino vengono archiviati in ordine big-endian, in modo che il byte più significativo venga recuperato per primo, identificando l'operazione e la lunghezza del resto del codice.
Infine, dopo i byte del codice di rimozione, se il bit X nell'intestazione è stato impostato su 1, vengono fornite le informazioni sul gestore eccezioni. È costituito da un'unica RVA del gestore eccezioni che fornisce l'indirizzo del gestore eccezioni stesso. Viene seguito immediatamente da una quantità di dati a lunghezza variabile richiesta dal gestore delle eccezioni.

Il record è progettato in modo da poter recuperare i primi 8 byte e usarli per calcolare le dimensioni complete del record, meno la lunghezza dei dati delle eccezioni di dimensioni variabili che seguono. Il frammento di codice seguente calcola le dimensioni del record:

ULONG ComputeXdataSize(PULONG Xdata)
{
    ULONG Size;
    ULONG EpilogScopes;
    ULONG UnwindWords;

    if ((Xdata[0] >> 22) != 0) {
        Size = 4;
        EpilogScopes = (Xdata[0] >> 22) & 0x1f;
        UnwindWords = (Xdata[0] >> 27) & 0x1f;
    } else {
        Size = 8;
        EpilogScopes = Xdata[1] & 0xffff;
        UnwindWords = (Xdata[1] >> 16) & 0xff;
    }

    if (!(Xdata[0] & (1 << 21))) {
        Size += 4 * EpilogScopes;
    }

    Size += 4 * UnwindWords;

    if (Xdata[0] & (1 << 20)) {
        Size += 4;  // Exception handler RVA
    }

    return Size;
}

Anche se il prologo e ogni epilogo hanno un proprio indice nei codici di rimozione, la tabella viene condivisa tra di essi. È del tutto possibile (e non del tutto insolito) che possano condividere tutti gli stessi codici. Per un esempio, vedere l'esempio 2 nella sezione Esempi. Gli sviluppatori di compilatori dovrebbero ottimizzare per questo caso in particolare. Il motivo è che l'indice più grande che può essere specificato è 255, che limita il numero totale di codici di rimozione per una determinata funzione.

Codici di rimozione

La matrice di codici di rimozione è un pool di sequenze che descrivono esattamente come annullare gli effetti del prologo. Vengono archiviati nello stesso ordine in cui le operazioni devono essere annullate. I codici di disimballaggio possono essere considerati come un piccolo set di istruzioni, codificati come stringa di byte. Al termine dell'esecuzione, l'indirizzo restituito alla funzione chiamante si trova nel registro. Inoltre, tutti i registri non volatili vengono ripristinati ai relativi valori al momento della chiamata della funzione.

Se si garantisse che le eccezioni si verificassero solo all'interno del corpo di una funzione e mai all'interno di un prologo o di un epilogo, allora sarebbe necessaria solo una singola sequenza. Tuttavia, il modello di disassemblaggio Windows richiede che il codice possa essere disassemblato da un prologo o un epilogo in fase di esecuzione parziale. Per soddisfare questo requisito, i codici di annullamento sono stati progettati attentamente affinché corrispondano in modo esatto 1:1 a ciascun codice operativo pertinente nel prologo e nell'epilogo. Questa progettazione ha diverse implicazioni:

Conteggiando il numero di codici di recupero, è possibile calcolare la lunghezza del prologo ed epilogo.
Conteggiando il numero di istruzioni oltre l'inizio di un ambito epilogo, è possibile ignorare il numero equivalente di codici di riavvolgimento. È possibile eseguire il resto di una sequenza per completare la rimozione parzialmente eseguita dall'epilogo.
Contando il numero di istruzioni prima della fine del prologo, è possibile ignorare il numero equivalente di codici di disimpegno. È possibile eseguire il resto della sequenza per annullare solo le parti del prologo che hanno completato l'esecuzione.

I codici di unwind vengono codificati in base alla tabella seguente. Tutti i codici di rimozione sono un byte singolo/doppio, ad eccezione di quello che alloca uno stack enorme (). Ci sono 22 codici di rimozione in totale. Ogni codice di ripristino corrisponde a esattamente un'istruzione nel prologo/epilogo, per consentire il ripristino di prologhi ed epiloghi parzialmente eseguiti.

Codice di rimozione	Bit e interpretazione
`alloc_s`	000xxxxx: allocare uno stack di piccole dimensioni con dimensioni 512 (2^5 * 16).
`save_r19r20_x`	001zzzzz: salva coppia in , con offset preindicizzato = -248
`save_fplr`	01zzzzzz: salva la coppia in corrispondenza di , offset = 504.
`save_fplr_x`	10zzzzzz: salva coppia a , offset pre-indicizzato = -512
`alloc_m`	11000xxx'xxxxxxxx: allocare una grande pila di dimensione 32K (2^11 * 16).
`save_regp`	110010xx'xxzzzzzz: salva coppia a , offset = 504
`save_regp_x`	110011xx'xxzzzzzz: salva coppia a , offset pre-indicizzato = -512
`save_reg`	110100xx'xxzzzzzz: salva reg a , offset = 504
`save_reg_x`	1101010x'xxxzzzzz: salva il registro in , offset pre-indicizzato = -256
`save_lrpair`	1101011x'xxzzzzzz: salva coppia in , offset = 504
`save_fregp`	1101100x'xxzzzzzz: salva coppia in , offset = 504
`save_fregp_x`	1101101x'xxzzzzzz: salva coppia in , offset pre-indicizzato = -512
`save_freg`	1101110x'xxzzzzzz: salva registro in ; offset = 504
`save_freg_x`	11011110'xxxzzzzz: salva registrazione a , offset preindicizzato = -256
`alloc_z`	11011111'zzzzzzzz: allocare pila con dimensioni
`alloc_l`	11100000'xxxxxxxx'xxxxxxxx'xxxxxxxx: allocare stack di grandi dimensioni con dimensioni 256M (2^24 * 16)
`set_fp`	11100001: configurare con
`add_fp`	11100010'xxxxxxxx: configura con
`nop`	11100011: non è necessaria alcuna operazione di rimozione.
`end`	11100100: fine del codice di rimozione. Implica nell'epilogo.
`end_c`	11100101: fine del codice di unwind nell'ambito concatenato corrente.
`save_next`	11100110: salvare la coppia di registri successiva.
`save_any_xreg`	11100111'0pxrrrrr'00oooooo: salva registro/i : 0/1 = singolo vs coppia : 0/1 = offset dello stack positivo o negativo pre-indicizzato : offset = * 16, se x=1 o p=1, altrimenti * 8 (È richiesto Windows >= 11)
`save_any_dreg`	11100111'0pxrrr'01ooooooo: save register(s) : 0/1 = singolo vs coppia : 0/1 = offset dello stack positivo o negativo pre-indicizzato : offset = * 16, se x=1 o p=1, altrimenti * 8 (È richiesto Windows >= 11)
`save_any_qreg`	11100111'0pxrrr'10ooooo: salva registri : 0/1 = singolo vs coppia : 0/1 = offset dello stack positivo o negativo pre-indicizzato : offset = * 16 (Windows > = 11 è richiesto)
`save_zreg`	11100111'0oo0rrrr'11oooooo: salvare reg in , ( a ) su
`save_preg`	11100111'0oo1rrrr'11oooooo: salvare reg in , ( tramite ; i valori sono riservati)
	11100111'1yyyyyy': riservato
	11101xxx: riservato per i casi di stack personalizzati sotto generati solo per le routine asm
	11101000: Stack personalizzato per
	11101001: stack personalizzato per
	11101010: Stack personalizzato per
	11101011: stack personalizzato per
	11101100: stack personalizzato per
	11101101: riservato
	11101110: riservato
	11101111: riservato
	11110xxx: riservato
	11111000'yyyyyyyy : riservato
	11111001'yyyyyyyy'yyyyyyyy : riservato
	11111010'yyyyyyyy'yyyyyyyy'yyyyyyyy : riservato
	11111011'yyyyyyyy'yyyyyyyy'yyyyyyyy'yyyyyyyy : riservato
`pac_sign_lr`	11111100: firmare l'indirizzo di ritorno in con
	11111101: riservato
	11111110: riservato
	11111111: riservato

Nelle istruzioni con valori di grandi dimensioni che coprono più byte, i bit più significativi vengono archiviati per primi. Questa progettazione consente di trovare le dimensioni totali in byte del codice di rimozione cercando solo il primo byte del codice. Poiché ogni codice di annullamento viene mappato esattamente a un'istruzione in un prologo o un epilogo, è possibile calcolare la dimensione del prologo o dell'epilogo. Passare dall'inizio della sequenza alla fine e usare una tabella di ricerca o un dispositivo simile per determinare la lunghezza del codice operativo corrispondente.

L'indirizzamento dell'offset post-indicizzato non è consentito in un prologo. Tutti gli intervalli di offset (#Z) corrispondono alla codifica dell'indirizzamento di ad eccezione di , in cui 248 è sufficiente per tutte le aree di salvataggio (10 registri Int + 8 registri FP + 8 registri di input).

deve seguire un salvataggio per una coppia di registri: , , , , o un altro . Può anche essere usato in combinazione con o , ma solo quando . Salva la successiva coppia di registri in ordine numerico crescente nello spazio successivo dello stack. non deve essere utilizzato oltre l'ultimo registro dello stesso tipo.

Poiché le dimensioni delle istruzioni di ritorno e di salto regolari sono le stesse, non è necessario un codice di uscita separato negli scenari di chiamata finale.

è progettato per gestire frammenti di funzione non contigui a scopo di ottimizzazione. Un che indica la fine dei codici di disaccoppiamento nell'ambito corrente deve essere seguito da un'altra serie di codici di disaccoppiamento che terminano con un . I codici di rimozione tra e rappresentano le operazioni di prologo nell'area padre (un prologo "fantasma"). Altri dettagli ed esempi sono descritti nella sezione seguente.

Dati di rimozione compressi

Per le funzioni i cui prologi ed epilogi seguono la forma canonica descritta di seguito, è possibile usare i dati di unwind compressi. Elimina completamente la necessità di un record e riduce significativamente il costo di fornire dati di annullamento. I prologi e gli epilogi canonici sono progettati per soddisfare i requisiti comuni di una funzione semplice: uno che non richiede un gestore eccezioni e che esegue le operazioni di configurazione e di disinstallazione in un ordine standard.

Il formato di un record con dati di rimozione compressi è simile al seguente:

Record con estensione pdata con dati di rimozione compressi.Record con estensione pdata con dati di rimozione compressi

I campi sono i seguenti:

Indirizzo RVA di inizio della funzione è l'RVA a 32 bit dell'inizio della funzione.
Flag è un campo a 2 bit come descritto in precedenza, con i significati seguenti:
- 00 = dati di rimozione compressi non utilizzati; i bit rimanenti puntano a un record
- 01 = dati di scartamento compressi utilizzati con un singolo prologo ed epilogo all'inizio e alla fine dell'ambito.
- 10 = dati di rimozione compressi usati per il codice senza prologo ed epilogo. Utile per descrivere segmenti di funzione separati
- 11 = riservato.
La lunghezza della funzione è un campo a 11 bit che fornisce la lunghezza dell'intera funzione in byte, divisa per 4. Se la funzione è maggiore di 8.000, è necessario usare invece un record completo .
Dimensione del frame è un campo a 9 bit che indica il numero di byte dello stack allocato per questa funzione, quindi diviso per 16. Le funzioni che allocano più di (8k-16) byte di stack devono utilizzare un record completo . Include l'area della variabile locale, l'area dei parametri in uscita, l'area int salvata dal chiamato Int e FP e l'area dei parametri home. Esclude l'area di allocazione dinamica.
CR è un flag a 2 bit che indica se la funzione include istruzioni aggiuntive per configurare una catena di frame e restituire un collegamento:
- 00 = funzione non associata, la coppia non viene salvata nello stack
- 01 = funzione non vincolata, viene salvata nello stack
- 10 = funzione concatenata con un indirizzo di ritorno firmato
- 11 = funzione concatenata, viene utilizzata un'istruzione coppia di memorizzazione/caricamento nel prologo/epilogo
H è un flag a 1 bit che indica se la funzione ospita i registri dei parametri integer (x0-x7) archiviandoli all'inizio della funzione. (0 = non si registra a casa, 1 = registri case).
RegI è un campo a 4 bit che indica il numero di registri INT non volatili (x19-x28) salvati nella posizione dello stack canonico.
RegF è un campo a 3 bit che indica il numero di registri FP non volatili (d8-d15) salvati nella posizione dello stack canonico. (RegF=0: non viene salvato alcun registro FP; RegF0: i registri FP RegF+1 vengono salvati). I dati di riavvolgimento compressi non possono essere usati per la funzione che salva un solo registro FP.

I prolog canonici appartenenti alle categorie 1, 2 (senza area dei parametri in uscita), 3 e 4 nella sezione sopra menzionata possono essere rappresentati dal formato di unwind compresso. Gli epilogi per le funzioni canoniche seguono una forma simile, ad eccezione del fatto che H non ha alcun effetto, l'istruzione viene omessa e l'ordine dei passaggi e le istruzioni in ogni passaggio vengono invertiti nell'epilogo. L'algoritmo per il pacchetto segue questi passaggi, descritti in dettaglio nella tabella seguente:

Passaggio 0: Pre-calcolo delle dimensioni di ogni area.

Passaggio 1: Firmare l'indirizzo restituito.

Passaggio 2: Salvare i registri salvati dal chiamato Int.

Passaggio 3: Questo passaggio è specifico per il tipo 4 nelle sezioni iniziali. viene memorizzato verso la fine dell'area Int.

Passaggio 4: Salvare i registri salvati dal chiamato FP.

Passaggio 5: Salvare gli argomenti di input nell'area dei parametri home.

Passaggio 6: Allocare lo stack rimanente, inclusa l'area locale, la coppia e l'area dei parametri in uscita. 6a corrisponde al tipo canonico 1. 6b e 6c sono per il tipo canonico 2. 6d e 6e sono sia per il tipo 3 che per il tipo 4.

Fase #	Valori dei segnali	Numero di istruzioni	Codice operativo (Opcode)	Codice di rimozione
0			`#intsz = RegI * 8;` `if (CR==01) #intsz += 8; // lr` `#fpsz = RegF * 8;` `if(RegF) #fpsz += 8;` `#savsz=((#intsz+#fpsz+88H)+0xf)&~0xf)` `#locsz = #famsz - #savsz`
1	CR == 10	1	`pacibsp`	`pac_sign_lr`
2	0 RegI= 10	RegI / 2 + RegI % 2	`stp x19,x20,[sp,#savsz]!` `stp x21,x22,[sp,#16]` `...`	`save_regp_x` `save_regp` `...`
3	CR == 01*	1	`str lr,[sp,#(intsz-8)]`*	`save_reg`
4	0 RegF= 7	(RegF + 1) / 2 + (RegF + 1) % 2)	`stp d8,d9,[sp,#intsz]`** `stp d10,d11,[sp,#(intsz+16)]` `...` `str d(8+RegF),[sp,#(intsz+fpsz-8)]`	`save_fregp` `...` `save_freg`
5	H == 1	4	`stp x0,x1,[sp,#(intsz+fpsz)]` `stp x2,x3,[sp,#(intsz+fpsz+16)]` `stp x4,x5,[sp,#(intsz+fpsz+32)]` `stp x6,x7,[sp,#(intsz+fpsz+48)]`	`nop` `nop` `nop` `nop`
6a	(CR == 10 \|\| CR == 11) && = 512	2	`stp x29,lr,[sp,#-locsz]!` `mov x29,sp`***	`save_fplr_x` `set_fp`
6b	(CR == 10 \|\| CR == 11) && 512 = 4080	3	`sub sp,sp,#locsz` `stp x29,lr,[sp,0]` `add x29,sp,0`	`alloc_m` `save_fplr` `set_fp`
6c	(CR == 10 \|\| CR == 11) && 4080	4	`sub sp,sp,4080` `sub sp,sp,#(locsz-4080)` `stp x29,lr,[sp,0]` `add x29,sp,0`	`alloc_m` `alloc_s`/`alloc_m` `save_fplr` `set_fp`
6d	(CR == 00 \|\| CR == 01) && = 4080	1	`sub sp,sp,#locsz`	`alloc_s`/`alloc_m`
6e	(CR == 00 \|\| CR == 01) && 4080	2	`sub sp,sp,4080` `sub sp,sp,#(locsz-4080)`	`alloc_m` `alloc_s`/`alloc_m`

* Se CR == 01 e RegI è un numero dispari , il passaggio 3 e l'ultimo nel passaggio 2 vengono uniti in un unico .

** Se RegI == 0, CR != 01 e RegF != 0, il primo per il virgola mobile esegue la predecrezione per regolare sp per allocare spazio per l'area di salvataggio FP/SIMD.

Nessuna istruzione corrispondente a è presente nell'epilogo. I dati di unrollamento compressi non possono essere usati se una funzione richiede il ripristino di da .

Rimozione di prologi parziali ed epilogi

Nelle situazioni di sbobinamento più comuni, l'eccezione o la chiamata si verifica nel corpo della funzione, distante dal prologo e da tutti gli epiloghi. In queste situazioni, lo svolgimento è semplice: lo svolgitore esegue semplicemente i codici nell'array di svolgimento. Inizia con l'indice 0 e continua fino a quando non viene rilevato un codice operativo.

È più difficile gestire correttamente il caso in cui si verifichi un'eccezione o un interrupt durante l'esecuzione di un prologo o un epilogo. In queste situazioni, lo stack frame è costruito solo parzialmente. Il problema consiste nel determinare esattamente cosa è stato fatto, per annullarlo correttamente.

Ad esempio, prendere questa sequenza di prologo ed epilogo:

0000:    stp    x29,lr,[sp,#-256]!          // save_fplr_x  256 (pre-indexed store)
0004:    stp    d8,d9,[sp,#224]             // save_fregp 0, 224
0008:    stp    x19,x20,[sp,#240]           // save_regp 0, 240
000c:    mov    x29,sp                      // set_fp
         ...
0100:    mov    sp,x29                      // set_fp
0104:    ldp    x19,x20,[sp,#240]           // save_regp 0, 240
0108:    ldp    d8,d9,[sp,224]              // save_fregp 0, 224
010c:    ldp    x29,lr,[sp],#256            // save_fplr_x  256 (post-indexed load)
0110:    ret    lr                          // end

Accanto a ogni codice operativo c'è il codice di disimballaggio appropriato che descrive questa operazione. Si può vedere come la serie di codici di rimozione per il prologo è un'immagine speculare esatta dei codici di rimozione per l'epilogo (senza contare l'istruzione finale dell'epilogo). Si tratta di una situazione comune: è per questo che si presuppongono sempre che i codici di rimozione per il prologo vengano archiviati in ordine inverso rispetto all'ordine di esecuzione del prologo.

Quindi, sia per il prologo che per l'epilogo, siamo rimasti con un set comune di codici di ripristino.

, , ,

Il caso dell'epilogo è semplice, perché è in ordine normale. A partire dall'offset 0 all'interno dell'epilogo (che inizia all'offset 0x100 nella funzione), ci si aspetta che la sequenza di annullamento completa venga eseguita, poiché non è stata ancora effettuata alcuna pulizia. Se ci troviamo con un'istruzione a offset 2 nell'epilogo, possiamo correttamente eseguire l'annullamento ignorando il primo codice di annullamento. Possiamo generalizzare questa situazione e presupporre una corrispondenza 1:1 tra opcodes e codici di annullamento. Quindi, per iniziare la rimozione dall'istruzione n nell'epilogo, è consigliabile ignorare i primi n codici di rimozione e iniziare l'esecuzione da lì.

Si scopre che una logica simile funziona per il prologo, eccetto che al contrario. Se si inizia la rimozione dall'offset 0 nel prologo, non si vuole eseguire alcuna operazione. Se cominciamo a srotolare dall'offset 2, che si trova dopo una istruzione, allora vogliamo iniziare a eseguire la sequenza di srotolamento partendo da un codice prima della fine. Tenere presente che i codici vengono archiviati in ordine inverso. E anche qui, possiamo generalizzare: se iniziamo a rimuovere dall'istruzione n nel prologo, dovremmo iniziare a eseguire n codici di rimozione dalla fine dell'elenco di codici.

I codici prologo ed epilogo non corrispondono sempre esattamente, motivo per cui la matrice di unwind potrebbe dover contenere diverse sequenze di codici. Per determinare l'offset di dove iniziare l'elaborazione dei codici, usare la logica seguente:

Se si esegue la rimozione dall'interno del corpo della funzione, iniziare a eseguire codici di rimozione in corrispondenza dell'indice 0 e continuare fino a raggiungere un codice operativo.
Se ci si scioglie dall'interno di un epilogo, utilizzare l'indice iniziale specifico dell'epilogo fornito con l'ambito dell'epilogo come riferimento. Calcola quanti byte il PC in questione si trova dall'inizio dell'epilogo. Procedi quindi attraverso i codici di unwind, saltando i codici di unwind fino a quando non vengono considerate tutte le istruzioni già eseguite. Quindi esegui a partire da quel punto.
Se si esegue la rimozione dal prologo, usare l'indice 0 come punto iniziale. Calcolare la lunghezza del codice di prologo dalla sequenza e quindi calcolare quanti byte dista il Program Counter (PC) dal termine del prologo. Procedi quindi attraverso i codici di unwind, ignorando i codici di unwind fino a quando tutte le istruzioni non ancora eseguite siano considerate. Quindi esegui a partire da quel punto.

Queste regole indicano che i codici di rimozione per il prologo devono essere sempre il primo nella matrice. E sono anche i codici usati per rilassarsi nel caso generale di rimozione dall'interno del corpo. Tutte le sequenze di codice specifiche dell'epilogo devono essere seguite immediatamente dopo.

Frammenti di funzione

Ai fini dell'ottimizzazione del codice e altri motivi, può essere preferibile suddividere una funzione in frammenti separati (dette anche aree). In caso di divisione, ogni frammento di funzione risultante richiede un record separato (ed eventualmente ).

Per ogni frammento secondario separato con un proprio prologo, è previsto che non venga eseguita alcuna regolazione dello stack nel prologo. Tutto lo spazio dello stack richiesto da un'area secondaria deve essere preallocato dall'area padre o dall'area host. Questa preallocazione assicura che la manipolazione del puntatore dello stack avvenga rigorosamente nel prologo originale della funzione.

Un caso tipico di frammenti di funzione è "separazione del codice", in cui il compilatore può spostare un'area di codice fuori dalla funzione host. Esistono tre casi insoliti che potrebbero derivare dalla separazione del codice.

Esempio

(area 1: inizio)

    stp     x29,lr,[sp,#-256]!      // save_fplr_x  256 (pre-indexed store)
    stp     x19,x20,[sp,#240]       // save_regp 0, 240
    mov     x29,sp                  // set_fp
    ...

(area 1: fine)
(regione 3: inizio)
```
    ...
```
(area 3: fine)

(regione 2: inizio)

    ...
    mov     sp,x29                  // set_fp
    ldp     x19,x20,[sp,#240]       // save_regp 0, 240
    ldp     x29,lr,[sp],#256        // save_fplr_x  256 (post-indexed load)
    ret     lr                      // end

(area 2: fine)

Solo prologo (area 1: tutti gli epilogi si trovano in aree separate):

È necessario descrivere solo il prologo. Questo prologo non può essere rappresentato nel formato compatto . Nel caso completo , può essere rappresentato impostando Epilog Count = 0. Vedere area 1 nell'esempio precedente.

Codici di ripristino: , , , .
Solo epilogi (area 2: prologo si trova nell'area host)

Si presuppone che, quando il controllo salta in questa regione, tutti i codici di prologo sono stati eseguiti. La rimozione parziale può verificarsi negli epilogi allo stesso modo di una funzione normale. Questo tipo di area non può essere rappresentato da compatto . In un record completo , può essere codificato con un prologo "fantasma", racchiuso da una coppia di codici di decompressione e . Il carattere iniziale indica che la dimensione del prologo è zero. L'indice iniziale dell'epilogo del singolo epilogo punta a .

Codice di rimozione per l'area 2: , , , , .
Nessun prologo o epilogo (area 3: prologi e tutti gli epilogi si trovano in altri frammenti):

Il formato compatto può essere applicato tramite l'impostazione Flag = 10. Con record completo , Epilog Count = 1. Il codice di unwind è uguale al codice per la regione 2 precedente, ma Epilog Start Index punta anche a . Il riavvolgimento parziale non verrà mai eseguito in questa area di codice.

Un altro caso più complesso di frammenti di funzione è il "shrink wrapping". Il compilatore può scegliere di ritardare il salvataggio di alcuni registri salvati dal chiamante fino a quando si esce dal prologo di ingresso della funzione.

(area 1: inizio)

    stp     x29,lr,[sp,#-256]!      // save_fplr_x  256 (pre-indexed store)
    stp     x19,x20,[sp,#240]       // save_regp 0, 240
    mov     x29,sp                  // set_fp
    ...

(regione 2: inizio)

    stp     x21,x22,[sp,#224]       // save_regp 2, 224
    ...
    ldp     x21,x22,[sp,#224]       // save_regp 2, 224

(area 2: fine)

    ...
    mov     sp,x29                  // set_fp
    ldp     x19,x20,[sp,#240]       // save_regp 0, 240
    ldp     x29,lr,[sp],#256        // save_fplr_x  256 (post-indexed load)
    ret     lr                      // end

(area 1: fine)

Nel prologo dell'area 1, lo spazio dello stack viene preallocato. È possibile notare che l'area 2 avrà lo stesso codice di rilascio anche se viene spostata dalla sua funzione host.

Regione 1: , , , . L'indice iniziale dell'epilogo punta a come di consueto.

Regione 2: , , , , , . Epilog Start Index punta al primo codice di disannidamento .

Funzioni di grandi dimensioni

I frammenti possono essere usati per descrivere le funzioni superiori al limite di 1M imposto dai campi di bit nell'intestazione . Per descrivere una funzione insolitamente grande come questa, deve essere suddivisa in frammenti più piccoli di 1M. Ogni frammento deve essere regolato in modo da non suddividere un epilogo in più parti.

Solo il primo frammento della funzione conterrà un prologo; tutti gli altri frammenti sono contrassegnati come senza prologo. A seconda del numero di epilogi presenti, ogni frammento può contenere zero o più epilogi. Ricorda che ogni ambito dell'epilogo in un frammento indica l'offset iniziale rispetto all'inizio del frammento, non all'inizio della funzione.

Se un frammento non ha prologo e nessun epilogo, richiede comunque il proprio record (ed eventualmente ) per descrivere come eseguire la rimozione dall'interno del corpo della funzione.

Esempi

Esempio 1: Concatenamento con frame, formato compatto

|Foo|     PROC
|$LN19|
    str     x19,[sp,#-0x10]!        // save_reg_x
    sub     sp,sp,#0x810            // alloc_m
    stp     fp,lr,[sp]              // save_fplr
    mov     fp,sp                   // set_fp
                                    // end of prolog
    ...

|$pdata$Foo|
    DCD     imagerel     |$LN19|
    DCD     0x416101ed
    ;Flags[SingleProEpi] functionLength[492] RegF[0] RegI[1] H[0] frameChainReturn[Chained] frameSize[2080]

Esempio 2: Collegamento a catena dei frame, formato completo con specchio prologo ed epilogo

|Bar|     PROC
|$LN19|
    stp     x19,x20,[sp,#-0x10]!    // save_regp_x
    stp     fp,lr,[sp,#-0x90]!      // save_fplr_x
    mov     fp,sp                   // set_fp
                                    // end of prolog
    ...
                                    // begin of epilog, a mirror sequence of Prolog
    mov     sp,fp
    ldp     fp,lr,[sp],#0x90
    ldp     x19,x20,[sp],#0x10
    ret     lr

|$pdata$Bar|
    DCD     imagerel     |$LN19|
    DCD     imagerel     |$unwind$cse2|
|$unwind$Bar|
    DCD     0x1040003d
    DCD     0x1000038
    DCD     0xe42291e1
    DCD     0xe42291e1
    ;Code Words[2], Epilog Count[1], E[0], X[0], Function Length[6660]
    ;Epilog Start Index[0], Epilog Start Offset[56]
    ;set_fp
    ;save_fplr_x
    ;save_r19r20_x
    ;end

Epilog Start Index [0] punta alla stessa sequenza di codice di unwind del Prolog.

Esempio 3: Funzione variadica non concatenata

|Delegate| PROC
|$LN4|
    sub     sp,sp,#0x50
    stp     x19,lr,[sp]
    stp     x0,x1,[sp,#0x10]        // save incoming register to home area
    stp     x2,x3,[sp,#0x20]        // ...
    stp     x4,x5,[sp,#0x30]
    stp     x6,x7,[sp,#0x40]        // end of prolog
    ...
    ldp     x19,lr,[sp]             // beginning of epilog
    add     sp,sp,#0x50
    ret     lr

    AREA    |.pdata|, PDATA
|$pdata$Delegate|
    DCD     imagerel |$LN4|
    DCD     imagerel |$unwind$Delegate|

    AREA    |.xdata|, DATA
|$unwind$Delegate|
    DCD     0x18400012
    DCD     0x200000f
    DCD     0xe3e3e3e3
    DCD     0xe40500d6
    DCD     0xe40500d6
    ;Code Words[3], Epilog Count[1], E[0], X[0], Function Length[18]
    ;Epilog Start Index[4], Epilog Start Offset[15]
    ;nop        // nop for saving in home area
    ;nop        // ditto
    ;nop        // ditto
    ;nop        // ditto
    ;save_lrpair
    ;alloc_s
    ;end

L'indice iniziale dell'epilogo [4] punta al centro del codice di rimozione prologo (matrice di rimozione parzialmente riutilizzata).

Vedi anche

Panoramica delle convenzioni ABI arm64
Gestione delle eccezioni di ARM

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-03-06

Gestione delle eccezioni ARM64

Obiettivi e motivazione

Presupposti

Layout dello stack frame ARM64

Informazioni sulla gestione delle eccezioni ARM64

registrazioni

registrazioni

Codici di rimozione

Dati di rimozione compressi

Rimozione di prologi parziali ed epilogi

Frammenti di funzione

Esempio

Funzioni di grandi dimensioni

Esempi

Esempio 1: Concatenamento con frame, formato compatto

Esempio 2: Collegamento a catena dei frame, formato completo con specchio prologo ed epilogo

Esempio 3: Funzione variadica non concatenata

Vedi anche

Commenti e suggerimenti

Risorse aggiuntive