Set di caratteri

Un "set di caratteri" è un mapping di caratteri ai relativi valori di codice di identificazione. Il set di caratteri più comunemente usato nei computer è attualmente Unicode, uno standard globale per la codifica dei caratteri. Internamente, le applicazioni Windows usano l'implementazione UTF-16 di Unicode. In UTF-16 la maggior parte dei caratteri è identificata da codici a due byte. I caratteri supplementari meno usati sono rappresentati da una coppia di surrogati, ovvero una coppia di codici a due byte. Per altre informazioni, vedere surrogati e caratteri supplementari.

Alcune applicazioni Windows devono funzionare con i set di caratteri meno recenti nativi di Windows Me/98/95. tabelle codici di Windows consentire all'applicazione di usare questi set di caratteri. Questi set di caratteri possono essere suddivisi in:

set di caratteri a byte singolo (SBCS). In un SBC ogni carattere è identificato da un valore largo un byte.
Set di caratteri multibyte, in particolare i set di caratteri a byte doppio (DBCS). I set di caratteri multibyte forniscono un mezzo per rappresentare il numero elevato di caratteri in molte lingue asiatiche.

Per altre informazioni, vedere gli argomenti seguenti:

informazioni sui set di caratteri e Unicode

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2025-03-12

Condividi tramite

Set di caratteri

Argomenti correlati

Commenti e suggerimenti

Risorse aggiuntive