HTML 文字セット
Microsoft FrontPage Visual Basic リファレンス (ページ オブジェクト モデル) |
HTML 文字セット
文字セットとは、HTML ドキュメントのテキストを表すバイト列を人間が認識できる文字列にどのように変換するかを規定するものです。Web ブラウザは、指定された文字セットに従って、ドキュメント内のバイト列を解釈します。ただし、数値表記や 16 進表記の文字参照 ("〹" や "ሴ") については、どの文字セットを適用しているかにかかわらず、Unicode Standard Version 2.0 に従い、ISO10646 コード ポイントとして解釈されます。また、名前付きエンティティの表示についても、適用されている文字セットに依存することはありません。数値で指定された文字参照をブラウザに表示するには、その文字を表示するためのフォントがユーザーのシステムにインストールされている必要があります。したがって、次の表の 1 列目は、一部のシステムでは正しく表示されないことがあります。
ISO ラテン-1 文字セット
次の表は、ISO ラテン-1 文字セットの一覧です。この文字セットは、Unicode 文字セットの最初の 256 文字に対応しています。この表の各列は、文字、10 進コード、HTML 上の名前付きエンティティ、および簡単な説明を示しています。
文字 | 10 進コード | 名前付きエンティティ | 説明 |
--- | � | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- | 	 | --- | 水平タブ |
--- | | --- | 改行文字 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- | | --- | 復帰文字 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
--- |  | --- | 未使用 |
  | --- | スペース | |
! | ! | --- | 感嘆符 |
" | " | " | 二重引用符 |
# | # | --- | 番号記号 |
$ | $ | --- | ドル記号 |
% | % | --- | パーセント記号 |
& | & | & | アンパサンド |
' | ' | --- | アポストロフィ |
( | ( | --- | 始め丸かっこ |
) | ) | --- | 終わり丸かっこ |
* | * | --- | アスタリスク |
+ | + | --- | 正符号 |
, | , | --- | コンマ |
- | - | --- | ハイフン |
. | . | --- | ピリオド |
/ | / | --- | スラッシュ |
0 | 0 | --- | 数字 0 |
1 | 1 | --- | 数字 1 |
2 | 2 | --- | 数字 2 |
3 | 3 | --- | 数字 3 |
4 | 4 | --- | 数字 4 |
5 | 5 | --- | 数字 5 |
6 | 6 | --- | 数字 6 |
7 | 7 | --- | 数字 7 |
8 | 8 | --- | 数字 8 |
9 | 9 | --- | 数字 9 |
: | : | --- | コロン |
; | ; | --- | セミコロン |
< | < | < | 不等号 (より小さい) |
= | = | --- | 等号 |
> | > | > | 不等号 (より大きい) |
? | ? | --- | 疑問符 |
@ | @ | --- | アットマーク |
A | A | --- | 大文字 A |
B | B | --- | 大文字 B |
C | C | --- | 大文字 C |
D | D | --- | 大文字 D |
E | E | --- | 大文字 E |
F | F | --- | 大文字 F |
G | G | --- | 大文字 G |
H | H | --- | 大文字 H |
I | I | --- | 大文字 I |
J | J | --- | 大文字 J |
K | K | --- | 大文字 K |
L | L | --- | 大文字 L |
M | M | --- | 大文字 M |
N | N | --- | 大文字 N |
O | O | --- | 大文字 O |
P | P | --- | 大文字 P |
Q | Q | --- | 大文字 Q |
R | R | --- | 大文字 R |
S | S | --- | 大文字 S |
T | T | --- | 大文字 T |
U | U | --- | 大文字 U |
V | V | --- | 大文字 V |
W | W | --- | 大文字 W |
X | X | --- | 大文字 X |
Y | Y | --- | 大文字 Y |
Z | Z | --- | 大文字 Z |
[ | [ | --- | 始め角かっこ |
\ | \ | --- | 逆斜線 (バックスラッシュ) |
] | ] | --- | 終わり角かっこ |
^ | ^ | --- | キャレット |
_ | _ | --- | 水平バー (アンダースコア) |
` | ` | --- | アクサン グラーブ |
a | a | --- | 小文字 a |
b | b | --- | 小文字 b |
c | c | --- | 小文字 c |
d | d | --- | 小文字 d |
e | e | --- | 小文字 e |
f | f | --- | 小文字 f |
g | g | --- | 小文字 g |
h | h | --- | 小文字 h |
i | i | --- | 小文字 i |
j | j | --- | 小文字 j |
k | k | --- | 小文字 k |
l | l | --- | 小文字 l |
m | m | --- | 小文字 m |
n | n | --- | 小文字 n |
o | o | --- | 小文字 o |
p | p | --- | 小文字 p |
q | q | --- | 小文字 q |
r | r | --- | 小文字 r |
s | s | --- | 小文字 s |
t | t | --- | 小文字 t |
u | u | --- | 小文字 u |
v | v | --- | 小文字 v |
w | w | --- | 小文字 w |
x | x | --- | 小文字 x |
y | y | --- | 小文字 y |
z | z | --- | 小文字 z |
{ | { | --- | 始め波かっこ |
| | | | --- | 縦棒 |
} | } | --- | 終わり波かっこ |
~ | ~ | --- | チルダ |
--- |  | --- | 未使用 |
  | | 非区切りスペース | |
! | ¡ | ¡ | 逆感嘆符 |
¢ | ¢ | ¢ | セント記号 |
£ | £ | £ | ポンド記号 |
? | ¤ | ¤ | 一般の通貨記号 |
\ | ¥ | ¥ | 円記号 |
| | ¦ | ¦ または &brkbar; | 破線の縦棒 |
§ | § | § | セクション記号 |
¨ | ¨ | ¨ or ¨ | 分音符号/ウムラウト |
c | © | © | 著作権 |
a | ª | ª | 女性オーディナル |
≪ | « | « | 始め山引用符 |
¬ | ¬ | 否定記号 | |
- | ­ | ­ | ソフト ハイフン |
R | ® | ® | 登録商標 |
 ̄ | ¯ | ¯ or &hibar; | 長音記号 |
° | ° | ° | 度記号 |
± | ± | ± | 正負符号 |
2 | ² | ² | 上付き 2 |
3 | ³ | ³ | 上付き 3 |
´ | ´ | ´ | アキュート アクセント |
μ | µ | µ | マイクロ記号 |
¶ | ¶ | 段落記号 | |
? | · | · | 中点 |
, | ¸ | ¸ | セディラ |
1 | ¹ | ¹ | 上付き 1 |
o | º | º | 男性オーディナル |
≫ | » | » | 終わり山引用符 |
? | ¼ | ¼ | 分数 4 分の 1 |
? | ½ | ½ | 分数 2 分の 1 |
? | ¾ | ¾ | 分数 4 分の 3 |
? | ¿ | ¿ | 逆疑問符 |
A | À | À | 大文字 A、アクサン グラーブ |
A | Á | Á | 大文字 A、アキュート アクセント |
A | Â | Â | 大文字 A、サーカムフレックス |
A | Ã | Ã | 大文字 A、チルダ |
A | Ä | Ä | 大文字 A、分音符号/ウムラウト |
A | Å | Å | 大文字 A、リング |
A | Æ | Æ | 大文字 AE の合字 |
C | Ç | Ç | 大文字 C、セディラ |
E | È | È | 大文字 E、アクサン グラーブ |
E | É | É | 大文字 E、アキュート アクセント |
E | Ê | Ê | 大文字 E、サーカムフレックス |
E | Ë | Ë | 大文字 E、分音符号/ウムラウト |
I | Ì | Ì | 大文字 I、アクサン グラーブ |
I | Í | Í | 大文字 I、アキュート アクセント |
I | Î | Î | 大文字 I、サーカムフレックス |
I | Ï | Ï | 大文字 I、分音符号/ウムラウト |
D | Ð | Ð | 大文字 Eth、アイスランド語 |
N | Ñ | Ñ | 大文字 N、チルダ |
O | Ò | Ò | 大文字 O、アクサン グラーブ |
O | Ó | Ó | 大文字 O、アキュート アクセント |
O | Ô | Ô | 大文字 O、サーカムフレックス |
O | Õ | Õ | 大文字 O、チルダ |
O | Ö | Ö | 大文字 O、分音符号/ウムラウト |
× | × | × | 乗算記号 |
O | Ø | Ø | 大文字 O、スラッシュ |
U | Ù | Ù | 大文字 U、アクサン グラーブ |
U | Ú | Ú | 大文字 U、アキュート アクセント |
U | Û | Û | 大文字 U、サーカムフレックス |
U | Ü | Ü | 大文字 U、分音符号/ウムラウト |
Y | Ý | Ý | 大文字 Y、アキュート アクセント |
T | Þ | Þ | 大文字 Thorn、アイスランド語 |
s | ß | ß | 小文字 sharp s、ドイツ語 sz |
a | à | à | 小文字 a、アクサン グラーブ |
a | á | á | 小文字 a、アキュート アクセント |
a | â | â | 小文字 a、サーカムフレックス |
a | ã | ã | 小文字 a、チルダ |
a | ä | ä | 小文字 a、分音符号/ウムラウト |
a | å | å | 小文字 a、リング |
a | æ | æ | 小文字 ae の合字 |
c | ç | ç | 小文字 c、セディラ |
e | è | è | 小文字 e、アクサン グラーブ |
e | é | é | 小文字 e、アキュート アクセント |
e | ê | ê | 小文字 e、サーカムフレックス |
e | ë | ë | 小文字 e、分音符号/ウムラウト |
i | ì | ì | 小文字 i、アクサン グラーブ |
i | í | í | 小文字 i、アキュート アクセント |
i | î | î | 小文字 i、サーカムフレックス |
i | ï | ï | 小文字 i、分音符号/ウムラウト |
d | ð | ð | 小文字 eth、アイスランド語 |
n | ñ | ñ | 小文字 n、チルダ |
o | ò | ò | 小文字 o、アクサン グラーブ |
o | ó | ó | 小文字 o、アキュート アクセント |
o | ô | ô | 小文字 o、サーカムフレックス |
o | õ | õ | 小文字 o、チルダ |
o | ö | ö | 小文字 o、分音符号/ウムラウト |
÷ | ÷ | ÷ | 除算記号 |
o | ø | ø | 小文字 o、スラッシュ |
u | ù | ù | 小文字 u、アクサン グラーブ |
u | ú | ú | 小文字 u、アキュート アクセント |
u | û | û | 小文字 u、サーカムフレックス |
u | ü | ü | 小文字 u、分音符号/ウムラウト |
y | ý | ý | 小文字 y、アキュート アクセント |
t | þ | þ | 小文字 thorn、アイスランド語 |
y | ÿ | ÿ | 小文字 y、分音符号/ウムラウト |
HTML 上のその他の名前付きエンティティ
次の表の各列は、その他の文字の名前付きエンティティ、数字表現、説明を示しています。始め山かっこと終わり山かっこ (〈 および 〉) を除き、この表のエンティティは、Lucida Sans Unicode を使用して表示されます。
文字 | 名前付きエンティティ | 数字表現 | 説明 |
ラテン拡張 B | |||
? | ƒ | ƒ | ラテン語のフック付きの小文字 f、=関数、=プロリン、U0192 ISOtech |
ギリシャ文字 | |||
Α | Α | Α | ギリシャ語の大文字アルファ、U0391 |
Β | Β | Β | ギリシャ語の大文字ベータ、U0392 |
Γ | Γ | Γ | ギリシャ語の大文字ガンマ、U0393 ISOgrk3 |
Δ | Δ | Δ | ギリシャ語の大文字デルタ、U0394 ISOgrk3 |
Ε | Ε | Ε | ギリシャ語の大文字イプシロン、U0395 |
Ζ | Ζ | Ζ | ギリシャ語の大文字ゼータ、U0396 |
Η | Η | Η | ギリシャ語の大文字エータ、U0397 |
Θ | Θ | Θ | ギリシャ語の大文字シータ、U0398 ISOgrk3 |
Ι | Ι | Ι | ギリシャ語の大文字イオタ、U0399 |
Κ | Κ | Κ | ギリシャ語の大文字カッパ、U039A |
Λ | Λ | Λ | ギリシャ語の大文字ラムダ、U039B ISOgrk3 |
Μ | Μ | Μ | ギリシャ語の大文字ミュー、U039C |
Ν | Ν | Ν | ギリシャ語の大文字ニュー、U039D |
Ξ | Ξ | Ξ | ギリシャ語の大文字クサイ、U039E ISOgrk3 |
Ο | Ο | Ο | ギリシャ語の大文字オミクロン、U039F |
Π | Π | Π | ギリシャ語の大文字パイ、U03A0 ISOgrk3 |
Ρ | Ρ | Ρ | ギリシャ語の大文字ロー、U03A1 |
Σ | Σ | Σ | ギリシャ語の大文字シグマ、U03A3 ISOgrk3 |
Τ | Τ | Τ | ギリシャ語の大文字タウ、U03A4 |
Υ | Υ | Υ | ギリシャ語の大文字ウプシロン、U03A5 ISOgrk3 |
Φ | Φ | Φ | ギリシャ語の大文字フィー、U03A6 ISOgrk3 |
Χ | Χ | Χ | ギリシャ語の大文字キー、U03A7 |
Ψ | Ψ | Ψ | ギリシャ語の大文字プサイ、U03A8 ISOgrk3 |
Ω | Ω | Ω | ギリシャ語の大文字オメガ、U03A9 ISOgrk3 |
α | α | α | ギリシャ語の小文字アルファ、U03B1 ISOgrk3 |
β | β | β | ギリシャ語の小文字ベータ、U03B2 ISOgrk3 |
γ | γ | γ | ギリシャ語の小文字ガンマ、U03B3 ISOgrk3 |
δ | δ | δ | ギリシャ語の小文字デルタ、U03B4 ISOgrk3 |
ε | ε | ε | ギリシャ語の小文字イプシロン、U03B5 ISOgrk3 |
ζ | ζ | ζ | ギリシャ語の小文字ゼータ、U03B6 ISOgrk3 |
η | η | η | ギリシャ語の小文字エータ、U03B7 ISOgrk3 |
θ | θ | θ | ギリシャ語の小文字シータ、U03B8 ISOgrk3 |
ι | ι | ι | ギリシャ語の小文字イオタ、U03B9 ISOgrk3 |
κ | κ | κ | ギリシャ語の小文字カッパ、U03BA ISOgrk3 |
λ | λ | λ | ギリシャ語の小文字ラムダ、U03BB ISOgrk3 |
μ | μ | μ | ギリシャ語の小文字ミュー、U03BC ISOgrk3 |
ν | ν | ν | ギリシャ語の小文字ニュー、U03BD ISOgrk3 |
ξ | ξ | ξ | ギリシャ語の小文字クサイ、U03BE ISOgrk3 |
ο | ο | ο | ギリシャ語の小文字オミクロン、U03BF NEW |
π | π | π | ギリシャ語の小文字パイ、U03C0 ISOgrk3 |
ρ | ρ | ρ | ギリシャ語の小文字ロー、U03C1 ISOgrk3 |
? | ς | ς | ギリシャ語の小文字ファイナル シグマ、U03C2 ISOgrk3 |
σ | σ | σ | ギリシャ語の小文字シグマ、U03C3 ISOgrk3 |
τ | τ | τ | ギリシャ語の小文字タウ、U03C4 ISOgrk3 |
υ | υ | υ | ギリシャ語の小文字ウプシロン、U03C5 ISOgrk3 |
φ | φ | φ | ギリシャ語の小文字フィー、U03C6 ISOgrk3 |
χ | χ | χ | ギリシャ語の小文字キー、U03C7 ISOgrk3 |
ψ | ψ | ψ | ギリシャ語の小文字プサイ、U03C8 ISOgrk3 |
ω | ω | ω | ギリシャ語の小文字オメガ、U03C9 ISOgrk3 |
θ | ϑ | ϑ | ギリシャ語の小文字シータ記号、U03D1 NEW |
Υ | ϒ | ϒ | ギリシャ語のフック記号付きのウプシロン、U03D2 NEW |
π | ϖ | ϖ | ギリシャ語のパイ記号、U03D6 ISOgrk3 |
一般句読点 | |||
? | • | • | 箇条書き、=黒の小さい円、U2022 ISOpub |
… | … | … | 水平省略記号、=点 3 つ、U2026 ISOpub |
′ | ′ | ′ | プライム、=分、=フィート、U2032 ISOtech |
′ | ″ | ″ | ダブル プライム、=秒、=インチ、U2033 ISOtech |
? | ‾ | ‾ | 上線、=スペース付きオーバースコア、U203E NEW |
? | ⁄ | ⁄ | 分数用スラッシュ、U2044 NEW |
文字様記号 | |||
℘ | ℘ | 筆記体の大文字 P、=電源、=ワイエルシュトラス p、U2118 ISOamso | |
ℑ | ℑ | ゴシック体の大文字 I、=虚数部、U2111 ISOamso | |
ℜ | ℜ | ゴシック体の大文字 R、=実数部、U211C ISOamso | |
? | ™ | ™ | 登録商標記号、U2122 ISOnum |
ℵ | ℵ | アレフ記号、=最初の超限基数、U2135 NEW | |
矢印 | |||
← | ← | 左矢印、U2190 ISOnum | |
↑ | ↑ | ↑ | 上矢印、U2191 ISOnum |
→ | → | → | 右矢印、U2192 ISOnum |
↓ | ↓ | ↓ | 下矢印、U2193 ISOnum |
? | ↔ | ↔ | 左右矢印、U2194 ISOamsa |
↵ | ↵ | 角が左に曲がっている下矢印、=復帰文字、U21B5 NEW | |
⇐ | ⇐ | 左二重矢印、U21D0 ISOtech | |
⇑ | ⇑ | 上二重矢印、U21D1 ISOamsa | |
⇒ | ⇒ | 右二重矢印、U21D2 ISOtech | |
⇓ | ⇓ | 下二重矢印、U21D3 ISOamsa | |
⇔ | ⇔ | 左右二重矢印、U21D4 ISOamsa | |
数学記号 | |||
∀ | ∀ | ∀ | すべての (普通限定子)、U2200 ISOtech |
∂ | ∂ | ∂ | 微分、U2202 ISOtech |
∃ | ∃ | ∃ | 存在する (存在限定子)、U2203 ISOtech |
∅ | ∅ | 空集合、=null 集合、=直径、U2205 ISOamso | |
∇ | ∇ | ∇ | ナブラ、=後方差分、U2207 ISOtech |
∈ | ∈ | ∈ | 要素である、U2208 ISOtech |
∉ | ∉ | 要素でない、U2209 ISOtech | |
∋ | ∋ | ∋ | 元として含む、U220B ISOtech |
? | ∏ | ∏ | n 乗、=乗算記号、U220F ISOamsb |
? | ∑ | − | n 回加算、U2211 ISOamsb |
? | − | − | 減算記号、U2212 ISOtech |
∗ | ∗ | アスタリスク演算子、U2217 ISOtech | |
√ | √ | √ | 平方根、=ルート記号、U221A ISOtech |
∝ | ∝ | ∝ | 比例、U221D ISOtech |
∞ | ∞ | ∞ | 無限、U221E ISOtech |
∠ | ∠ | ∠ | 角度、U2220 ISOamso |
⊥ | ∧ | ⊥ | 論理積、=くさび形、U2227 ISOtech |
∨ | ⊦ | 論理和、=V 形、U2228 ISOtech | |
∩ | ∩ | ∩ | 共通集合、=キャップ、U2229 ISOtech |
∪ | ∪ | ∪ | 和集合、=カップ、U222A ISOtech |
∫ | ∫ | ∫ | 積分、U222B ISOtech |
∴ | ∴ | ∴ | したがって、U2234 ISOtech |
? | ∼ | ∼ | チルダ演算子、=多様性、=類似性、U223C ISOtech |
≅ | ≅ | ほぼ等しい、U2245 ISOtech | |
≈ | ≅ | ほぼ等しい、=漸近、U2248 ISOamsr | |
≠ | ≠ | ≠ | 等しくない、U2260 ISOtech |
≡ | ≡ | ≡ | 定義、U2261 ISOtech |
? | ≤ | ≤ | 以下、U2264 ISOtech |
? | ≥ | ≥ | 以上、U2265 ISOtech |
⊂ | ⊂ | ⊂ | 真部分集合、U2282 ISOtech |
⊃ | ⊃ | ⊃ | 真部分集合 (逆方向)、U2283 ISOtech |
⊄ | ⊄ | 真部分集合でない、U2284 ISOamsn | |
⊆ | ⊆ | ⊆ | 部分集合、U2286 ISOtech |
⊇ | ⊇ | ⊇ | 部分集合 (逆方向)、U2287 ISOtech |
? | ⊕ | ⊕ | 円付き正符号、=直和、U2295 ISOamsb |
⊗ | ⊗ | 円付きかける記号、=ベクトル積、U2297 ISOamsb | |
⊥ | ⊥ | ⊥ | 垂直、=直交、=直角、U22A5 ISOtech |
⋅ | ⋅ | ドット演算子、U22C5 ISOamsb | |
その他の技術用記号 | |||
⌈ | ⌈ | 左上限、=APL の upstile、U2308、ISOamsc | |
⌉ | ⌉ | 右上限、U2309、ISOamsc | |
⌊ | ⌊ | 左下限、=APL の downstile、U230A、ISOamsc | |
⌋ | ⌋ | 右下限、U230B、ISOamsc | |
< | ⟨ | 〈 | 始め山かっこ、=ブラ、U2329 ISOtech |
> | ⟩ | 〉 | 終わり山かっこ、=ケット、U232A ISOtech |
幾何学記号 | |||
? | ◊ | ◊ | ひし形、U25CA ISOpub |
その他の記号 | |||
? | ♠ | ♠ | トランプの黒のスペードの組、U2660 ISOpub |
? | ♣ | ♣ | トランプの黒のクラブの組、=三つ葉のクローバー、U2663 ISOpub |
? | ♥ | ♥ | トランプの黒のハートの組、=バレンタイン、U2665 ISOpub |
♦ | ♦ | トランプの黒のダイヤモンドの組、U2666 ISOpub |
特殊記号の文字エンティティと BIDI テキスト
NE の使用 | NE | NCR | NCR の使用 |
C0 コントロールと基本ラテン | |||
" | " | " | 引用符、=APL の quote、U0022 ISOnum |
& | & | & | アンパサンド、U0026 ISOnum |
< | < | < | 不等号 (より小)、U003C ISOnum |
> | > | > | 不等号 (より大)、U003E ISOnum |
ラテン拡張 A | |||
? | &OElig | Œ | ラテン語の大文字 oe の合字、U0152 ISOlat2 |
? | &oelig | œ | ラテン語の小文字 oe の合字、U0153 ISOlat2 |
? | &Scaron | Š | ラテン語の大文字 s (カロン付き)、U0160 ISOlat2 |
? | &scaron | š | ラテン語の小文字 s (カロン付き)、U0161 ISOlat2 |
? | &Yuml | Ÿ | ラテン語の大文字 y (分音符号付き)、U0178 ISOlat2 |
スペース調整文字 | |||
? | &circ | ˆ | 変長音符、U02C6 ISOpub |
? | &tilde | ˜ | 小さいチルダ、U02DC ISOdia |
一般句読点 | |||
&ensp |   | en スペース、U2002 ISOpub | |
&emsp |   | em スペース、U2003 ISOpub | |
&thinsp |   | thin スペース、U2009 ISOpub | |
? | &zwnj | ‌ | ゼロ幅の非結合子、U200C NEW RFC 2070 |
? | &zwj | ‍ | ゼロ幅の結合子、U200D NEW RFC 2070 |
&lrm | ‎ | 左から右へのマーク、U200E NEW RFC 2070 | |
&rlm | ‏ | 右から左へのマーク、U200F NEW RFC 2070 | |
? | &ndash | – | en ダッシュ、U2013 ISOpub |
? | &mdash | — | em ダッシュ、U2014 ISOpub |
‘ | &lsquo | ‘ | 始め単一引用符、U2018 ISOnum |
’ | &rsquo | ’ | 終わり単一引用符、U2019 ISOnum |
? | &sbquo | ‚ | low-9 単一引用符、U201A NEW |
“ | &ldquo | “ | 始め二重引用符、U201C ISOnum |
” | &rdquo | ” | 右二重引用符、U201D ISOnum |
? | &bdquo | „ | low-9 二重引用符、U201E NEW |
† | &dagger | † | ダガー、U2020 ISOpub |
† | &Dagger | ‡ | ダブル ダガー、U2021 ISOpub |
‰ | &permil | ‰ | パーミル、U2030 ISOtech |
< | &lsaquo | ‹ | 始め単一山引用符、U2039 ISO 提案 |
> | &rsaquo | › | 終わり単一山引用符、U203A ISO 提案 |
文字セットの認識
Microsoft Internet Explorer は、指定された文字セットを使用して、ドキュメントのバイト列をどのように変換して画面や紙に表示するかを決定します。既定では、Internet Explorer は、サーバーから返される HTTP content-type で指定された文字セットを使用します。このパラメータが指定されていない場合には、Internet Explorer はドキュメントの META 要素で指定された文字セットを使用します。META 要素も指定されていない場合には、ユーザーがブラウザのオプションで設定したものを使用します。
META 要素を使用すると、ドキュメントの文字セットを明示的に指定することができます。この場合、HTTP-EQUIV= 属性を "Content-Type" とし、CONTENT= 属性で文字セットの識別子を指定します。たとえば、次の META 要素では、ドキュメントの文字セットとして windows-1251 を指定しています。
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=windows-1251">
BODY 要素より前に META 要素を記述した場合、その設定は TITLE 要素も含めドキュメント全体に適用されます。表示対象となる最初の要素が解析される前に確実にエンコードが認識されるようにするには、できる限り META 要素を HEAD 要素の直後に記述してください。なお、META 要素は、それを含むドキュメントに対して適用されます。したがって、複合ドキュメント (フレーム セット内で複数のドキュメントで構成されるドキュメント) では、各々のフレームに異なる文字セットを指定することもできます。
次の表の各列は、Internet Explorer 5 でサポートされている文字セットに関連する情報を示しています。掲載されている情報には、次のものがあります。
表示名 ? 文字セットを参照するときに使用する名前。
望ましい文字セット ID ? Internet Explorer で文字セットを設定するときに使用できる最も一般的な ID。たとえば、前のコード サンプルの windows-1251 は文字セット ID です。
その他のエイリアス ? 文字セットを設定するときに使用できるその他の ID。
MLang コード ページ ? Internet Explorer MLang API で使用されるコード ページの数値。
サポートされているバージョン ? リストされている文字セットをサポートしている Internet Explorer のバージョン。
メモ CS は、そのバージョンの Internet Explorer がアラビア語、ヘブライ語、タイ語などの複合型の言語をサポートしている必要があることを示します。
Microsoft Internet Explorer 5 の文字セット
表示名 | 望ましい文字セット ID | その他のエイリアス | MLang コード ページ | サポートされているバージョン |
アラビア語 (ASMO-708) | ASMO-708 | 708 | 4CS、5 | |
アラビア語 (DOS) | DOS-720 | 720 | 4CS、5 | |
アラビア語 (ISO) | iso-8859-6 | ISO_8859-6:1987、iso-ir-127、ISO_8859-6、ECMA-114、arabic、csISOLatinArabic | 28596 | 4CS、5 |
アラビア語 (Windows) | windows-1256 | 1256 | 4CS、5 | |
バルト言語 (ISO) | iso-8859-4 | csISOLatin4、iso-ir-110、ISO_8859-4、ISO_8859-4:1988、l4、latin4 | 28594 | 4、5 |
バルト言語 (Windows) | Windows-1257 | 1257 | 4、5 | |
中央ヨーロッパ言語 (DOS) | ibm852 | cp852 | 852 | 4、5 |
中央ヨーロッパ言語 (ISO) | iso-8859-2 | csISOLatin2、iso-ir-101、iso8859-2、iso_8859-2、iso_8859-2:1987、l2、latin2 | 28592 | 3、4、5 |
中央ヨーロッパ言語 (Windows) | windows-1250 | x-cp1250 | 1250 | 3、4、5 |
簡体字中国語 (GB2312) | gb2312 | chinese、csGB2312、csISO58GB23128、GB2312、GBK、GB_2312-80、iso-ir-58 | 936 | 3、4、5 |
簡体字中国語 (HZ) | hz-gb-2312 | 52936 | 4、5 | |
繁体字中国語 | big5 | csbig5、x-x-big5 | 950 | 3、4、5 |
キリル言語 (DOS) | cp866 | ibm866 | 866 | 4、5 |
キリル言語 (ISO) | iso-8859-5 | csISOLatinCyrillic、cyrillic、iso-ir-144、ISO_8859-5、ISO_8859-5:1988 | 28595 | 4、5 |
キリル言語 (KOI8-R) | koi8-r | csKOI8R、koi | 20866 | 3、4、5 |
キリル言語 (Windows) | windows-1251 | x-cp1251 | 1251 | 3、4、5 |
ギリシャ語 (ISO) | iso-8859-7 | csISOLatinGreek、ECMA-118、ELOT_928、greek、greek8、iso-ir-126、ISO_8859-7、ISO_8859-7:1987 | 28597 | 3、4、5 |
ギリシャ語 (Windows) | Windows-1253 | windows-1253 | 1253 | 5 |
ヘブライ語 (DOS) | DOS-862 | 862 | 4CS、5 | |
ヘブライ語 (ISO) | iso-8859-8 | csISOLatinHebrew、hebrew、iso-ir-138、ISO_8859-8、visual、ISO-8859-8 Visual | 28598 | 4CS、5 |
ヘブライ語 (Windows) | windows-1255 | logical、ISO_8859-8:1988、iso-ir-138 | 1255 | 3CS、4CS、5 |
日本語 (JIS) | iso-2022-jp | csISO2022JP | 50220 | 4、5 |
日本語 (JIS 1 バイト カタカナ可) | csISO2022JP | iso-2022-jp | 50221 | 4、5 |
日本語 (JIS 1 バイト カタカナ可 - SO/SI) | iso-2022-jp | csISO2022JP | 50222 | 3、4、5 |
日本語 (EUC) | euc-jp | csEUCPkdFmtJapanese、Extended_UNIX_Code_Packed_ Format_for_Japanese、x-euc、x-euc-jp |
51932 | 3、4、5 |
日本語 (シフト JIS) | shift_jis | csShiftJIS、csWindows31J、ms_Kanji、shift-jis、x-ms-cp932、x-sjis | 932 | 3、4、5 |
韓国語 | ks_c_5601-1987 | csKSC56011987、euc-kr、korean、ks_c_5601 | 949 | 3、4、5 |
韓国語 (ISO) | iso-2022-kr | csISO2022KR | 50225 | 3、4、5 |
ラテン語 3 (ISO) | iso-8859-3 | 28593 | 4、5 | |
タイ語 (Windows) | iso-8859-11 | windows-874 | 874 | 3、4、5 |
トルコ語 (Windows) | Windows-1254 | windows-1254 | 1254 | 3、4、5 |
トルコ語 (ISO) | iso-8859-9 | csISOLatin5、ISO_8859-9、ISO_8859-9:1989、iso-ir-148、l5、latin5 | 28599 | 3、4、5 |
ウクライナ語 (KOI8-U) | koi8-u | 21866 | 4、5 | |
Unicode (UTF-7) | utf-7 | csUnicode11UTF7、unicode-1-1-utf-7、x-unicode-2-0-utf-7 | 65000 | 4、5 |
Unicode (UFT-8) | utf-8 | unicode-1-1-utf-8、unicode-2-0-utf-8、x-unicode-2-0-utf-8 | 65001 | 4、5 |
ベトナム語 (Windows) | windows-1258 | 1258 | 3、4、5 | |
西ヨーロッパ言語 (Windows) | Windows-1252 | 1252 | 5 | |
西ヨーロッパ言語 (ISO) | iso-8859-1 | ANSI_X3.4-1968、ANSI_X3.4-1986、ascii、cp367、cp819、csASCII、IBM367、ibm819、iso-ir-100、iso-ir-6、ISO646-US、iso8859-1、ISO_646.irv:1991、iso_8859-1、iso_8859-1:1987、latin1、us、us-ascii、x-ansi | 1252 | 3、4、5 |
Internet Explorer および MLang で特別な意味を持つ非標準文字セット
これらの文字セットは、ドキュメントのエンコード指定には使用できません。
表示名 | 望ましい文字セット ID | その他のエイリアス | MLang コード ページ | サポートされているバージョン |
日本語 (自動選択) | _autodetect | 50932 | 3、4、5 | |
韓国語 (自動選択) | _autodetect_kr | 50949 | 4、5 | |
Unicode | unicode | 1200 | 4、5 | |
Unicode (BigEndian) | unicodeFEFF | 1201 | 4、5 | |
ユーザー定義 | x-user-defined | 50000 | 4、5 |