初心者でもタグやスタイルシートを学んで、思い通りのホームページが作成できる講座を、現在メールマガジンにて配信しています。当サイトを利用するに当たって、是非メールマガジンを購読することをお勧めします。なお、未だ購読されていない方はこちらから登録できます。念のため無料です。今週のおさらいバックナンバーはこちらから
第1号 第2号 第3号 第4号 第5号 第6号 第7号 第8号 第9号 第10号
第11号 第12号 第13号 第14号 第15号 第16号 第17号 第18号 第19号 第20号
第21号 第22号 第23号 第24号 第25号 目次
今週<第26号>マガジンのおさらい
毎週金曜日配信 What's New 2002/11/8
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
今週の課題 ■ HTMLのデータ形式
■ HTML4.01で扱う特殊文字 --- 実体参照符号
HTMLデータ形式についての詳細は、当サイト内のリファレンス HTML 基本データ形式 を参照してください。ここでは抜粋し引用しています。
| CS | 値に大文字と小文字の区別があります。ユーザエージェントは「a」と「A」を異なるものとして解釈します。 |
| CI | 値に大文字と小文字の区別がありません。ユーザエージェントは「a」と「A」を等しいものとして解釈します。 |
| CN | 文字種変換の影響を受けません。属性値が数値であるため大文字と小文字の区別がないというのが大きな理由です。 |
| CA | 要素、あるいは属性の定義自体に大文字と小文字の区別がある場合、ユーザエージェントはこれを理解します。 |
| CT | 大文字と小文字の区別については、ユーザエージェントはデータ形式の定義を参照します。 |
CDATA は文書文字集合中の任意の文字の列であり、実体参照も含まれます。ユーザエージェントはこの属性値を次のように解釈しています。
& は &のまま表示します。マークアップと実体参照とはそのままのテキストとして扱い、何も変化させることなくアプリケーション(CSSやスクリプト)に引き渡すことになります。最初に現れる「 </ 」(終了タグの開始区切り子)は、そこで要素が終わるものとして扱います。これらは非HTMLのデータ形式として定義されています。
IDは、id属性の値として使われる形式です。大文字と小文字の区別があります。また、NAMEと同じ制限も持っています。
MIMEタイプの例として、「text/html」、「image/png」、「image/gif」、「video/mpeg」、「text/css」、「audio/basic」などがあります。
文書をカラー化することにより、より多くの情報を提供することになり、読みやすくするものですが、カラー化に当たってはW3Cのアクセシビリティ指針を考慮することが求められています。
YYYY-MM-DDThh:mm:ssTZD
| YYYY | 4桁の西暦年 |
| MM | 2桁の月数(01の時には1月を表す) |
| DD | 2桁の日にち(01から31までが割り当てられる) |
| hh | 2桁の時刻(00〜23まで。am/pmは許されていません) |
| mm | 2桁の分数(00〜59まで) |
| ss | 2桁の秒数(00〜59まで) |
| TZD | タイムゾーンを示す |
TZDのタイムゾーンは、UTC(Coordinated Universal Time: 協定標準時間)を表し、「Z」は大文字でなければなりません。日本時間の場合には「+09:00:00」なので、
2002-11-08T23:10:00+09:00 の表記になります。
文字の実体参照中には、コンピューターの制御符号が含まれ、そのままの文字を使用すると、動作に影響を及ぼす可能性すらあります。 そのために、実体参照符号としての文字を表示する場合には、文字符号、あるいは番号符号で記述することが推奨されています。
HTMLの記述に半角カタカナが使えないのは広く知られています。半角カタカナの最初のコードに制御符号となるものがあり、そのために文字化けが起きてしまいます。実体参照の文字には同様の危険が潜んでいる可能性もありますので、できるだけ符号(コード)で記述するようにしましょう。
例:ギリシャ語のシータの場合 Θ 実際例 Θ
| 10進数 | 表示 | 文字符号 | 表示 | 16進数 | 説明 |
|---|---|---|---|---|---|
| < | < | < | < | 3C | Left angle bracket |
| > | > | > | > | 3E | Right angle bracket |
| & | & | & | & | 26 | Ampersand |
| " | " | " | " | 22 | Duble quote mark |
これらの実体参照の表示は、HTML4.0以降に対応しないブラウザでは空白、ドット、四角、疑問符などに置き換えられて表示されます。特に、ÿ 以降の実体参照では顕著です。
ここでは、実際のラテン実体参照の一部を表示しています。| 10進数 | 表示 | 文字符号 | 表示 | 16進数 | 説明 |
|---|---|---|---|---|---|
|   | | | | A0 | Non breaking space |
| ¡ | ¡ | ¡ | ¡ | A1 | Inverted exclamation mark |
| ¢ | ¢ | ¢ | ¢ | A2 | Cent sign |
| £ | £ | £ | £ | A3 | Pound sterling symbol |
| ¤ | ¤ | ¤ | ¤ | A4 | Currency symbol |
| ¥ | ¥ | ¥ | ¥ | A5 | Yen symbol |
| ¦ | ¦ | ¦ | ¦ | A6 | Broken vertical bar |
| § | § | § | § | A7 | Section symbol |
| ¨ | ¨ | ¨ | ¨ | A8 | Umalaut/Dieresis |
| © | © | © | © | A9 | Copyright sign |
| ª | ª | ª | ª | AA | Ordinal indicator,Feminine |
| « | « | « | « | AB | Left angle quote mark |
| ¬ | ¬ | ¬ | ¬ | AC | "not" symbol |
| ­ | | ­ | | AD | Soft hyphen |
| ® | ® | ® | ® | AE | Registered trademark symbol |
| ¯ | ¯ | ¯ | ¯ | AF | macron |
| ° | ° | ° | ° | B0 | Degree symbol |
| ± | ± | ± | ± | B1 | Plus/minus symbol |
| ² | ² | ² | ² | B2 | Superscript two |
| ³ | ³ | ³ | ³ | B3 | Superscript three |
| ´ | ´ | ´ | ´ | B4 | Acute accent |
| µ | µ | µ | µ | B5 | Micro symbol |
| ¶ | ¶ | ¶ | ¶ | B6 | Paragraph symbol |
| · | · | · | · | B7 | Middle dot |
| ¸ | ¸ | ¸ | ¸ | B8 | Cedilla |
| ¹ | ¹ | ¹ | ¹ | B9 | Superscript one |
| º | º | º | º | BA | Ordinal indicator |
| » | » | » | » | BB | Angle quote mark, right |
| ¼ | ¼ | ¼ | ¼ | BC | Fraction one quarter |
| ½ | ½ | ½ | ½ | BD | Fraction one half |
| ¾ | ¾ | ¾ | ¾ | BE | Fraction three quarters |
| ¿ | ¿ | ¿ | ¿ | BF | Inverted question mark |
実体参照の詳しい一覧表は、応用編の文字の実体参照一覧表を参照してください。