JIS漢字コードの水準について

JIS漢字コードの水準まとめ

JIS漢字コードの水準は、日本工業規格(JIS)が定める漢字の分類で、情報処理や文字コード規格において使用される漢字の範囲を示します。

JIS水準は、主にJIS X 0208とJIS X 0213の2つの規格に基づいて分類されます。

水準 漢字数 特徴
第1水準 2,965字 一般的に使われる漢字(常用漢字を含む)
第2水準 3,390字 専門用語・人名・地名などで使われる漢字
第3水準 1,259字 JIS X 0208にないが、比較的使用頻度の高い漢字
第4水準 2,436字 より使用頻度が低いが特定の分野で必要な漢字

JIS水準は、公的文書や名前表記などに影響を与えるため、現在も重要な役割を持っています。

JIS X 0208(旧来のJIS漢字)

JIS X 0208は、日本語の電子化や情報処理のために制定された漢字コード規格で、以下の2つの水準に分けられています。

第1水準漢字(2,965字)

一般的な文章で広く使われる漢字が含まれ、ほとんどの常用漢字を網羅しています。

第2水準漢字(3,390字)

人名、地名、専門用語などに使用される漢字が多く含まれます。

JIS X 0213(拡張JIS漢字)

JIS X 0213は、JIS X 0208に収録されていなかった漢字を追加し、日本語の表記をより豊かにするために制定された規格です。この規格では、新たに第3水準と第4水準が追加されました。

第3水準漢字(1,259字)

JIS X 0208では表現できなかったが、比較的使用頻度の高い漢字を追加したもの。

第4水準漢字(2,436字)

さらに使用頻度が低いが、特定の分野で必要とされる漢字を追加したもの。

JIS漢字コードの歴史

JIS漢字コードの歴史は、日本語情報処理の発展とともに歩んできました。本記事では、JIS漢字コードの制定と改定の流れを中心に、その変遷を振り返ります。

JIS漢字コードの誕生

日本語をコンピュータで扱うためには、漢字のコード化が必要でした。そこで、日本工業規格(JIS)によって制定されたのが「JIS漢字コード」です。

JIS C 6226-1978(旧JIS)

  • 収録文字数: 6,355文字(第一水準漢字 2,965字、第二水準漢字 3,390字)
  • 特徴: 7ビットまたは8ビットで表現する2バイトコード
  • 課題: 追加の必要性が指摘された

JIS X 0208-1983(新JIS)

  • 字体の統一
  • 印刷標準との整合
  • 制御文字の整理

JIS X 0208-1990(改定JIS)

  • 文字の位置変更
  • 字体の調整

JIS X 0212-1990(補助漢字の導入)

  • 収録文字数: 5,801文字
  • JIS X 0208で不足していた漢字を補完
  • Shift_JISとの互換性が低く普及しなかった

JIS X 0213-2000/2004(拡張JIS)

  • 2000年版: 追加漢字(3,685字)を収録
  • 2004年版: Unicodeとの整合性向上

Unicodeとの統合

2000年代以降、世界標準の文字コードであるUnicodeが普及し、JIS漢字コードとの統合が進みました。

  • UnicodeはJIS X 0208やJIS X 0213の文字を収録
  • 国際的なシステムとの互換性が向上

まとめ

JIS漢字コードの歴史は、日本語情報処理の発展とともに歩んできました。現在ではUnicodeが主流となっていますが、JIS漢字コードは依然として日本国内のデータ互換性のために重要な役割を果たしています。

年代 規格名 特徴
1978年 JIS C 6226-1978 初のJIS漢字コード(6,355字)
1983年 JIS X 0208-1983 字体の統一、配置見直し
1990年 JIS X 0208-1990 配置変更、印刷標準との整合
1990年 JIS X 0212-1990 補助漢字(5,801字)追加
2000年 JIS X 0213-2000 追加漢字(3,685字)収録
2004年 JIS X 0213-2004 Unicodeとの整合性向上

漢字の知識&コラム