誰も使っていない、存在しないはずの漢字なのに、なぜか公式な文字コードに登録されている。
そんな奇妙な文字たちが「幽霊文字」と呼ばれていることをご存じでしょうか?
国の機関によって登録されたのに、実在する文献でも辞書でも見つからない。
その背景には、日本語の文字コード整備における意外な事情やミス、そしてデジタル化の混乱が隠れています。
幽霊文字(幽霊漢字)とは何か?
「幽霊文字(幽霊漢字)」とは、実際の文献や使用例が存在しないにもかかわらず、JISコードやUnicodeなどの文字コードに、出典検証がなされないまま登録されてしまった漢字のことです。
まるで実体のない「幽霊」のように文字体系に紛れ込んでしまったことから、この名が付けられました。印刷物・書籍・辞書で確認できないばかりか、そのほとんどが読みも意味も不明という、まさに「謎の文字」たちです。
現代のデジタル環境では、フォントの進化によって文字として表示できてしまうため、その存在を知らなければ誰もが実在する漢字だと信じてしまう可能性があります。
なぜ存在しない文字が登録されたのか?
幽霊文字が生まれた背景には、1970年代から80年代にかけての日本のコンピュータ環境が大きく関わっています。
1978年に制定されたJIS X 0208(通称「JIS漢字コード」)は、日本で初めて漢字をコンピュータで統一的に扱うための規格でした。しかし、その文字選定プロセスに大きな問題があったのです。
当時、全国の官公庁や出版社から集められたさまざまな文書や活字見本をもとに、機械的に文字をピックアップする作業が行われました。その過程で、筆記の誤り、活版印刷のミス、出典不明な文字などが十分な検証を経ることなく紛れ込んでしまい、そのまま正式な文字として登録されてしまったのです。
特に、JIS第1・第2水準に含まれる漢字には、このような経緯で登録されてしまった文字が数十文字存在すると言われています。これらは「実在しない文字」として後に特定されましたが、技術的な互換性の問題などから、長い間コード表に残り続けました。
代表的な幽霊文字一覧
以下は、幽霊文字として特に知られる文字の一部です。これらの中には、今もなおその起源が解明されていないものも少なくありません。
幽霊文字 | 概要と背景 |
---|---|
妛 | 読みは「し」とされています。JIS X 0208:1978で登録されたが、対応する漢字が不明。滋賀県にある「𡚴原(あけんばら)」という地名で使われたとされる字の誤字という説が有力ですが、決定的な証拠は見つかっていません。 |
彁 | 読みは「か」「せい」。JIS X 0208:1978で登録されたが、対応する漢字は不明。幽霊文字といえども「音読み」を割り当てる必要があったため、便宜的な読み方。実在する漢字ではないとされています。 |
垔 | 読みは「いん」。JIS X 0208:1978で登録されたが、対応する漢字が不明。字形は「土」と「西」を組み合わせたもので、実在する漢字「堙」の誤字ではないかと考えられています。 |
彑 | 部首「けいがしら」そのものですが、漢字としては存在しません。JIS X 0208:1978では独立した漢字として登録されていましたが、実在しないと判明し削除されました。 |
𠀃 | Unicodeには存在するが、JISには登録されていない幽霊文字。こちらも実用例はほぼなく、どのような経緯で登録されたのかは不明です。 |
𡚝 | Unicodeに存在する文字。これも実在が確認されていない幽霊文字です。 |
なぜ幽霊文字は問題なのか?
幽霊文字は、単なる「謎の文字」というだけでなく、実際の社会において様々な問題を引き起こす可能性があります。
- 誤用や混乱の原因: 辞書や文献に載っていないため、本来の読みや意味が不明確であり、誤った解釈や使用を生む原因となります。
- 人名・戸籍・行政システムでの混乱: たとえば戸籍システムで、誤ってこれらの文字が人名に登録されてしまうと、その人の名前が他のシステムで正しく表示されなかったり、戸籍謄本の電子化に支障をきたしたりする恐れがあります。
- データ連携の障害: 異なるシステム間で文字コードの変換を行う際、幽霊文字が原因で文字化けを起こし、データのやり取りがうまくいかないケースも考えられます。
まとめ
幽霊文字は、文字コードの制定という歴史的な過程で生まれた、いわば「文字の都市伝説」のような存在です。
その起源は技術的なミスや人為的な誤りに起因していますが、存在しないはずの文字がデジタル空間に残り続けるという事実は、私たちに文字の定義やその運用について深く考えさせます。
何気なく見かけた珍しい漢字は、実は「幽霊」なのかもしれません。
コメント