知っておきたい世界のニュース

6万の漢字をコード化しコンピューターで使えることに、ネットには異論も

6万の漢字をコード化しコンピューターで使えることに、ネットには異論も

flickr_WOCinTech Chat

コンピューターで表示できない日本語の漢字、いわゆる「外字」。これが今後、使用できる見通しとなった。

6万の漢字コードを国際規格に登録

NHKによれば、そもそも日本語の漢字は戸籍などに使われているものも含めて6万字あるのに対し、これまではコンピューター上では1万字しか使うことが出来なかったという。

それもコンピューターに割り振られている世界共通の文字コードが、5万の漢字につけられていなかったからとされている。

そのため独自に外字を作っても、メーカーごとの互換性はなく、データを受け渡してもコンピューターが認識できず、文字化けしていたそうだ。

このためIPA（情報処理推進機構）は平成14年から、経済産業省とともに外字を含めて約6万の漢字1つ1つにコードを割り振る作業を開始。今回作業が完了し、国際規格として登録されたという。

最初に登録された漢字は6000文字

具体的にはこれまでどのような漢字が使えなかったのか。戸籍で使われている漢字のうち、「渡辺」の「べ」は「辺」「邉」「邊」など11種類あるが、このうちコンピューターで使えたのは3文字。

また「斎藤」の「サイ」も「斎」「斉」「齋」「齊」など60種類あるが、このうち扱えたのは15文字ほどだったという。

そもそも日本で初めて漢字コードが作られたのは、昭和53年。当時はコンピューターの能力も低いことから、登録された漢字は約6000文字だったそうだ。

その後、パソコンの普及とともに多くの漢字を扱う必要が出てきたが、コードの整備は進まず、現在は約1万の漢字にコードが付いているものの、いまだに特定のソフトでなければ表示できない漢字もあり、対応が迫られていたという。

ビッグ・データ解析のハードルに

「外字」に関しては、これまでも官公庁や多くの企業が作画ソフトを使って書いたり、手作業でのデータ修正を行ったりするなど、独自に工夫して対応してきたとも言われている。

しかしこうした修正作業は、欧米の企業ではほとんど必要なく、ビッグ・データの解析や人工知能の開発などでも、「外字」は日本にとって大きなハードルになっていたという。

今回、6万の漢字にコードが割り振られたことで、企業等は事業をしやすくなり、ビッグ・データの活用を始め、さまざまな効果が期待されている。

「外字の苗字が表示できるのは嬉しい」

このニュースに対して、ネットでもさまざまな反応が出ている。まずは「外字」のコード化を歓迎する意見。

「戸籍上の苗字に外字が入っていて、仕方なく手書きで書かれた免許証を持っている時期があった身としては、ちょっと嬉しいニュース」

「一般的なパソコンで表示できない漢字(外字)の問題は、企業・官公庁・病院などで、悩みのタネですもんね・・・」

「自分の氏名に外字はないけど、身近にはチラホラ居るのでありがたい。後はフォントメーカーがどこまで頑張ってくれるかだな」

「今日一番いいニュースだわ。全漢字共通コード化外字作成の手間はバカにならないもの…」

一方、「外字」のコード化に異論を唱える方もいた。

「時代に逆行しているとしか思えませんね。外字を廃止する方がよっぽど簡単で効率的で将来に貢献する」

「正直言うと、手書きの間違いに端を発する外字とかは整理してもいいように思う」

「漢字を簡略化した中国、廃止したベトナムや北朝鮮にも負けて、わざわざ手数増やしてる」

他にも次のような意見も寄せられている。

「戸籍の外字には手書きの誤字を登録したしたものが含まれるので、全部登録するのは微妙であるような」

「早く普及して外字対応とか終わって欲しいけど、フォント作成者の方のことを考えると手放しで喜ぶこともできないかなぁ」

「もし、戸籍登録が続けて行われるとしたら、あの外字の異体字が、また、世界の何処かに現れて来るかも知れない…」

なにはともあれ、自分の名前を正確にコンピューターで表示できるようになる方にとっては、やはり嬉しい出来事に違いない。（了）

出典元：NHK：コンピューターで全漢字使用可に６万字コード化(12/24)

2017年12月26日
正解率は90％以上、嘘をつく人間の微細な表情を読み取れるAIが開発される
2017年12月26日
自閉症の少年が英のスーパーで熱唱、見事な歌声の動画が拡散し100万ビュー突破

Return Top