v東京大学大学院情報学環坂村研究室
v東京大学大学院情報学環坂村研究室は13日、さまざまな異体字や中国の古典文献などに使われる漢字を 含む約12万文字の漢字フォントセット「T書体フォント」を無償で公開すると発表した。超漢字4のほか、 Windowsでも利用可能な形式で提供されるという。14日より東京国際フォーラムで開催される 「TRONSHOW2006」で公開され、来春より同研究室のWebサイトを通じて配布する予定。 T書体フォントに含まれるのは、東京大学多国語処理研究会によって制定された「GT文字セット」の78,765字に加え、 江戸時代および中国の宋・明・清時代の文献から抽出された漢字のうちGT文字セットに含まれない「宋明異体字」が 34,499字、白川静著『金文通釈』を材料とした金文研究のための「金文釈文文字」661字、そして、変体仮名や、 マンガの表現に見られる濁点仮名(「あ゛」を1文字で表したものなど)など非漢字文字1,814字の計115,739字。 それぞれの字について「T明朝体」「Tゴシック体」「T楷書体」の3書体が用意されるので、 公開されるフォントデータは合計約35万文字となる。 現在一般的に使われているコード体系は、コンピューターの能力が現在に比べて低いころ、使用頻度の高い字を 優先して制定されたため、例えばJIS第1・2水準漢字に含まれるのは合わせて7,000字弱となっている。使用中の コード体系にない文字を利用する場合は外字として独自の文字セットを作る必要があるが、最近特に問題に なっているのが地方自治体の合併に伴う戸籍データベースの統合で、市町村毎に異なる外字セットを持っている場合、 作業に大きな手間がかかるという。今回公開されたT書体フォントの文字セットを採用することで、外字セットの 不一致の問題を解決することができる。