日用字(日本で常用する漢字)
google翻訳で「徴税」を簡体中文にすると「征税」となります。「徴」は簡体字「征」に対応する日本の常用漢字です。「通用规范汉字表」の付表「规范字与繁体字、异体字对照表」には、規範字「征」の繁体字に「征」「徵」が挙げられています。
この「徵」は、日本では「徴」の旧字体で、人名に使える漢字となっています。また、「通用规范汉字表」では、「征」「徵」共に「規範字」であり、繁体字でもあります。
簡体中文に使用される文字を簡体字とすれば、簡体字の常用されるものは「通用规范汉字表」が示す 8105字の「規範字」です。
日本で常用される漢字には特に名前はなさそうなので、「日用字」と呼ぶことにします。「日用字」の「徴」は、その旧字「徵」を介して簡体字「征」「徵」、繁体字の「征」「徵」と連絡します。
日本で日常使用される漢字は、常用漢字 2136字が主要なものだと思います。人名漢字は861字のようです。さらに表外漢字(1022字)があり、その人名漢字(285字)があります。しかし、表外漢字は、改定前の常用漢字に基いたものらしく、重複があります。
また、人名用漢字は常用漢字 2136字を含めて 2999字体と言うようです。その内訳は、常用漢字の異体字 212字、その他 651字です。
これらのソースを重複を除いて集めると、3285字の日用字が収集されました。
これには、人名用漢字から常用漢字の旧字体の一分が含まれることになります。
「塡」は常用漢字です。パソコンで「てん」を入力して変換すると「填」となります。この類をパソコン基準に直して使います。
表_1.ここで使用する常用漢字(常用漢字表からの変更箇所)
常用 | 塡 | 𠮟 |
変更 | 填 | 叱 |
この種の問題は表外漢字表にあるようです。常用漢字表の改定の際に、表外漢字表から写された漢字は字形が保存されたようです。
は同じUnicodeでした。 |
HTMLであれば lang 属性で切り替わるフォント依存の文字です。前者が表外漢字の字形、後者は簡体字フォントの字形です。
表外漢字で「喩」「揄」「愈」「楡」が採用され、改訂された常用漢字は「喩」「愉」「諭」「輸」「癒」となりました。表外漢字の「愈」は「愈」に置き換えが出来ません。
試行錯誤の結果、表外漢字は俗字に変えることにしました。俗字の方が簡体字の字形に近いからです。また、表外漢字の正字を旧字体と考えると簡体字の異体情報から変換できるからです。
表_2.ここで使用する表外漢字1/2(表外漢字表からの変更箇所)
表外 | 幷 | 姸 | 屛 | 凜 | 啞 | 噓 | 嚙 | 潑 | 鹼 | 彎 |
変更 | 并 | 妍 | 屏 | 凛 | 唖 | 嘘 | 噛 | 溌 | 鹸 | 弯 |
表_3.ここで使用する表外漢字2/2(表外漢字表からの変更箇所)
表外 | 摑 | 攪 | ||||||||
変更 | 掴 | 撹 |
中国の簡化字は日本に導入されなかったので、その旧字体を介して理解することになります。「通用规范汉字表」では、これを「繁体字」と呼んでいます。ただし、繁体字は、字形のことだけでなく、意味的な先祖も「繁体字」と呼んでいます。繁体字は「旧字」を意味しますが「旧字体」ではありません。
「发」の繁体字には「發」「髮」が挙げられています。繁体字「發」は、日本の「発」の旧字です。繁体字「髮」は、日本の「髪」の旧字です。
「通用规范汉字表」は、この場合、必ずしも旧字体を示しておらず、「發」と「髮」の書き分けをしないことを繁体字が示しています。
日本の「新字体」は、一般的な新旧ではなく、「当用漢字字体表」による標準字体を差す用語のようです。日本でも簡化字が作られたようです。
したがって、新字体、旧字体の対応表は400字程度で余り多くの漢字を含みません。
中国が簡化字を定める前の常用されていた漢字まで遡る旧字体、あるいは異体字が欲しい訳ですが、十分かどうかは、簡体字と日用字の対応をとって、対応の付いていないものを評価することになります。
試行錯誤の結果、445字の新字体と旧字体の表となりました。
本来の常用漢字表に旧字体が示された新字体は362字(旧字体364字)のようです。人名用漢字には14字あるようです。
ここで追加したのは、「鄉:郷」、「橢:楕」、「强:強」など60組です。
簡体字「乡」の繁体字は「鄉」です。他も同様で、少し違った漢字を正字としてきたようです。「强」は日本の書籍で見慣れた字形ですが、「強」の旧字ではなく、平行して使用されてきた異体字のようです。
人名用漢字は「囃」を収めています。この漢字は簡体字と未対応となりました。中国では繁体字として「𫝜」が使われ、「囃」の略字のようです。
簡体字「𠱞」は規範字ではありませんが Unihan Database は、その繁体字「𫝜」を挙げます。したがって、実際は逆ですが、「囃」の旧字体として「𫝜」としておきます。
中国から長い年月文化を導入してきた日本の常用する漢字は、中国で常用される漢字と大きな差はないと考えられます。しかし、漢字だけで文章を記しているのですから、日本よりは沢山の漢字が必要だと思います。
実際に、簡体字と日用字の対応を取ると、残った日用字は余り多くはありません。
表_6.使われなかった常用漢字と評価
日用 | 区分 | 日用 | 区分 | 日用 | 区分 | 日用 | 区分 | 日用 | 区分 |
丼 | (井の異体字) | 塀 | 国字 | 楡 | 榆 | 篠 | 筱 | 鑓 | 国字 |
俤 | 国字 | 峠 | 国字 | 楢 | (繁体字) | 籾 | (繁体字) | 雫 | 国字 |
値 | 值 | 惣 | (総の異体字) | 榊 | 国字 | 粂 | 国字 | 鞄 | (繁体字) |
冑 | 胄 | 扱 | (繁体字) | 榎 | (繁体字) | 罠 | (繁体字) | 顚 | (繁体字) |
凧 | 国字 | 捗 | (繁体字) | 槙 | (繁体字) | 羨 | (繁体字) | ||
凪 | 国字 | 掟 | (繁体字) | 樋 | (繁体字) | 膣 | (繁体字) | 髷 | (繁体字) |
匂 | 国字 | 揃 | (繁体字) | 橿 | (繁体字) | 膵 | (繁体字) | 麿 | 国字 |
呟 | 吆 | 撚 | (捻の異体字) | 臥 | 卧 | 﨟 | (繁体字) | ||
喩 | 喻 | 杣 | 国字 | 漑 | 溉 | 菫 | (繁体字) | ||
喰 | 国字 | 枠 | 国字 | 瀞 | (繁体字) | 襷 | 国字 | ||
噺 | 国字 | 枡 | 国字 | 畑 | 国字 | 讃 | (繁体字) | ||
柾 | 国字 | 畠 | 国字 | 辻 | 国字 | ||||
堀 | 挖 | 栃 | 国字 | 笹 | 国字 | 込 | 国字 | ||
堺 | (界を使用) | 梶 | (繁体字) | 筈 | (繁体字) |
「国字」が残るのは当然です。簡体字から日本の漢字に変換する際には登場しません。
(繁体字)は、規範字ではないが簡体中文に使用される漢字で、日本の漢字と同形なので変換を要しません。
「丼」は「井」の異体字です。もし「丼」と記されたらそのままにします。
「惣」は、簡体字「总」が使われ、その繁体字は「總」です。「惣」が記されたならそのままで良いと思います。
「撚」は、簡体字「捻」が使われ、「捻」が日本の常用漢字です。「もし「撚」が記されたならそのままで良いと思います。
簡体字の「值」、「吆」、「喻」、「挖」、「榆」、「溉」、「筱」、「卧」は、「通用规范汉字表」に繁体字、異体字が示されていません。旧来からこの字形を正字としてきたということだと思います。これを、値呟喩堀楡漑篠臥 と対応させるには直接置き換える他ないと思います。
「胄」も同様ですが、簡体字の「胄」は、日本では「胄」「冑」と書き分けをすることになっています。前者は国語辞典に「胄裔」などがあって、後者は「かぶと」です。手元の漢和辞典は「胄」の訓を収めていませんが、Unihan Dtatabaseでは「よつぎ」「ちすじ」の訓を収めています。「胄」は置き換えを要しないと思います。