「煕」の異体字に関する,笠井直美先生とのやりとりのメール 公開にあたり,一部改編 (笠井先生の了解あり) ---------------------------------------------------------------------- Subject: 質問:「煕」と「熙」 Date: 2007年6月10日 17:22:16:JST 笠井さん 大名です。 2月にあるところで正規表現によるテキスト検索の講習をしたのですが, その時使ったエディタがサクラエディタだったので,漢字の指定は [亜-熙] とし, 「ハイフンの後の文字は“こうきじてん”の“き”です」と指示したところ, やってみたがマッチしない漢字があるのはなぜか,という質問を受けました。 その時はわかりませんでしたが,ようやく原因がわかりました。 「こうきじてん」を漢字変換するときに,「康煕字典」とするIMEと 「康熙字典」するIMEとがあり,不要な文字を削除した後に残る文字が 「熙」であれば問題ないのですが,「煕」の場合には,それより後ろの部分の 漢字が対象とならない,というのが理由でした。   「煕」 U+7155,JIS 5F66,句点 6370   「熙」 U+7199,JIS 7426,句点 8406 「“こうきじてん”の“き”」という指示の仕方は危ないことがわかったので, 今後は注意するつもりですが,そもそも,「康煕字典」と「康熙字典」の 関係はどうなっているのでしょうか。 -- 大名 力 ---------------------------------------------------------------------- Subject: Re: 質問:「煕」と「熙」 Date: 2007年6月11日 0:54:47:JST 大名さん 笠井です。 そうか、これは有名なのでご存じかと思っていました。 けっこうめんどうなんですよね。 今、手許に資料がないのであまり正確なところが示せないのですが・・・ >   「煕」 U+7155,JIS 5F66,句点 6370 >   「熙」 U+7199,JIS 7426,句点 8406 ほかに   「熈」 U+7188, JIS 5F67, 句点 6371 もあります。 すごく昔のATOKでは、これしかなかった(か、「き」の単漢字変換では、 これらのうち、これが真っ先に出てきた)ような気がします。 異体字というか、まあ、前近代の人にとっては「同じ字」 だったんでしょうが。 MS-IME2003(日本語)だと、(私は全く使っていないので、 たぶんデフォルトの優先順位で出てくると思うのですが)、それだと、 「康煕」>「康熙」 の順で出てきますね。 WindowsXPに入っている中国語IME(多数ありますが、簡体字・繁体字とも) では、いずれも、「康熙」のみのようです。 また、日本の辞書では「煕」、大陸の辞書では「熙」となっていると 思います。 (臺灣は未確認。たぶん大陸と同じだと思いますが)。 おおまかには、異体字というか、同じ字のちょっと違う書き方として 通用していた幾つかの字体のうち、日本は「煕」を正字として採用し、 中国・臺灣は「熙」を正字として採用し、それがUnicodeに別字として 登録されたという経緯ではないかと思われます。 (下記「CHISE漢字連環図」によると、JISでは「煕」がまず登録されて 「熙」が後から追加され、gb2312とbig5では「熙」のみ登録されている ようです)。 ※しばらくぶりに CHISE project: http://mousai.kanji.zinbun.kyoto-u.ac.jp/chise/ を調べてみたら、充実度が増していました。 CHISE IDS漢字検索からこれらの字を検索すると、「CHISE漢字連環図」という ものに飛べます。上記の三字ですと以下のような図が出てきます。 http://kamichi.jp/chise_linkmap/map.cgi?code=7155 http://kamichi.jp/chise_linkmap/map.cgi?code=7199 http://kamichi.jp/chise_linkmap/map.cgi?code=7188 また、唐代拓本データベースにも飛べるようになっていて、以下のような ものが見られます。 http://coe21.zinbun.kyoto-u.ac.jp/djvuchar?query=%E7%85%95 また、臺灣のサイトですが、以下のものもなかなか有用です。 どの字体がどの(中国の古い)字典(類)に載っていたかが調べられます。 異體字字典: http://140.111.1.40/start.htm 研究室に行って資料を見たらもう少し追加します。 今日はとりあえずこんなところで。    笠井 直美  ---------------------------------------------------------------------- Subject: Re: 質問:「煕」と「熙」 Date: 2007年6月11日 12:43:02:JST 笠井さん On 2007/06/11, at 0:54, Naomi KASAI wrote: > そうか、これは有名なのでご存じかと思っていました。 > けっこうめんどうなんですよね。 > 今、手許に資料がないのであまり正確なところが示せないのですが・・・ > > >   「煕」 U+7155,JIS 5F66,句点 6370 > >   「熙」 U+7199,JIS 7426,句点 8406 > ほかに >   「熈」 U+7188, JIS 5F67, 句点 6371 > もあります。 Mac OS X の文字パレットでは関連文字として,次の四つが示されるのですが, もう何が何だか。  U+7155  U+7188  U+7199  U+242EE > おおまかには、異体字というか、同じ字のちょっと違う書き方として > 通用していた幾つかの字体のうち、日本は「煕」を正字として採用し、 > 中国・臺灣は「熙」を正字として採用し、それがUnicodeに別字として > 登録されたという経緯ではないかと思われます。 > (下記「CHISE漢字連環図」によると、JISでは「煕」がまず登録されて > 「熙」が後から追加され、gb2312とbig5では「熙」のみ登録されている > ようです)。 なるほど。 Google で検索してみると,日本語のページでは「康《熙》字典」の方が 多いようです。ただし,専門家または漢字にこだわりがありそうな人が 書いているページでは (意識的に?)「康【煕】字典」を使っているような 印象を受けました。でも,Wikipedia の中国語版では「《熙》」の方を 使っていたし,その他の中国語のページでも,「《熙》」方が多いような 感じがしたので (ちゃんと数を数えたわけではありません),わけが わからなくなったのですが,笠井さんの説明で半分理解できました。 たぶん,多くの人は仮名漢字変換で出てきたものをそのまま使っていると 思われるので,これで,OS 標準の IME で出るのが「康《熙》字典」なら すっきりするのですが,Windows 2000 の IME も Windows XP の IME も, 「こうき(じてん)」→「康【煕】(字典)」ですね。(なぜか「こうきてい」 →「康《熙》帝」ですが。) 思いつくのは,「康熙字典」なんて自分のページに書く人は,ちょっと 普通の人と違って,OS 標準の IME ではなく,自分の好きな IME を使う, そしてその IME が出す候補が「康《熙》字典」って可能性ぐらいですかねえ。 (Windows 2000 より前の IME では「康《熙》字典」だった,って可能性も あるかな。) ちなみに,私が使っている IME ではこうなっています。  ことえり 「康《熙》字典」「康【煕】帝」 (「こうき」だけでは候補に出ない)  egbridge 「康【煕】字典」「康【煕】帝」「康【煕】」 やっぱり漢字は難しいなあ。教えてもらったページを見て,よく勉強します。 -- 大名 力 ---------------------------------------------------------------------- Subject: Re: 質問:「煕」と「熙」 Date: 2007年6月11日 13:40:52:JST 笠井さん On 2007/06/11, at 12:43, Tsutomu OHNA wrote: > Windows XP の IME も, 「MS-IME2002」と書くべきだったのかな。 正直言って,この辺のことはよくわからない。 -- 大名 力 ---------------------------------------------------------------------- Subject: Re: 質問:「煕」と「熙」・補充 Date: 2007年6月13日 19:12:27:JST 大名さん 標記の件、大事なところを見るのを忘れていました。 日本においては本字(旧字)は「煕」で、大漢和、白川静の字統なども この字体が収録されているのですが、1990年に、人名用漢字として 追加されたのは「熙」だったのです。 これに従って、JIS X 0208-1990では「熙」が追加されたという ことのようです。 http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kanjibukuro/ japan-jimmei3.html この後刊行された日本の漢和辞典だと、見出しに「熙」を立てて、「煕」を 本字・旧字として示すようになっているものが多いようです。 (角川の新字源、白川静の字通など)。 > Google で検索してみると,日本語のページでは「康《熙》字典」の方が > 多いようです。ただし,専門家または漢字にこだわりがありそうな人が > 書いているページでは (意識的に?)「康【煕】字典」を使っているような > 印象を受けました。 ということで、日本語の場合、1990年以降に関しては、 大名さんが恐らく予想されていたとおり、 常用字体を使う文章なら「熙」、旧字を使う文章、 旧字を「正字」と呼ぶようなこだわりのある人の文章なら「煕」となった、 理解でいいかもしれません。 IMEは、1990年以前のバージョンで「康煕」を登録していてそのままであるか、 それ以後のバージョンで登録したか、による相違、ということは 考えられないでしょうか。 中国は、大陸(『漢語大詞典』、『漢語大字典』)、臺灣(『國語辭典』) とも「熙」でした。 大陸、臺灣とも「熙」が主流と見ていいと思います。 ※「康煕」で、中国語(繁体字)のページに限定してぐぐると、 最初に出てくるページは、広東語のWikipediaです。 広東語のIMEには「康煕」が出てくるものがあるのかもしれません。 (日本語のウェブページからコピペした可能性もありそうですが)。 >  U+242EE これ、教えてくださってありがとうございます。 私は見落としていました。 この字形、新字源の説だと、「誤字」だそうです。 ではでは。また何か気づいたらメールします。   笠井 直美 拜 ---------------------------------------------------------------------- Subject: Re: 質問:「煕」と「熙」・補充 Date: 2007年6月13日 20:40:50:JST 笠井さん ありがとうございます。 On 2007/06/13, at 19:12, Naomi KASAI wrote: > 標記の件、大事なところを見るのを忘れていました。 > 日本においては本字(旧字)は「煕」で、大漢和、白川静の字統なども > この字体が収録されているのですが、1990年に、人名用漢字として > 追加されたのは「熙」だったのです。 > これに従って、JIS X 0208-1990では「熙」が追加されたという > ことのようです。 > > http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kanjibukuro/ > japan-jimmei3.html す,すごい ... > IMEは、1990年以前のバージョンで「康煕」を登録していてそのままであるか、 > それ以後のバージョンで登録したか、による相違、ということは > 考えられないでしょうか。 「こうきじてん」と「こうきてい」で異なるケースなども考えると, 仮名漢字変換で文字を呼び出す時には,かなり注意してやらないと 危ないですね。 ちなみに,ことえりでも,egbridge でも,「ぱくちょんひ」は「朴正【煕】」に 変換されます。(バージョンによる違いはあるかもしれない。) > >  U+242EE > これ、教えてくださってありがとうございます。 > 私は見落としていました。 > この字形、新字源の説だと、「誤字」だそうです。 ありゃりゃ,そんなものまで。 やはり,コーパスを利用する場合,テキスト形式のデータに 直接アクセスできる場合には,文字の一覧表を作成し,Basic Latin とか CJK統合漢字とか,当然想定するであろう文字以外のものがないか, 確認してから利用するようにしないと危ないですね。 -- 大名 力 ---------------------------------------------------------------------- Subject: Re: 質問:「煕」と「熙」・補充2 Date: 2007年6月21日 2:32:01:JST 大名さん 標記の件、の補充・訂正です。 藤堂明保編『漢和大字典』(学習研究社、1978年初版) は、「煕」で、ではなく「熙」を正字としてたて、「煕」を「異体字」と しています。 藤堂氏(って、私にとっては師匠筋の方ですが)は上古漢語や 字の成り立ち・起源も主要な研究領域の一つでしたので、 それなりのこだわりを持って大漢和に異を立てたように思われます。 この字典の解字に、この字の左上部分(「頤」と共通、というか、 「頤」の原字だそうです)が音符であると述べられているのですが、 この字典では「頤」及びその左側だけ(これ、見つけられませんでした。 拡張Bにも無いような気が)の部分も「熙」の左上と同様の形に 作ってあります。 (このメールの「頤」の字の左側が大名さんのところでどう見えるか わかりませんが、私の手許のフォントでは、 MS明朝など日本のフォントは「煕」と同じ、 SimSun、MinLiuなど中国・台湾のフォントだと「熙」と同じ なんですね。こっちに関しては統合されてるようです)。 『康煕字典』の木版本の版本系統は調べていませんが、手許には、 清刊本を清末の同文書局が影印したものを、中華書局がさらに影印した ものがあります。 おそらくこれが木版(の影印)としては最も普及していると思います。 これの、字典本文の見出し字は確かに「煕」で、或いは大漢和は これに拠ったのかもしれません。 しかし、原序(これは明朝体ではなく、現在、中国語で楷体と呼ばれる形に 似ている、実際に筆で書いた楷書に似せて彫ってあります)の末尾の 「康熈五十五年」というところは、「熈」だったり、 柱の「康熙字典」は「熙」だったり、 原序の第一行目はこれらとはまたちょっと違っていたり (拓本にはわりと見える字形です)、 まあ木版本ってだいたいこういうもんですが、なかなかおおらかです。 ということで、「実質同じ字」というのはまあ確実かな、と思います。   笠井 直美 拜 ---------------------------------------------------------------------- Subject: Re: 質問:「煕」と「熙」・補充2 Date: 2007年6月21日 14:01:50:JST 笠井さん On 2007/06/21, at 2:32, Naomi KASAI wrote: > 大名さん > > 標記の件、の補充・訂正です。 > ということで、「実質同じ字」というのはまあ確実かな、と思います。 詳細な解説,ありがとうございます。 私が自分で調べてここまで理解に至るには,1年ぐらいかかりそう。 助かりました。 -- 大名 力 ----------------------------------------------------------------------