Pinconv4.04 – 新字体から繁体字への変換

Pocket

Pinconvのバージョンアップを行い、日本の新字体を繁体字に変換するためのデータファイルを追加しました。

Pinconvの紹介はこちらのエントリ、詳しい使い方についてはPinconvの使い方を参照下さい。窓の杜による紹介記事はこちらです。

以前のバージョンのPinconvからバージョンアップする場合、新たに追加された変換データファイル(日繁.dat)は、自動的にインストールされません。「変換」メニューのデータファイルの復元を実行して追加して下さい。

新字体から繁体字への変換

日本語の文章を中国語に翻訳する際、意外に面倒なのが地名や人名、組織名などの固有名詞の翻訳です。同じように漢字を使っているとはいえ、簡体字、繁体字、新字体など漢字にも種類がありますので適当にごまかそうとするとまず間違いなくクレームがつきます。たとえば原文に「広島地方検察庁呉支部(広島県呉市)」とあった場合、台湾で使われている繁体字にすると「廣島地方檢察廳吳支部(廣島縣吳市)」となります。

新字体から繁体字

漢字15文字の内、7文字を繁体字に直さなければならず、日本の新字体に対応する繁体字を1字ずつ調べていく地道な作業が必要となります。10文字程度ならなんとかやっつけることはできても、組織名と住所がずらっと並んだエクセルファイルなどが対象だとしたらどうでしょう。うんざりしますね。

さらに1例をあげれば、「戸内」という日本人名を繁体字にすると「戶內」となります。新字体と繁体字に違いはないように見えるかも知れませんが「戸」と「」、「内」と「」にはそれぞれ異なる文字コードが振られています。日本語をそのままコピー&ペーストして一丁上がりとはいきません。「呑(U+5451)」と「(U+541E)」などこうした字はほかにもいくつかあり、目を皿にして1字1字チェックしていく必要があります。

今回公開したPinconv用の「日繁.dat」は、こうした変換作業の負担を大きく軽減します。日本語のテキストが表示された状態で、このデータファイルを用いて変換を行うと、日本語の漢字が一瞬で繁体字に変換されます。あとは変換結果が妥当かどうか確認するだけ。1字ずつ調べることを考えれば随分楽です。

国字の扱いや制限事項などについて

  1. 「込」や「辻」などのいわゆる国字(和製漢字)は、繁体字に変換することができないため、変換後は「★」が出力されます。国字をそのまま出力したい場合などは、用語集の編集を行って下さい。*1
  2. 日繁.datは、日本の新字体を台湾で使われている繁体字に変換することを目指しているため、「闘」は「」に変換され、「竃」は「」に変換されます。いわゆる旧字体への変換とは処理結果が異なります。
  3. 「狢」から「貉」への変換など、繁体字に変換する際に異体字や別字に置き換える漢字のうち、作者が注意が必要と判断した漢字は、出力時にアスタリスクが付加されます。作者のデータ管理用に設けたマークですので不要であれば編集して下さい。
  4. 変換データの登録を暫時保留している漢字は、「〓」が出力されます。
  5. 現行バージョンのPinconvにはU+9FA6以降の漢字データを扱えないという制限があります。そのため、この範囲に含まれる漢字を変換しようとしても「〓」が表示されます。ご了承下さい。

予、台、弁、干などの処理について

新字体では、繁体字の「瓣、辮、辯」などが「弁」で代替されています。「花瓣」は「花弁」に、「辮髮」は「弁髪」、「辯護」は「弁護」という風に本来は異なる漢字で表現すべきところを「弁」の1字で済ませているため、これを繁体字に変換するには単語ごとに処理を切り替える必要があります。「日繁.dat」には、こうした単語がいくつか登録されていますが(詳細は以下の一覧を参照)、正しく変換されなかったデータを見つけた場合は、お手数ですがご自分で追加してください。*2

表1 日繁.datに登録されている単語一覧

日本語 繁体字
台風 颱風
台頭 抬頭
安全弁 安全瓣
花弁 花瓣
支弁 支辨
能弁 能辯
雄弁 雄辯
思弁 思辨
勘弁 勘辨
自弁 自辨
抗弁 抗辯
陳弁 陳辯
答弁 答辯
詭弁 詭辯
口弁 口辯
多弁 多辯
駄弁 馱辯
訥弁 訥辯
熱弁 熱辯
単弁 單瓣
僧帽弁 僧帽瓣
合弁 合辦
買弁 買辦
東北弁 東北辯
関西弁 關西辯
弁官 辨官
弁慶 辨慶
弁済 辨濟
弁財天 辨財天
弁事 辨事
弁識 辨識
弁償 辨償
弁証 辨証
弁知 辨智
弁天 辨天
弁別 辨別
弁明 辨明
弁円 辨圓
弁当 辨當
弁内侍 辨內侍
弁座 瓣座
弁膜 瓣膜
弁鰓 瓣鰓
弁髪 辮髮
弁解 辯解
弁護 辯護
弁口 辯口
弁巧 辯巧
弁才 辯才
弁士 辯士
弁者 辯者
弁舌 辯舌
弁疏 辯疏
弁難 辯難
弁論 辯論
弁説 辯說
弁公室 辦公室
予備 預備
予報 預報
予防 預防
予定 預定
予断 預斷
予告 預告
予感 預感
予後 預後
予見 預見
予期 預期
予習 預習
予想 預想
予選 預選
予知 預知
予兆 預兆
予測 預測
予算 預算
予言 預言
予約 預約
猶予 猶豫
干物 乾物
干害 旱害
干魚 乾魚
干姜 乾薑
干繭 乾繭
干天 旱天
干瓢 乾瓢
防御 防禦
  1. 「込」に対応するデータとして「込」を登録すれば、そのまま出力されます。 []
  2. ついでに私にも教えていただければ幸いです<(_ _)> []

11件のコメント

  1. 素晴らしいソフトを作ってくださりありがとうございます。
    ずっとpinconv+を使わせていただいていましたが、バージョンアップ後、機能が大幅に増え、さらに使い勝手が良くなったと思います。
    特に繁体字と簡体字間の相互変換機能が素晴らしいです。

    ところで一つ質問をよろしいでしょうか?
    「変換」→「データファイルの切り替え」から「声調」を選択後、エディタ部分に中国語の文章を貼り付けghostボタンを押しますと、ピンインには変換されず元の中国語が2行ずつ表示されてしまいます。
    上記メニューで「ピンイン」を選択後した場合は問題なく数字付きのピンインが下の行に表示されます。

    もし「声調」選択時の動作につきまして設計と異なる動作でしたら、ご確認・修正のご対応をお願いできるでしょうか?
    よろしくお願いします。

  2. ctrans さま

    返信ありがとうございます。
    ご説明を読んで、現状の仕様について理解することができました。
    ありがとうございます。

    ただ、これは私個人の要望なのですが、出力されたピンインが間違っているかどうかはあまり重要ではなく、(間違っているかどうかを知る術がないというのが正直なところですが、)声調符号の付いたピンインが一発で出るオプションがありますと大変助かります。
    少なくとも中国語初心者に限って言えば、このようなオプションがありますと大変助かるのですが、追加していただくことはできるでしょうか?

    厚かましいお願いではありますが、ご検討をお願いします。

  3. ctrans さま

    ご検討いただけるとのこと、ありがとうございます。
    よろしくお願いいたします。

  4. ctrans さま

    ご対応ありがとうございます。
    動作を確認しました。
    声調符号への直接変換だけでなくて汎用的に使えるあたり、作者様の知性を感じます。
    助かりました。

    ところで、もう一点要望をよろしいでしょうか?
    本ソフト起動時に、前回終了時の表示形式で表示することは可能でしょうか?
    例えば、convertボタンを押すと下に一行メニューが表示されますが、このメニューを起動時に表示させるようにしたいのです。
    何か良い方法があれば教えてください。
    よろしくお願いします。

  5. ピンバック: Pinconvの使い方 | karak

コメントする

メールアドレスが公開されることはありません。

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください