Pinconv4.04 – 新字体から繁体字への変換

By ctrans | 2010-03-21

Pinconvのバージョンアップを行い、日本の新字体を繁体字に変換するためのデータファイルを追加しました。

Pinconvの紹介はこちらのエントリ、詳しい使い方についてはPinconvの使い方を参照下さい。窓の杜による紹介記事はこちらです。

以前のバージョンのPinconvからバージョンアップする場合、新たに追加された変換データファイル(日繁.dat)は、自動的にインストールされません。「変換」メニューのデータファイルの復元を実行して追加して下さい。

新字体から繁体字への変換

日本語の文章を中国語に翻訳する際、意外に面倒なのが地名や人名、組織名などの固有名詞の翻訳です。同じように漢字を使っているとはいえ、簡体字、繁体字、新字体など漢字にも種類がありますので適当にごまかそうとするとまず間違いなくクレームがつきます。たとえば原文に「広島地方検察庁呉支部(広島県呉市)」とあった場合、台湾で使われている繁体字にすると「廣島地方檢察廳吳支部(廣島縣吳市)」となります。

新字体から繁体字

漢字15文字の内、7文字を繁体字に直さなければならず、日本の新字体に対応する繁体字を1字ずつ調べていく地道な作業が必要となります。10文字程度ならなんとかやっつけることはできても、組織名と住所がずらっと並んだエクセルファイルなどが対象だとしたらどうでしょう。うんざりしますね。

さらに1例をあげれば、「戸内」という日本人名を繁体字にすると「戶內」となります。新字体と繁体字に違いはないように見えるかも知れませんが「戸」と「」、「内」と「」にはそれぞれ異なる文字コードが振られています。日本語をそのままコピー&ペーストして一丁上がりとはいきません。「呑(U+5451)」と「(U+541E)」などこうした字はほかにもいくつかあり、目を皿にして1字1字チェックしていく必要があります。

今回公開したPinconv用の「日繁.dat」は、こうした変換作業の負担を大きく軽減します。日本語のテキストが表示された状態で、このデータファイルを用いて変換を行うと、日本語の漢字が一瞬で繁体字に変換されます。あとは変換結果が妥当かどうか確認するだけ。1字ずつ調べることを考えれば随分楽です。

国字の扱いや制限事項などについて

  1. 「込」や「辻」などのいわゆる国字(和製漢字)は、繁体字に変換することができないため、変換後は「★」が出力されます。国字をそのまま出力したい場合などは、用語集の編集を行って下さい。[1]
  2. 日繁.datは、日本の新字体を台湾で使われている繁体字に変換することを目指しているため、「闘」は「」に変換され、「竃」は「」に変換されます。いわゆる旧字体への変換とは処理結果が異なります。
  3. 「狢」から「貉」への変換など、繁体字に変換する際に異体字や別字に置き換える漢字のうち、作者が注意が必要と判断した漢字は、出力時にアスタリスクが付加されます。作者のデータ管理用に設けたマークですので不要であれば編集して下さい。
  4. 変換データの登録を暫時保留している漢字は、「〓」が出力されます。
  5. 現行バージョンのPinconvにはU+9FA6以降の漢字データを扱えないという制限があります。そのため、この範囲に含まれる漢字を変換しようとしても「〓」が表示されます。ご了承下さい。

予、台、弁、干などの処理について

新字体では、繁体字の「瓣、辮、辯」などが「弁」で代替されています。「花瓣」は「花弁」に、「辮髮」は「弁髪」、「辯護」は「弁護」という風に本来は異なる漢字で表現すべきところを「弁」の1字で済ませているため、これを繁体字に変換するには単語ごとに処理を切り替える必要があります。「日繁.dat」には、こうした単語がいくつか登録されていますが(詳細は以下の一覧を参照)、正しく変換されなかったデータを見つけた場合は、お手数ですがご自分で追加してください。[2]

表1 日繁.datに登録されている単語一覧

日本語 繁体字
台風 颱風
台頭 抬頭
安全弁 安全瓣
花弁 花瓣
支弁 支辨
能弁 能辯
雄弁 雄辯
思弁 思辨
勘弁 勘辨
自弁 自辨
抗弁 抗辯
陳弁 陳辯
答弁 答辯
詭弁 詭辯
口弁 口辯
多弁 多辯
駄弁 馱辯
訥弁 訥辯
熱弁 熱辯
単弁 單瓣
僧帽弁 僧帽瓣
合弁 合辦
買弁 買辦
東北弁 東北辯
関西弁 關西辯
弁官 辨官
弁慶 辨慶
弁済 辨濟
弁財天 辨財天
弁事 辨事
弁識 辨識
弁償 辨償
弁証 辨証
弁知 辨智
弁天 辨天
弁別 辨別
弁明 辨明
弁円 辨圓
弁当 辨當
弁内侍 辨內侍
弁座 瓣座
弁膜 瓣膜
弁鰓 瓣鰓
弁髪 辮髮
弁解 辯解
弁護 辯護
弁口 辯口
弁巧 辯巧
弁才 辯才
弁士 辯士
弁者 辯者
弁舌 辯舌
弁疏 辯疏
弁難 辯難
弁論 辯論
弁説 辯說
弁公室 辦公室
予備 預備
予報 預報
予防 預防
予定 預定
予断 預斷
予告 預告
予感 預感
予後 預後
予見 預見
予期 預期
予習 預習
予想 預想
予選 預選
予知 預知
予兆 預兆
予測 預測
予算 預算
予言 預言
予約 預約
猶予 猶豫
干物 乾物
干害 旱害
干魚 乾魚
干姜 乾薑
干繭 乾繭
干天 旱天
干瓢 乾瓢
防御 防禦
  1. 「込」に対応するデータとして「込」を登録すれば、そのまま出力されます。 []
  2. ついでに私にも教えていただければ幸いです<(_ _)> []
web拍手

10 Comments

大地の子 on 2010-04-03 at 11:11 PM.

素晴らしいソフトを作ってくださりありがとうございます。
ずっとpinconv+を使わせていただいていましたが、バージョンアップ後、機能が大幅に増え、さらに使い勝手が良くなったと思います。
特に繁体字と簡体字間の相互変換機能が素晴らしいです。

ところで一つ質問をよろしいでしょうか?
「変換」→「データファイルの切り替え」から「声調」を選択後、エディタ部分に中国語の文章を貼り付けghostボタンを押しますと、ピンインには変換されず元の中国語が2行ずつ表示されてしまいます。
上記メニューで「ピンイン」を選択後した場合は問題なく数字付きのピンインが下の行に表示されます。

もし「声調」選択時の動作につきまして設計と異なる動作でしたら、ご確認・修正のご対応をお願いできるでしょうか?
よろしくお願いします。

ctrans on 2010-04-04 at 8:27 AM.

大地の子 様

Pinconvをご利用いただきありがとうございます(^^)

変換データファイル「声調」の挙動についてですが、説明が足りず、お手数をおかけして申し訳ございません。

このデータファイルは声調を数字で表現した簡易ピンインを声調記号付きのピンインに変換する(例:pin1yin1→pīnyīn)ためのファイルであり、簡体字からピンインへの変換を直接行うことはできません。変換データファイル「ピンイン」を選択して簡体字を簡易ピンインに変換(Ghost)した後、「声調」データファイルを選択して再度変換を行っていただくと声調符合付きのピンインに変換することができますので、この手順にてお試しいただければ幸いです。

処理が少々回りくどいのですが、いったん声調記号付きのピンインにしてしまうと、間違っていた場合の修正が難しいため、編集が容易な簡易ピンインを挟むかたちを採用しています。ご了承ください。

大地の子 on 2010-04-04 at 8:46 AM.

ctrans さま

返信ありがとうございます。
ご説明を読んで、現状の仕様について理解することができました。
ありがとうございます。

ただ、これは私個人の要望なのですが、出力されたピンインが間違っているかどうかはあまり重要ではなく、(間違っているかどうかを知る術がないというのが正直なところですが、)声調符号の付いたピンインが一発で出るオプションがありますと大変助かります。
少なくとも中国語初心者に限って言えば、このようなオプションがありますと大変助かるのですが、追加していただくことはできるでしょうか?

厚かましいお願いではありますが、ご検討をお願いします。

ctrans on 2010-04-04 at 10:11 AM.

大地の子 様

「声調符号の付いたピンインが一発で出るオプション」は、あった方がぐっと便利ですね。
実装方法を検討し、近くバージョンアップで対応したいと思います。
ご提案ありがとうございました

大地の子 on 2010-04-05 at 12:18 AM.

ctrans さま

ご検討いただけるとのこと、ありがとうございます。
よろしくお願いいたします。

ctrans on 2010-05-23 at 12:23 PM.

大地の子 様

遅くなりましたが、昨日バージョンアップを行い、新機能「連続置換」をPinconvに追加いたしました。
この機能を利用することで、漢字から声調符号付きピンインへの変換ができるようになりました。
以下のエントリで機能の概要を紹介していますので、ご参照いただければ幸いです。

http://www.karak.jp/articles/software/pinconv408.html

このたびはご提案ありがとうございました。

大地の子 on 2010-06-04 at 10:21 PM.

ctrans さま

ご対応ありがとうございます。
動作を確認しました。
声調符号への直接変換だけでなくて汎用的に使えるあたり、作者様の知性を感じます。
助かりました。

ところで、もう一点要望をよろしいでしょうか?
本ソフト起動時に、前回終了時の表示形式で表示することは可能でしょうか?
例えば、convertボタンを押すと下に一行メニューが表示されますが、このメニューを起動時に表示させるようにしたいのです。
何か良い方法があれば教えてください。
よろしくお願いします。

ctrans on 2010-06-05 at 2:00 PM.

大地の子 様

早速お試しいただきありがとうございました(^^)

前回終了時の画面表示を再現する機能については、早速実装する方法を検討したいと思います。
ご提案ありがとうございました!

ctrans on 2010-06-29 at 8:56 AM.

本日公開した4.11にて終了時のコマンドバーとサイドバーの状態を次回起動時に再現する機能を追加いたしました。ご提案ありがとうございました!

eky on 2010-08-09 at 4:14 PM.

web版の同じのようなツールを作っていますが
予、台、弁、干などの処理を参考にさせていただきました
http://ekykan.freehostia.com/tools/tenkan.php?lang=ja
もし問題などありましたら元に戻りします

Leave Your Comment

Your email will not be published or shared.

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre lang="" line="" escaped="">