テンプレート置換、連続置換、Ghost用ダイアログなどの機能を追加し、置換関連機能を大幅に拡充したPinconvのバージョン4.08を公開します。
Pinconvの紹介はこちらのエントリ、詳しい使い方についてはPinconvの使い方を参照下さい。窓の杜による紹介記事はこちらです。
以下、新たに追加した3機能の概要を紹介します。それぞれ詳しい使い方については、ヘルプのテンプレート置換、連続置換、Ghost用ダイアログをご参照下さい。
read more…

講談社中日辞典第三版
講談社中日辞典第三版を入手した。発売とほぼ同時に本屋に走ったわけで、何もそんなに急がなくても良さそうなものだが、この辞典はネットに接続して「現代中国語新語辞典」を1冊丸ごとダウンロードできる上、更新機能で新語・流行語など最新データを入手できるという斬新な中日辞典なのである。ついに中日辞典もここまで来たかと私が興奮しても仕方ない。
辞書の内容は、本屋で立ち読みすれば確認できると思うので(2色刷りで実に見やすい)、以下パソコン上で利用する辞典のフロントエンドツールを中心に第一印象などを書いておく。
下図がインストールされる辞書引きツールである。新語辞典もほぼ同じUIで、どちらも内容を全文検索(!)することができる。アプリケーションのヘルプファイルを思わせるそっけない見た目だが、動作は軽快で検索も速い。

日本語と中国語、ピンインのフォント表示はきれいで見やすく、ご覧の通り挿絵や画像も表示される。検索は見出し語の前方一致、後方一致、完全一致のほか、上述したように辞典の内容を全文検索することができる。中国語とピンインだけでなく日本語でも検索することができ、検索した語句はハイライト表示される。日中辞典のように使えるし、全例文を対象に検索ができるのは実に頼もしい。
read more…
翻訳したい人間と依頼したい人間をオンラインで仲介をするWebサイトmyGengoに中国語の翻訳者が登録するためのトライアルが用意された。
サイトがあちこち工事中でちょっと萎えるがトライしたい方はぜひ。ウルトラレベルならそれなりに稼げそうだ。

Pinconvのバージョンアップを行い、日本の新字体を繁体字に変換するためのデータファイルを追加しました。
Pinconvの紹介はこちらのエントリ、詳しい使い方についてはPinconvの使い方を参照下さい。窓の杜による紹介記事はこちらです。

以前のバージョンのPinconvからバージョンアップする場合、新たに追加された変換データファイル(日繁.dat)は、自動的にインストールされません。「変換」メニューの
データファイルの復元を実行して追加して下さい。
新字体から繁体字への変換
日本語の文章を中国語に翻訳する際、意外に面倒なのが地名や人名、組織名などの固有名詞の翻訳です。同じように漢字を使っているとはいえ、簡体字、繁体字、新字体など漢字にも種類がありますので適当にごまかそうとするとまず間違いなくクレームがつきます。たとえば原文に「広島地方検察庁呉支部(広島県呉市)」とあった場合、台湾で使われている繁体字にすると「廣島地方檢察廳吳支部(廣島縣吳市)」となります。

漢字15文字の内、7文字を繁体字に直さなければならず、日本の新字体に対応する繁体字を1字ずつ調べていく地道な作業が必要となります。10文字程度ならなんとかやっつけることはできても、組織名と住所がずらっと並んだエクセルファイルなどが対象だとしたらどうでしょう。うんざりしますね。
さらに1例をあげれば、「戸内」という日本人名を繁体字にすると「戶內」となります。新字体と繁体字に違いはないように見えるかも知れませんが「戸」と「戶」、「内」と「內」にはそれぞれ異なる文字コードが振られています。日本語をそのままコピー&ペーストして一丁上がりとはいきません。「呑(U+5451)」と「吞(U+541E)」などこうした字はほかにもいくつかあり、目を皿にして1字1字チェックしていく必要があります。
今回公開したPinconv用の「日繁.dat」は、こうした変換作業の負担を大きく軽減します。日本語のテキストが表示された状態で、このデータファイルを用いて変換を行うと、日本語の漢字が一瞬で繁体字に変換されます。あとは変換結果が妥当かどうか確認するだけ。1字ずつ調べることを考えれば随分楽です。
国字の扱いや制限事項などについて
- 「込」や「辻」などのいわゆる国字(和製漢字)は、繁体字に変換することができないため、変換後は「★」が出力されます。国字をそのまま出力したい場合などは、用語集の編集を行って下さい。[]
- 日繁.datは、日本の新字体を台湾で使われている繁体字に変換することを目指しているため、「闘」は「鬥」に変換され、「竃」は「灶」に変換されます。いわゆる旧字体への変換とは処理結果が異なります。
- 「狢」から「貉」への変換など、繁体字に変換する際に異体字や別字に置き換える漢字のうち、作者が注意が必要と判断した漢字は、出力時にアスタリスクが付加されます。作者のデータ管理用に設けたマークですので不要であれば編集して下さい。
- 変換データの登録を暫時保留している漢字は、「〓」が出力されます。
- 現行バージョンのPinconvにはU+9FA6以降の漢字データを扱えないという制限があります。そのため、この範囲に含まれる漢字を変換しようとしても「〓」が表示されます。ご了承下さい。
予、台、弁、干などの処理について
新字体では、繁体字の「瓣、辮、辯」などが「弁」で代替されています。「花瓣」は「花弁」に、「辮髮」は「弁髪」、「辯護」は「弁護」という風に本来は異なる漢字で表現すべきところを「弁」の1字で済ませているため、これを繁体字に変換するには単語ごとに処理を切り替える必要があります。「日繁.dat」には、こうした単語がいくつか登録されていますが(詳細は以下の一覧を参照)、正しく変換されなかったデータを見つけた場合は、お手数ですがご自分で追加してください。[]
read more…
某社で中国関係の業務を担当しているA氏に社長が声をかけた。
「今度、中国の工場に行く件でちょっと相談なんだが、せっかくだから現地の従業員に中国語であいさつしようと思ってね。忙しいところ悪いんだが、この日本語を中国語に翻訳して中国語の読みをカタカナで下に書いてくれないか」
A氏は、ピンインと声調を覚えて発音の練習しないとカタカナ読みでは通じないですよ、と出かかった言葉を飲み込み、「なるほど、現地の従業員も喜びますね。それでは一両日中に用意してお届けします」と返事をした。波風を立てない大人の対応である。
社長はA氏の肩をポンと叩き、じゃあよろしくと背を向ける。A氏は軽く会釈をして渡された原稿を広げ、面倒なことを頼まれたなと溜息をついた。
* * *
ということで、今回はこのA氏の手助けをしようと思う。翻訳については素晴らしい中国語訳が完成しているという前提で、その中国語をカタカナに変換する。使う道具はPinconvで、段取りとしては中国語→簡易ピンイン→カタカナの順に変換を行う。拼音→pin1yin1→ピンインというかたちだ。

中国語を簡易ピンインに変換するデータファイルは、Pinconvですでに実現されているため、簡易ピンインをカタカナにするための変換データを新たに作成する。
read more…
Pinconvは、漢字をピンインに変換したり、簡体字を日本の漢字に変換したり、簡体字を繁体字に変換したりするツールです。たとえば中華圏の人物や会社、建物、地名などを日本に紹介する際は、簡体字や繁体字を日本の漢字に置き換える必要がありますが、1文字ずつ対応する漢字を確認していくのは大変な作業です。Pinconvを使えば、元の中国語のテキストを張り付けて変換ボタンを押すだけで、この大変な作業をあっという間に片付けることができます。
特徴
1. 複数パターンの高速一括変換
複数の変換パターンをまとめて処理するために内部処理を最適化していますので、簡体字からピンインへの変換や繁体字から簡体字への変換など、変換パターンが数千~数万組単位で登録されていても高速に処理を行うことができます。
また、文字単位ではなく単語単位で変換を行いますので[]、たとえば簡体字から繁体字への変換では「头发」は「頭髮」に、「发布」を「發布」に変換することができますし、システムに登録されていないデータがあってもユーザが簡単に編集することができます。
2. 翻訳作業をサポートする多彩な機能
Pinconvには中国語翻訳者である作者が日々の作業を効率化するために実装した機能が多数盛り込まれています。Pinconvの変換機能を利用し、原文と変換後の文字列を対訳表示するGhost、翻訳作業後に対訳表示の原文部分を削除し、訳文のみに整形した上で対訳データベースに原文と訳文を保存するVacuum、対訳データベースから類似文字列を検索し、Pinconvを翻訳メモリツール化するあいまい検索機能などは、翻訳効率の大幅な向上を約束します。
3. 多言語対応エディタ
Pinconvは、Unicodeに対応しています。そのため、中国語と日本語など複数の言語が混在していても問題なく表示することができます。
UndoやRedo、クリッカブルURL、タブによる複数ファイルの管理、強調表示、正規表現に対応した検索と置換といったエディタとしての基本的な機能を備え、行間や折り返し、文字色や背景色など細かい部分まで設定を行うことが可能です。
また、EUC-JPやシフトJIS、UTF-8やGB2312、BIG5など複数の文字コードでのファイルの読み書きにも対応しています。
4. 豊富な検索機能


オンライン中日辞書 北辞郎との連携機能を備えていますので、分からない単語があっても右クリックから簡単に意味を調べることができます。読みが分からない漢字を調べるための「部首画数検索」や選択した文字列をWEBサイトで検索する「Web検索」機能も調べ物を強力にサポートします。
5. プラグインで機能拡充
Pinconv4にはプラグイン機能が用意されており、インストール時には編集作業をサポートする5つのプラグインが同梱されています。
- 日本語校閲
Yahoo!デベロッパーネットワークの校正支援を利用して編集中のファイルの校正を行うことができます。
- あいまい検索
編集中のファイルや対訳データベースを対象にあいまい検索を行うことができます。Pinconvに翻訳メモリ的な機能を追加するものです。
- Grep
フォルダ内の全ファイルを対象に検索を行います。サブフォルダの検索や正規表現を利用した検索が可能です。
- 見出し一覧
指定した文字列から始まる行を一覧表示することができます。正規表現が利用できるほか、ブックマークした行だけを一覧表示することもできます。
- 文字数カウント
コメント行とそれ以外の行を分けて文字数をカウントしたり、カーソル行までの文字数、カーソル行以降の文字数などをカウントすることができます。
read more…

カシオからエクスワードの新モデルXD-A7300が発表された。液晶がカラーになり、小学館の中日新語辞典や数え方の事典(前から欲しかった)が収録されているのが魅力的(参照:収録コンテンツ)。
さて、中国語コンテンツの串刺し検索はできるようになったかな。何も書いてないから今年もダメかな。毎年がっかりさせられているので、あまり期待せず発売されたら実機を触りに行こう。
中国語のかっこと句点の組み合わせについて調査。文末にかっこを置く場合、句点をかっこの後に付けるのか、前に付けるのか、またその場合かっこの中に句点を置いて良いのか悪いのか、という点をはっきりさせたい。ふだん相手にしているドキュメントではみなさん割とテキトー(失礼)であるように思われるが、こういうのはどこかにルールがあるはずである。で、調べてみたらこれがなかなかに複雑だった。
まず「句内括号」と「句外括号」という2種類の括弧がある。どちらも同じ ( と ) だが、「句内括号」は「注释句子里某种词语的,括注紧贴在被注释词语之后 」ということで、注釈をつけたい言葉の直後にかっこを置く。一方、「句外括号」は「注释整个句子的,括注放在句末标点之后」、つまりその文全体について注釈をつける場合に用い、句点の後に置かれる。
これは国家技术监督局が1995年に発布した标点符号用法の定義である。「句外括号」の定義が少し分かりにくいが、単語の補足や注釈にかっこを使う場合(句内括号、日本のかっこと同様の使い方)、かっこの前に句点は置かないという理解で問題なさそうだ。
文全体について説明を加える「句外括号」が句点の後ろに置かれることは分かったが、実際に「句外括号」がどのように使われているのか今ひとつ分かりにくかったので、ネット上の各種解説文書から例文を拾ってきた。
read more…
中国語の各種変換機能を備えたPinconv 4.00のβ版を公開します。
ダウンロード
pinconv.zip
Screenshot

Pinconvの主な機能についてはこちらを参照下さい。
β版の新機能
新たにプラグインの仕組みが導入されました。インストール時には次の5つのプラグインが同梱されています。
- 文字カウント
- コメント行とそれ以外の行を分けて文字数をカウントしたり、カーソル行までの文字数、カーソル行以降の文字数などをカウントすることができます。
- grep
- フォルダ内の全ファイルを対象に検索を行います。サブフォルダの検索や正規表現を利用した検索が可能です。
- あいまい検索
- 編集中のファイルや対訳データベースを対象にあいまい検索を行うことができます。Pinconvに翻訳メモリ的な機能を追加するものです。
- 日本語校閲
- 見出し表示
- 指定した文字列から始まる行を一覧表示することができます。正規表現が利用できるほか、ブックマークした行だけを一覧表示することもできます。
注意事項
現在、Pinconv 4.00はβ版です。不具合が残っている可能性があるほか、作者の思いつきで仕様が変わることがありますのでご注意下さい。なお、現在のところPinconvは機能制限なく利用することができますが、将来的には一部機能をシェアウェア化する予定です。あらかじめご了承下さい。
ヘルプ
作りかけですがこちらに使い方の簡単な説明があります。