<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Karak &#187; Pinconv</title>
	<atom:link href="http://www.karak.jp/articles/category/pinconv/feed" rel="self" type="application/rss+xml" />
	<link>http://www.karak.jp</link>
	<description>Language and Translation</description>
	<lastBuildDate>Fri, 10 Sep 2010 13:28:44 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
		<item>
		<title>Pinconv 4.11</title>
		<link>http://www.karak.jp/articles/software/pinconv411.html</link>
		<comments>http://www.karak.jp/articles/software/pinconv411.html#comments</comments>
		<pubDate>Mon, 28 Jun 2010 23:50:19 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Pinconv]]></category>
		<category><![CDATA[Software]]></category>
		<category><![CDATA[Tcl]]></category>
		<category><![CDATA[word]]></category>
		<category><![CDATA[テキスト]]></category>
		<category><![CDATA[ピンイン]]></category>
		<category><![CDATA[変換]]></category>
		<category><![CDATA[抽出]]></category>
		<category><![CDATA[漢字]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1739</guid>
		<description><![CDATA[Pinconvのバージョンアップを行いました。終了時のコマンドバーとサイドバーの状態を起動時に復元する機能を追加したほか、北辞郎検索に関係する不具合などを修正しています。

ダウンロード：
pinconv4.exe （イ [...]]]></description>
			<content:encoded><![CDATA[<p>Pinconvのバージョンアップを行いました。終了時のコマンドバーとサイドバーの状態を起動時に復元する機能を追加したほか、北辞郎検索に関係する不具合などを修正しています。</p>
<ul>
<p>ダウンロード：</p>
<li><a href="http://www.karak.jp/tool/pinconv4.exe">pinconv4.exe</a> （インストーラ形式 – 3.76MB）</li>
<li><a href="http://www.karak.jp/tool/pinconv4.zip">pinconv4.zip</a> （zip形式 – 3.41MB）</li>
</ul>
<p>Pinconvの紹介は<a href="http://www.karak.jp/articles/software/pinconv-4-00.html" target="_blank">こちらのエントリ</a>、詳しい使い方については<a href="http://www.karak.jp/articles/software/pinconv%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9.html" target="_blank">Pinconvの使い方</a>を参照下さい。窓の杜による<a href="http://www.forest.impress.co.jp/docs/review/20100119_343320.html" target="_blank">紹介記事はこちら</a>です。</p>
<h2>修正点</h2>
<ul>
<li>北辞郎の検索時の検索オプションまわりの不具合を修正</li>
<li>終了時のコマンドバーとサイドバーの状態を起動時に復元するように変更（プラグインによって表示されたものは除く）</li>
<li>検索用のコマンドバーや置換用のサイドバーなどでEscapeキーを押すとエディタ部分にフォーカスが移るように変更</li>
<li>色設定ダイアログのカラーテーマの選択方法を変更</li>
<li>変換データファイルが切り替えられた際のステータスバー更新の不具合を修正</li>
<li>検索時のハイライトの挙動を修正</li>
<li>「ファイルを開く」からWordファイルのテキストを抽出しても「最近開いたファイル」に登録されない不具合を修正</li>
<li>Wordのファイルからテキストを抽出する際にインライン要素を無視するオプションを追加（設定ダイアログの「ファイル」タブ）</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/articles/software/pinconv411.html/feed</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Pinconv 4.10</title>
		<link>http://www.karak.jp/articles/software/pinconv410.html</link>
		<comments>http://www.karak.jp/articles/software/pinconv410.html#comments</comments>
		<pubDate>Tue, 01 Jun 2010 07:25:27 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Pinconv]]></category>
		<category><![CDATA[Software]]></category>
		<category><![CDATA[Tcl]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1673</guid>
		<description><![CDATA[Pinconvのマイナーバージョンアップを行いました。テンプレート置換のファイル切り替えに関連する不具合などを修正しています。
ダウンロード：
pinconv4.exe （インストーラ形式 – 3.76MB）
pinco [...]]]></description>
			<content:encoded><![CDATA[<p>Pinconvのマイナーバージョンアップを行いました。テンプレート置換のファイル切り替えに関連する不具合などを修正しています。</p>
<ul>ダウンロード：</p>
<li><a href="http://www.karak.jp/tool/pinconv4.exe">pinconv4.exe</a> （インストーラ形式 – 3.76MB）</li>
<li><a href="http://www.karak.jp/tool/pinconv4.zip">pinconv4.zip</a> （zip形式 – 3.41MB）</li>
</ul>
<p>Pinconvの紹介は<a href="http://www.karak.jp/articles/software/pinconv-4-00.html" target="_blank">こちらのエントリ</a>、詳しい使い方については<a href="http://www.karak.jp/articles/software/pinconv%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9.html" target="_blank">Pinconvの使い方</a>を参照下さい。窓の杜による<a href="http://www.forest.impress.co.jp/docs/review/20100119_343320.html" target="_blank">紹介記事はこちら</a>です。</p>
<h2>修正点</h2>
<ul>
<li>登録ユーザ専用機能「データファイルの保存先を変更」の挙動を変更</li>
<li>テンプレート置換のファイル切り替えが正しく動作しない不具合を修正</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/articles/software/pinconv410.html/feed</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Pinconv 4.09</title>
		<link>http://www.karak.jp/articles/software/pinconv409.html</link>
		<comments>http://www.karak.jp/articles/software/pinconv409.html#comments</comments>
		<pubDate>Mon, 24 May 2010 07:51:51 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Pinconv]]></category>
		<category><![CDATA[Software]]></category>
		<category><![CDATA[Tcl]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1666</guid>
		<description><![CDATA[Pinconvのマイナーバージョンアップを行いました。システムディレクトリの設定に関連する不具合を修正しています。
ダウンロード：
pinconv4.exe （インストーラ形式 – 3.76MB）
pinconv4.zi [...]]]></description>
			<content:encoded><![CDATA[<p>Pinconvのマイナーバージョンアップを行いました。システムディレクトリの設定に関連する不具合を修正しています。</p>
<ul>ダウンロード：</p>
<li><a href="http://www.karak.jp/tool/pinconv4.exe">pinconv4.exe</a> （インストーラ形式 – 3.76MB）</li>
<li><a href="http://www.karak.jp/tool/pinconv4.zip">pinconv4.zip</a> （zip形式 – 3.41MB）</li>
</ul>
<p>Pinconvの紹介は<a href="http://www.karak.jp/articles/software/pinconv-4-00.html" target="_blank">こちらのエントリ</a>、詳しい使い方については<a href="http://www.karak.jp/articles/software/pinconv%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9.html" target="_blank">Pinconvの使い方</a>を参照下さい。窓の杜による<a href="http://www.forest.impress.co.jp/docs/review/20100119_343320.html" target="_blank">紹介記事はこちら</a>です。</p>
<h2>修正点</h2>
<ul>
<li>バージョンアップ時のシステムディレクトリの設定に関係する不具合を修正</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/articles/software/pinconv409.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Pinconv 4.08 &#8211; テンプレート置換と連続置換</title>
		<link>http://www.karak.jp/articles/software/pinconv408.html</link>
		<comments>http://www.karak.jp/articles/software/pinconv408.html#comments</comments>
		<pubDate>Sat, 22 May 2010 01:24:56 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Chinese]]></category>
		<category><![CDATA[Pinconv]]></category>
		<category><![CDATA[Software]]></category>
		<category><![CDATA[Tcl]]></category>
		<category><![CDATA[Translate]]></category>
		<category><![CDATA[ピンイン]]></category>
		<category><![CDATA[中国語]]></category>
		<category><![CDATA[変換]]></category>
		<category><![CDATA[簡体字]]></category>
		<category><![CDATA[繁体字]]></category>
		<category><![CDATA[置換]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1558</guid>
		<description><![CDATA[テンプレート置換、連続置換、Ghost用ダイアログなどの機能を追加し、置換関連機能を大幅に拡充したPinconvのバージョン4.08を公開します。
ダウンロード：
pinconv4.exe （インストーラ形式 – 3.7 [...]]]></description>
			<content:encoded><![CDATA[<p>テンプレート置換、連続置換、Ghost用ダイアログなどの機能を追加し、置換関連機能を大幅に拡充したPinconvのバージョン4.08を公開します。</p>
<ul>ダウンロード：</p>
<li><a href="http://www.karak.jp/tool/pinconv4.exe">pinconv4.exe</a> （インストーラ形式 – 3.76MB）</li>
<li><a href="http://www.karak.jp/tool/pinconv4.zip">pinconv4.zip</a> （zip形式 – 3.41MB）</li>
</ul>
<p>Pinconvの紹介は<a href="http://www.karak.jp/articles/software/pinconv-4-00.html" target="_blank">こちらのエントリ</a>、詳しい使い方については<a href="http://www.karak.jp/articles/software/pinconv%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9.html" target="_blank">Pinconvの使い方</a>を参照下さい。窓の杜による<a href="http://www.forest.impress.co.jp/docs/review/20100119_343320.html" target="_blank">紹介記事はこちら</a>です。</p>
<p>以下、新たに追加した3機能の概要を紹介します。それぞれ詳しい使い方については、ヘルプの<a href="http://www.karak.jp/?p=481#template">テンプレート置換</a>、<a href="http://www.karak.jp/?p=481#seq">連続置換</a>、<a href="http://www.karak.jp/?p=481#gdlg">Ghost用ダイアログ</a>をご参照下さい。</p>
<p><span id="more-1558"></span></p>
<h2>テンプレート置換</h2>
<p>置換前と置換後のパターンをファイルに登録しておき、そのファイルを読み込んでまとめて置換を行う機能です。読み込むファイルは、文字コードがUTF-8のテキストファイルで、置換前と置換後のパターンをタブで区切って1行にまとめてあるものとします。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/template-button.png" rel="lightbox[1558]"><img src="http://www.karak.jp/wp-content/uploads/template-button-300x176.png" alt="コマンドバー" title="コマンドバー" width="300" height="176" class="aligncenter size-medium wp-image-1607" /></a></p>
<p>Pinconvをインストールしたフォルダ（またはデータ保存フォルダ）にあるtemplateフォルダに見本用テンプレートファイル「smple.dat」がありますので、実際のファイルの内容はそちらをご参照下さい。</p>
<p>通常の置換と同様、たとえば「りんご」を「apple」にしたい場合は、「リンゴ&lt;tab&gt;apple&lt;改行&gt;」をファイルに登録しますが、「リンゴ」と「りんご」と「<span lang="zh-cn" class="cn">苹果</span>」を「apple」にしたい場合、正規表現を使用して「リンゴ|りんご|苹果&lt;tab&gt;apple&lt;改行&gt;」という風に登録することができます。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/template1.png" rel="lightbox[1558]"><img src="http://www.karak.jp/wp-content/uploads/template1-300x143.png" alt="template1" title="template1" width="300" height="143" class="aligncenter size-medium wp-image-1602" /></a></p>
<p>後方参照を利用することもできますので、「<span lang="zh-cn" class="cn">根据(\w+)进行检查</span> 」と「\1に基づいて検査を行う」の組み合わせを登録しておき、「<span lang="zh-cn" class="cn">根据公司规定进行检查</span>」という文字列に対してテンプレート置換を実行すると「<span lang="zh-cn" class="cn">公司规定</span>に基づいて検査を行う」に置換されます。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/template-sidebar.png" rel="lightbox[1558]"><img src="http://www.karak.jp/wp-content/uploads/template-sidebar-300x211.png" alt="sidebar" title="sidebar" width="300" height="211" class="aligncenter size-medium wp-image-1609" /></a></p>
<p>なお、置換サイドバーで「テンプレートファイルに登録する」オプションを有効にしておくと、置換を実行するたびに置換前と置換後の組み合わせがファイルに保存されます。</p>
<div class="box">
Pinconvの通常の「変換」と「テンプレート置換」の最大の違いは、正規表現が使えるか使えないかにあります。「テンプレート置換」は、テキストファイルを読み込んで処理を行うため、内部処理を最適化してある「変換」に比べて速度的に劣りますが、柔軟かつ強力な正規表現の機能をフル活用することができます。
</div>
<h2>連続置換</h2>
<p>対象文字列に複数の変換処理を一度に適用する機能です。Pinconvの変換データファイルやテンプレート置換ファイルへのパスが登録されたテキストファイルを読み込み、その変換用ファイルを順に使用して処理を行います。ファイルの文字コードはUTF-8とし、1行1パスの形式で登録します。</p>
<p>たとえばPinconvでは、変換データファイルの「ピンイン」を適用した後、「声調」を適用すると漢字を声調記号付きのピンインに変換することができますが、連続置換を利用すると、この処理を1つにまとめることができます。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/seq-gen1.png" rel="lightbox[1558]"><img src="http://www.karak.jp/wp-content/uploads/seq-gen1-300x161.png" alt="2つの変換をまとめる" title="2つの変換をまとめる" width="300" height="161" class="aligncenter size-medium wp-image-1614" /></a></p>
<p>インストールフォルダ（またはデータ保存フォルダ）の「seq」フォルダにサンプルファイル「sample.dat」がありますので、このファイルをPinconvで開いてみて下さい。変換データファイルのパスが2つ登録されていると思います。連続置換では、ファイルに登録されたパスに従い、データファイルを順番に読み込んで変換を行います。連続置換用のファイルとして「sample.dat」を選択し、処理を実行すれば「<span lang="zh-cn" class="cn">拼音</span>」という単語が1クリックで「<span class="pyn">pīnyīn</span>」に変換されます。</p>
<p>変換データファイルだけでなくテンプレート置換ファイルを登録することも可能です。この組み合わせを利用すると簡易翻訳処理を実現することができます。次の処理をまとめることを考えてみましょう。</p>
<ol>
<li>処理対象の文字列は「<span lang="zh-cn" class="cn">根据相关规定进行检查</span>」とします。</li>
<li>テンプレート置換ファイル「test.dat」には「根据(\w+)进行检查 」と「\1に基づいて検査を行う」の組み合わせが登録されているものとします。</li>
<li>このテンプレートを処理対象の文字列に適用すると「<span lang="zh-cn" class="cn"><u>相关规定</u></span>に基づいて検査を行う」という結果が得られます。</li>
<li>この結果に対し、さらに変換データファイル「中日.dat」を適用すると、「相関規定に基づいて検査を行う」となります。</li>
</ol>
<p><a href="http://www.karak.jp/wp-content/uploads/seq-replace.png" rel="lightbox[1558]"><img src="http://www.karak.jp/wp-content/uploads/seq-replace-300x163.png" alt="replace" title="replace" width="300" height="163" class="aligncenter size-medium wp-image-1617" /></a></p>
<p>中国語を知らない人でもこの結果ならなんとなく意味がつかめるでしょう。ちょっとした翻訳みたいで面白いですね。では、次回から何度もクリックをしないで済むように、テンプレート置換ファイル「test.dat」へのパスと変換データファイル「中日.dat」へのパスを連続置換ファイルに記録します。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/Clipboard021.png" rel="lightbox[1558]"><img src="http://www.karak.jp/wp-content/uploads/Clipboard021-300x184.png" alt="連続置換ファイルの作成" title="連続置換ファイルの作成" width="300" height="184" class="aligncenter size-medium wp-image-1664" /></a></p>
<p>「変換」メニューの「連続置換ファイルを作成」を実行すると、ファイル選択用のダイアログが表示されます。「追加」を押して選択したファイルのパスはテキストボックスに入力されます。必要なファイルを選び終わったら「OK」を押し、連続置換ファイルに名前を付けて保存します。連続置換ファイルにはいくつでもファイルを登録できます。登録する数に制限はありません。ファイルに登録してあるパスは、先頭から順に読み込まれるので、適用したい順に並べてください。</p>
<div class="box">
Ghost用のダイアログを利用し、「連続置換用のファイルを作成」オプションを有効にすると処理時に使用したファイルの組み合わせを連続置換用に保存することができます。
</div>
<h2>Ghost用ダイアログ</h2>
<p>Ghostを実行する際に変換データファイルだけでなく、テンプレート置換ファイルや連続置換ファイルを適用したい場合に使用するダイアログです。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/ghost-dialog.png" rel="lightbox[1558]"><img src="http://www.karak.jp/wp-content/uploads/ghost-dialog-255x300.png" alt="ghost-dialog" title="ghost-dialog" width="255" height="300" class="aligncenter size-medium wp-image-1619" /></a></p>
<p>画面上部でファイルを選択し、オプション部分で使用するファイルを指定した上で、「OK」を押して処理を実行します。</p>
<p>ダイアログ下部の「連続置換用のファイルを作成」オプションを有効にすると処理時に使用したファイルの組み合わせを連続置換用に保存することができます。</p>
<div class="box">
「連続置換」→「テンプレート置換」→「変換」の順にファイルが適用されます。ダイアログではこの順番を変更できませんので、順番を変更したい場合は、連続置換ファイルに好みの順番でパスを登録し、そのファイルを使ってGhostを行うと良いでしょう。
</div>
<h2>今回の修正点</h2>
<ul>
<li>Wordファイルからテキストを抜き出す機能とテキストを書き戻す機能の不具合を修正</li>
<li>「Ghostの再実行」の不具合を修正</li>
<li>登録ユーザ専用機能「データファイルの保存先を変更」の挙動をよりシンプルなかたちに変更</li>
<li>Wordから抜き出したファイルを正しく扱えるようにVacuumの挙動を修正</li>
<li>変換コマンドバーからボタンを削除する際の不具合を修正</li>
<li>繁体字と日本語の変換データを修正（<span lang="zh-tw" class="tw">值</span>→値、<span lang="zh-tw" class="tw">閒</span>→閑）
</li>
<li>データインポートの処理の不具合を修正</li>
</ul>
<div class="box">
※予告：バージョンアップの処理に不具合があるため、近日中に修正を行います。
</div>
]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/articles/software/pinconv408.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>フレーズ置換と連続置換</title>
		<link>http://www.karak.jp/articles/blog/phrase.html</link>
		<comments>http://www.karak.jp/articles/blog/phrase.html#comments</comments>
		<pubDate>Tue, 27 Apr 2010 13:15:07 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[Pinconv]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1518</guid>
		<description><![CDATA[Pinconvに組み込もうと思っている機能について。
1. フレーズ置換
特許文書には似たような言い回しが繰り返し出てくる。たとえば請求項で「如权利要求1所述的方法」と来たら「請求項1に記載の方法」と訳出するのだが、これ [...]]]></description>
			<content:encoded><![CDATA[<p>Pinconvに組み込もうと思っている機能について。</p>
<h3>1. フレーズ置換</h3>
<p>特許文書には似たような言い回しが繰り返し出てくる。たとえば請求項で「<span lang="zh-cn" class="cn">如权利要求1所述的方法</span>」と来たら「請求項1に記載の方法」と訳出するのだが、これが「<span lang="zh-cn" class="cn">如权利要求2所述的方法</span>」であっても「<span lang="zh-cn" class="cn">如权利要求8所述的装置</span>」であっても訳文はほぼ同じで項番や特許請求の対象部分が異なるだけだ。つまり「<span lang="zh-cn" class="cn">如权利要求A所述的B</span>」を「請求項Aに記載のB」にする作業の繰り返しである。</p>
<p>これを正規表現を使った置換で処理するとすれば次のように書けば良い（あくまで一例）。</p>
<div class="box"><span lang="zh-cn" class="cn">如权利要求([0-9０-９]+)所述的([^\n，。；：]+)</span>　→　請求項\1に記載の\2</div>
<p>テキストエディタで「すべて置換」などを実行すれば、「<span lang="zh-cn" class="cn">如权利要求A所述的B</span>」および一部が異なるだけの類似文字列が「請求項Aに記載のB」などにきちんと変換される。すばらしい。ちまちま手入力したり、コピペしたりする手間を考えるとずいぶん楽だ。</p>
<p>だが上掲の正規表現を毎回入力するのは面倒だ。こういう置換の組み合わせをファイルにまとめておいてコピペしたり、IMEに登録したりするといった対処方法も考えられるが、組み合わせを覚えるのも管理するのも面倒だ。嗚呼、もう何もかも面倒だ。うんざりだ。もう仕事なんかやめて旅に出よう。そういう気分になること請け合いである。</p>
<p>だからタブ区切りファイルにこういう置換の組み合わせをどっさり記録しておいて<sup>[1]</sup>、それを読み込ませてまとめて置換する機能を作る（これをフレーズ置換と呼ぶことにした）。似たようなツールはこれまでにも作ったことがあるし、世の中にもたくさん存在するが、Pinconvの通常の変換やGhostなんかと組み合わせることができれば、かなり便利なものになると思う。ということで次の連続置換も実装したい。</p>
<h3>2. 連続置換</h3>
<p>フレーズ置換の機能が完成し、「<span lang="zh-cn" class="cn">如权利要求1所述的设备</span>」を無事変換できるようになったと仮定する。「請求項1に記載の<u>设备</u>」と変換されるので、Pinconvの「中日.dat」を使ってさらに変換を行えば、下線部の簡体字が日本の漢字に変換され、「請求項1に記載の<u>設備</u>」となる。すばらしい。わずか2ステップで訳文のできあがりである。</p>
<p>だが、この2ステップを毎回繰り返すのも馬鹿みたいである。人生において地道な積み重ねは大切だが、単調で機械的な作業をいくらこなしたところでそれほど有意義な成果はあがらない。私の友人ドン・コルレオーネの言葉だ。</p>
<p><a href="http://www.amazon.co.jp/exec/obidos/ASIN/B0032ZOFLK/transchinese-22/"><img alt="" src="http://ec3.images-amazon.com/images/I/419ju%2BiASJL._SS400_.jpg" title="ドン・コルレオーネ" class="aligncenter" width="40%" /></a></p>
<p>正規表現を記録したファイルを使って「フレーズ置換」を行ったら、続けて「中日.dat」を使って通常の変換を行うというフローをシステムに記憶させ、次からは1クリックで実行できると便利だ。この処理を連続置換と呼ぼう<sup>[2]</sup>。実現すれば、作業の効率が1割くらい上がりそうだ。1割よぶんに仕事をすれば、ずいぶん収入がアップすることだろう。国民の模範たる私が納税することで国庫も潤うことだろう。</p>
<p>ということでこの2つの実装に取りかかる。</p>
<ol class="footnotes"><li id="footnote_0_1518" class="footnote">置換用サイドバーからこうした組み合わせを保存できるようにすれば便利かもしれない。</li><li id="footnote_1_1518" class="footnote">これができればリクエストいただいている簡体字から声調付きピンインへの直接変換も実現できる。</li></ol>]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/articles/blog/phrase.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Pinconv 4.07</title>
		<link>http://www.karak.jp/articles/pinconv/pinconv407.html</link>
		<comments>http://www.karak.jp/articles/pinconv/pinconv407.html#comments</comments>
		<pubDate>Tue, 27 Apr 2010 12:34:38 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Pinconv]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1543</guid>
		<description><![CDATA[Pinconvのマイナーバージョンアップを行いました。いくつか不具合を修正しています。
ダウンロード：
pinconv4.exe （インストーラ形式 – 3.75MB）
pinconv4.zip （zip形式 – 3.4 [...]]]></description>
			<content:encoded><![CDATA[<p>Pinconvのマイナーバージョンアップを行いました。いくつか不具合を修正しています。</p>
<ul>ダウンロード：</p>
<li><a href="http://www.karak.jp/tool/pinconv4.exe">pinconv4.exe</a> （インストーラ形式 – 3.75MB）</li>
<li><a href="http://www.karak.jp/tool/pinconv4.zip">pinconv4.zip</a> （zip形式 – 3.41MB）</li>
</ul>
<p>Pinconvの紹介は<a href="http://www.karak.jp/articles/software/pinconv-4-00.html" target="_blank">こちらのエントリ</a>、詳しい使い方については<a href="http://www.karak.jp/articles/software/pinconv%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9.html" target="_blank">Pinconvの使い方</a>を参照下さい。窓の杜による<a href="http://www.forest.impress.co.jp/docs/review/20100119_343320.html" target="_blank">紹介記事はこちら</a>です。</p>
<h2>修正点</h2>
<ul>
<li>Wordファイルにテキストを書き戻す機能を修正</li>
<li>同Wordファイル関連の内部処理を修正</li>
<li>Wordから抜き出したファイルを正しく扱えるようにVacuumの挙動を修正</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/articles/pinconv/pinconv407.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Pinconv 4.06 &#8211; Wordファイルの操作</title>
		<link>http://www.karak.jp/articles/software/pinconv406-word.html</link>
		<comments>http://www.karak.jp/articles/software/pinconv406-word.html#comments</comments>
		<pubDate>Sun, 11 Apr 2010 02:01:18 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Pinconv]]></category>
		<category><![CDATA[Software]]></category>
		<category><![CDATA[Tcl]]></category>
		<category><![CDATA[extract]]></category>
		<category><![CDATA[overwrite]]></category>
		<category><![CDATA[pinyin]]></category>
		<category><![CDATA[text]]></category>
		<category><![CDATA[word]]></category>
		<category><![CDATA[ピンイン]]></category>
		<category><![CDATA[変換]]></category>
		<category><![CDATA[拼音]]></category>
		<category><![CDATA[日本語]]></category>
		<category><![CDATA[日语]]></category>
		<category><![CDATA[漢字]]></category>
		<category><![CDATA[简体字]]></category>
		<category><![CDATA[繁体字]]></category>
		<category><![CDATA[转换]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1387</guid>
		<description><![CDATA[MS-Wordファイルからテキストを抽出し、編集後に書き戻す機能を追加したPinconvのバージョン4.06を公開します。
ダウンロード：
pinconv4.exe （インストーラ形式 – 3.75MB）
pinconv [...]]]></description>
			<content:encoded><![CDATA[<p>MS-Wordファイルからテキストを抽出し、編集後に書き戻す機能を追加したPinconvのバージョン4.06を公開します。</p>
<ul>ダウンロード：</p>
<li><a href="http://www.karak.jp/tool/pinconv4.exe">pinconv4.exe</a> （インストーラ形式 – 3.75MB）</li>
<li><a href="http://www.karak.jp/tool/pinconv4.zip">pinconv4.zip</a> （zip形式 – 3.40MB）</li>
</ul>
<p>Pinconvの紹介は<a href="http://www.karak.jp/articles/software/pinconv-4-00.html" target="_blank">こちらのエントリ</a>、詳しい使い方については<a href="http://www.karak.jp/articles/software/pinconv%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9.html" target="_blank">Pinconvの使い方</a>を参照下さい。窓の杜による<a href="http://www.forest.impress.co.jp/docs/review/20100119_343320.html" target="_blank">紹介記事はこちら</a>です。</p>
<h2>MS-Wordのファイルからテキストを抽出・編集・上書き</h2>
<p><a href="http://www.karak.jp/wp-content/uploads/word2txt1.png" rel="lightbox[1387]"><img src="http://www.karak.jp/wp-content/uploads/word2txt1.png" alt="word2txt" title="word2txt" width="204" height="98" class="aligncenter size-full wp-image-1468" /></a></p>
<p>Wordのファイルをテキストエディタで編集したいと思ったことがあるのは、私だけではないでしょう。Wordは優れたアプリケーションですが、テキストをガリガリと入力する時は使い慣れたテキストエディタの方が効率がいいですし、テキストが相手なら置換や整形、校正、翻訳支援など各種ツールを利用して作業の省力化を図ることができます。</p>
<p>私はふだんほとんどの翻訳作業をPinconv上で行っています。変換データファイル「中日.dat」をベースに翻訳用のデータファイルを作成していて、固有名詞や専門用語などを数千語登録しています。</p>
<p>たとえば、翻訳対象である中国語の原文に「<span lang="zh-cn" class="cn">发改委</span>」という単語が出てきたとしましょう。この言葉は組織名の略称ですので日本語にすると「発展改革委員会」となります。いつ、どのような文脈で出てきても必ず「発展改革委員会」と訳出することになりますので、毎回「hattennkaikakuiinnkai」とバカ正直にタイピングするのは避けたいところです。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/fagaiwei.png" rel="lightbox[1387]"><img src="http://www.karak.jp/wp-content/uploads/fagaiwei-300x34.png" alt="発展改革委員会" title="発改委" width="300" height="34" class="aligncenter size-medium wp-image-1466" /></a></p>
<p>そこで先ほどの翻訳用データファイルに「<span lang="zh-cn" class="cn">发改委</span>」と「発展改革委員会」のペアを登録しておきます。そうすると次からはGhostを実行するだけで「<span lang="zh-cn" class="cn">发改委</span>」が「発展改革委員会」に変換されますので入力の手間が省けます。手間が省けるだけでなく入力ミスの心配もなくなります。効率を上げミスも防ぐ。私のように無精でそそっかしい人間には最適の作業環境です。</p>
<p>しかしながら現実は思うに任せないもので、最終的に納品するのはたいていWordファイルです。表組みやテキストボックスの中を翻訳しなければいけないこともあります。プレーンテキストに落としてしまうとこうしたレイアウトなどの書式情報は保持されないため、自前で復元しなければいけません。当たり前ですがものすごく面倒です。</p>
<p>職人芸の域に達している複雑な表組みやテキストボックスを多用したフローチャートなどは、ツールで翻訳の効率化を実現してもレイアウトを復元する労力の方がそれを上回るのでメリットがありません<sup>[1]</sup>。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/word-extract2.png" rel="lightbox[1387]"><img src="http://www.karak.jp/wp-content/uploads/word-extract2-300x254.png" alt="Wordからテキストを抽出" title="Wordからテキストを抽出" width="300" height="254" class="aligncenter size-medium wp-image-1421" /></a></p>
<p>そこで必要となるのが次のようなソリューション。Wordファイルからテキストを抜き出し、エディタを使って書式やレイアウトを改変することなくテキスト部分だけを編集し、作業が完了したら修正内容を元のファイルに反映させる。これができれば使い慣れた環境がそのまま使えますし、面倒な編集作業に時間を取られることもありません。</p>
<p>今回Pinconvに実装した「テキストの抽出」と「書き戻し」は、上述の機能を実現するものです。以下、実際の作業手順を紹介します。<br />
<span id="more-1387"></span></p>
<h2>テキスト抽出の手順</h2>
<p>0．テキストの抽出と書き戻しを利用するには、使用している電脳にWordがインストールされている必要があります。</p>
<p>1．まず「ツール」メニューの「MS-Wordからテキストを抽出」を実行し、処理対象のWordファイルを選択します。拡張子はdoc、docx、xml、rtfに対応しています。</p>
<p>2．ファイルを選択するとテキストの抽出が行われます。このとき、拡張子がxml以外のファイルは、まずXMLに変換され<sup>※</sup>、そのXMLファイルからテキストの抽出が行われます。抽出はパラグラフ単位で行われ、パラグラフの先頭には連番が振られます（<1>のようにタグで括られます）。<u>この番号は編集後にWordファイルに書き戻す際に必要となりますので消さないように注意してください。</u>何もない空のパラグラフにも番号が振られますが、消してしまうと書き戻しができなくなります。</p>
<p>※変換にはWordの機能を使うため、一時的にWordが立ち上がりますが変換後は自動的に閉じます。なお、変換してできたXMLファイルは元のWordファイルと同じフォルダに作成されます。</p>
<p>3．テキストの抽出を行う際、太字、下線、斜体、文字色、背景色、フォントサイズなどのほか、コメント、脚注、テキストボックスなど書式情報を保持する必要がある部分については、簡易マークアップでそれを表現します（簡易マークアップの詳細は<a href="#markup">こちらを参照</a>）。</p>
<p>たとえば、<a href="http://www.karak.jp/test/guxiang.doc" target="_blank">このワードファイル</a>（リンク：<a href="http://docs.google.com/viewer?url=http%3A%2F%2Fwww.karak.jp%2Ftest%2Fguxiang.pdf" target="_blank">Google Docs</a>）からテキストを抽出すると次のようになります。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/word-extracted-text.png" rel="lightbox[1387]"><img src="http://www.karak.jp/wp-content/uploads/word-extracted-text-300x289.png" alt="抽出したテキスト" title="抽出したテキスト" width="300" height="289" class="aligncenter size-medium wp-image-1470" /></a></p>
<p>4．抽出が終わるとWordファイルと同じフォルダにテキストファイルが出力され、新しいバッファにその内容が表示されます。以上で作業は完了です。抽出したテキストに対して一括置換を行ったり、Ghostを適用して翻訳したりするなど適宜編集を行い、次の書き戻しのステップに進みます。</p>
<div class="box">
書式が細かく指定されているファイルからテキストを抽出するとマークアップの二重括弧がたくさん挿入され、たいへん鬱陶しいと思います。コメント、脚注、テキストボックスはファイルの内部構造に関係しているため、削除することはできませんが（削除すると正しく書き戻しができなくなります）、この3つ以外のフォントのサイズや太字、下線などの情報は不要であれば消すことができます。必要に応じて処理してください。
</div>
<h2>Wordファイルへの書き戻し</h2>
<p>1．「ツール」メニューから「MS-Wordファイルのテキストを上書き」を実行すると以下のダイアログが表示されます。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/word-overwrite.png" rel="lightbox[1387]"><img src="http://www.karak.jp/wp-content/uploads/word-overwrite-300x131.png" alt="上書きダイアログ" title="上書きダイアログ" width="300" height="131" class="aligncenter size-medium wp-image-1417" /></a></p>
<p>このダイアログでは、書き戻すテキストファイルと抽出元のWordファイル<sup>[2]</sup>を指定します。</p>
<p>2．テキストファイルの入力欄には、現在編集中のテキストファイルが自動的に入力されます。違うファイルを指定する場合は、入力欄横の「&#8230;」ボタンを押し、ファイルを指定してください。</p>
<p>3．テキストファイルと同じフォルダにそのファイルと拡張子以外の部分が同じXMLファイルがあれば （たとえばテキストファイルが「c\test\テスト.txtの場合、「c\test\テスト.xml」）、抽出元のファイルと見なされ、下段のファイル入力欄に自動入力されます。違うファイルを指定する場合は、テキストファイルと同様に「&#8230;」ボタンを押し、ファイルを指定してください。</p>
<div class="box">この抽出元のXMLファイルの構造とテキストファイルの各行頭にあるパラグラフ番号に従って書き戻しが行われます。</div>
<p>4．ファイルの指定が完了し、「OK」ボタンを押すと書き戻し処理が行われます。問題なく処理が終われば、抽出元のファイル名+今日の日付.xmlの形式でXMLファイルが作成され、作成されたファイルをWordで開くかどうかの確認ダイアログが表示されます。問題が発生した場合は、抽出元ファイルと同じフォルダに<a href="#err">ログファイル</a>が作成されます。</p>
<p>5．以上で書き戻しは完了です。Word上で処理結果を確認して下さい。なお、ファイル全体のフォント情報は変更されませんのでファイルを開いてみて表示がおかしい場合は調整する必要があります。</p>
<h2><a name="markup">簡易マークアップ</a></h2>
<ul>
<li>太字：((太字の文字列|b))</li>
<li>下線：((下線が施された文字列|u))</li>
<li>斜体：((斜体の文字列|i))</li>
<li>文字色：((色が指定された文字列|fg|色))</li>
<li>背景色：((背景色が指定された文字列|bg|色))</li>
<li>上付き：((上付きが指定された文字列|sup))</li>
<li>下付き：((下付きが指定された文字列|sub))</li>
<li>フォントサイズ：((サイズが指定された文字列|sz|サイズ))</li>
<li>コメントが付けられた文字列：((コメントが付けられたテキスト|cbody|番号))
<li>コメントの内容：((コメントの内容|comment))</li>
<li>脚注：((脚注の内容|fnote))</li>
<li>テキストボックス：((テキストボックスの内容|tbx))</li>
</ul>
<h2><a name="err">エラーログの内容</a></h2>
<ul>
<li>LINEHEAD:パラグラフの文字列…書き戻そうとしているテキストの先頭に<1>形式の番号がないため、抽出元ファイルとの対応が確認できない。</li>
<li>NUMBER:パラグラフの文字列…書き戻そうとしているテキストの番号と抽出元ファイルの構造が一致していない。</li>
</ul>
<ol class="footnotes"><li id="footnote_0_1387" class="footnote">Wordのマクロを利用した支援ツールもあるようですが、なんとなく手を出すのが億劫で今日に至っています。</li><li id="footnote_1_1387" class="footnote">抽出時に作成されるXMLファイルを選択することをおすすめします（ファイル形式の変換など余分な手間がかからないため）。</li></ol>]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/articles/software/pinconv406-word.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Pinconv 4.05 &#8211; ピンインデータの追加</title>
		<link>http://www.karak.jp/articles/software/pinconv405-pinyin.html</link>
		<comments>http://www.karak.jp/articles/software/pinconv405-pinyin.html#comments</comments>
		<pubDate>Thu, 08 Apr 2010 02:32:32 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Chinese]]></category>
		<category><![CDATA[Pinconv]]></category>
		<category><![CDATA[Software]]></category>
		<category><![CDATA[ピンイン]]></category>
		<category><![CDATA[変換]]></category>
		<category><![CDATA[拼音]]></category>
		<category><![CDATA[漢字]]></category>
		<category><![CDATA[繁体字]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1393</guid>
		<description><![CDATA[
変換データファイル「ピンイン.dat」に繁体字や日本の漢字の発音データを追加したPinconvのバージョン4.05を公開します。
ダウンロード：
pinconv4.exe （インストーラ形式 – 3.75MB）
pin [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.karak.jp/wp-content/uploads/pinyin-trad.png" rel="lightbox[1393]"><img src="http://www.karak.jp/wp-content/uploads/pinyin-trad-300x151.png" alt="繁体字の変換" title="繁体字の変換" width="300" height="151" class="aligncenter size-medium wp-image-1395" /></a><br />
変換データファイル「ピンイン.dat」に繁体字や日本の漢字の発音データを追加したPinconvのバージョン4.05を公開します。</p>
<ul>ダウンロード：</p>
<li><a href="http://www.karak.jp/tool/pinconv4.exe">pinconv4.exe</a> （インストーラ形式 – 3.75MB）</li>
<li><a href="http://www.karak.jp/tool/pinconv4.zip">pinconv4.zip</a> （zip形式 – 3.41MB）</li>
</ul>
<p>Pinconvの紹介は<a href="http://www.karak.jp/articles/software/pinconv-4-00.html" target="_blank">こちらのエントリ</a>、詳しい使い方については<a href="http://www.karak.jp/articles/software/pinconv%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9.html" target="_blank">Pinconvの使い方</a>を参照下さい。窓の杜による<a href="http://www.forest.impress.co.jp/docs/review/20100119_343320.html" target="_blank">紹介記事はこちら</a>です。</p>
<div class="box">
<img class="mid" src="http://www.karak.jp/img/info.png">バージョン4.05では「ピンイン.dat」に多くのデータが追加されましたが、以前のバージョンのPinconvからバージョンアップする場合、新たに追加された変換データは自動的に更新されません。「変換」メニューの<a href="http://www.karak.jp/?p=481#convert-restore" target="_blank">データファイルの復元</a>を実行し、既存の「ピンイン.dat」を上書きして下さい。なお、これまでご自身が登録したデータは新しいファイルに引き継がれます。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/restore-import.png" rel="lightbox[1393]"><img src="http://www.karak.jp/wp-content/uploads/restore-import-300x273.png" alt="データのインポート" title="データのインポート" width="300" height="273" class="aligncenter size-medium wp-image-1394" /></a></p>
</div>
<h2>変更点</h2>
<ul>
<li>ピンイン変換データに繁体字や日本の漢字のデータを追加追加したほか、複数候補がある漢字のピンインの区切り文字を/から|に変更（データはUnihan.txtを参考にした）</li>
<li>起動時のハイライトの不具合修正</li>
<li>「データファイルの復元」を一部修正</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/articles/software/pinconv405-pinyin.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Pinconv用変換データ &#8211; ピンインと注音符号の変換</title>
		<link>http://www.karak.jp/articles/chinese/pinyin-zhuyin.html</link>
		<comments>http://www.karak.jp/articles/chinese/pinyin-zhuyin.html#comments</comments>
		<pubDate>Tue, 06 Apr 2010 12:17:39 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Chinese]]></category>
		<category><![CDATA[Pinconv]]></category>
		<category><![CDATA[convert]]></category>
		<category><![CDATA[pinyin]]></category>
		<category><![CDATA[zhuyin]]></category>
		<category><![CDATA[ピンイン]]></category>
		<category><![CDATA[拼音]]></category>
		<category><![CDATA[注音符号]]></category>
		<category><![CDATA[转换]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1356</guid>
		<description><![CDATA[
「pin1yin1」のように声調を数字で表現した簡易ピンインと注音符号を相互変換するためのデータファイルを公開します。このデータを利用してPinconvで変換を実行すれば、「pin1yin1」を「ㄆㄧㄣㄧㄣ」にすること [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.karak.jp/wp-content/uploads/zhuyin.png" rel="lightbox[1356]"><img src="http://www.karak.jp/wp-content/uploads/zhuyin-300x165.png" alt="注音符号への変換" title="注音符号への変換" width="300" height="165" class="aligncenter size-medium wp-image-1371" /></a></p>
<p>「pin1yin1」のように声調を数字で表現した簡易ピンインと注音符号を相互変換するためのデータファイルを公開します。このデータを利用してPinconvで変換を実行すれば、「pin1yin1」を「<span lang="zh-tw" class="tw">ㄆㄧㄣㄧㄣ</span>」にすることができます。</p>
<p>ダウンロード：<a href="http://www.karak.jp/tool/zhuyin.zip">変換データファイル（zhuyin.zip）</a><sup>[1]</sup></p>
<p>ダウンロードしたZIPファイル（zhuyin.zip）には、「pin2zhu.dat」と「zhu2pin.dat」の2つのデータファイルが含まれています。「pin2zhu.dat」がピンインから注音への変換用データ、「zhu2pin.dat」が注音からピンインへの変換用データです。Pinconvを起動し、「変換」メニューから「データファイルを追加」を実行して登録を行うと使えるようになります<sup>[2]</sup>。</p>
<p>追記：lv（lü）、lve（lüe）、nv（nü）が正しく変換されない問題を修正しました。ぽんた様、ご指摘ありがとうございました（2010/4/10）。<br />
追記：er化の「r」が正しく変換されない問題を修正しました。ぽんた様、ご指摘ありがとうございました（2010/4/16）。</p>
<div class="box">
<img class="mid" src="http://www.karak.jp/img/info.png"/>注音に関する作者の知識が乏しいため、変換結果が妥当でない可能性があります。間違いを発見された場合は教えていただければ幸いです。
</div>
<ol class="footnotes"><li id="footnote_0_1356" class="footnote">4/7：ファイルが1つしか同梱されていなかったため、圧縮ファイルを差し替えました。</li><li id="footnote_1_1356" class="footnote">上の画像では変換ボタンに表示するテキストをP2Z（pin2zhu－ピンインから注音への変換）とZ2P（zhu2pin－注音からピンインへの変換）に変更しています。</li></ol>]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/articles/chinese/pinyin-zhuyin.html/feed</wfw:commentRss>
		<slash:comments>11</slash:comments>
		</item>
		<item>
		<title>Pinconv4.04 &#8211; 新字体から繁体字への変換</title>
		<link>http://www.karak.jp/articles/software/pinconv404-jpn2trad.html</link>
		<comments>http://www.karak.jp/articles/software/pinconv404-jpn2trad.html#comments</comments>
		<pubDate>Sun, 21 Mar 2010 05:56:31 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Chinese]]></category>
		<category><![CDATA[Langage]]></category>
		<category><![CDATA[Pinconv]]></category>
		<category><![CDATA[Software]]></category>
		<category><![CDATA[中国語]]></category>
		<category><![CDATA[國語]]></category>
		<category><![CDATA[変換]]></category>
		<category><![CDATA[新字体]]></category>
		<category><![CDATA[日文]]></category>
		<category><![CDATA[日本語]]></category>
		<category><![CDATA[日語]]></category>
		<category><![CDATA[漢字]]></category>
		<category><![CDATA[簡體]]></category>
		<category><![CDATA[繁体字]]></category>
		<category><![CDATA[繁體]]></category>
		<category><![CDATA[華語]]></category>
		<category><![CDATA[轉換]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1305</guid>
		<description><![CDATA[Pinconvのバージョンアップを行い、日本の新字体を繁体字に変換するためのデータファイルを追加しました。
ダウンロード：
pinconv4.exe （インストーラ形式 – 3.44MB）
pinconv4.zip （z [...]]]></description>
			<content:encoded><![CDATA[<p>Pinconvのバージョンアップを行い、日本の新字体を繁体字に変換するためのデータファイルを追加しました。</p>
<ul>ダウンロード：</p>
<li><a href="http://www.karak.jp/tool/pinconv4.exe">pinconv4.exe</a> （インストーラ形式 – 3.44MB）</li>
<li><a href="http://www.karak.jp/tool/pinconv4.zip">pinconv4.zip</a> （zip形式 – 3.09MB）</li>
</ul>
<p>Pinconvの紹介は<a href="http://www.karak.jp/articles/software/pinconv-4-00.html" target="_blank">こちらのエントリ</a>、詳しい使い方については<a href="http://www.karak.jp/articles/software/pinconv%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9.html" target="_blank">Pinconvの使い方</a>を参照下さい。窓の杜による<a href="http://www.forest.impress.co.jp/docs/review/20100119_343320.html" target="_blank">紹介記事はこちら</a>です。</p>
<div class="box">
<img class="mid" src="http://www.karak.jp/img/info.png">以前のバージョンのPinconvからバージョンアップする場合、新たに追加された変換データファイル（日繁.dat）は、自動的にインストールされません。「変換」メニューの<a href="http://www.karak.jp/?p=481#convert-restore" target="_blank">データファイルの復元</a>を実行して追加して下さい。</div>
<h2>新字体から繁体字への変換</h2>
<p>日本語の文章を中国語に翻訳する際、意外に面倒なのが地名や人名、組織名などの固有名詞の翻訳です。同じように漢字を使っているとはいえ、簡体字、繁体字、新字体など漢字にも種類がありますので適当にごまかそうとするとまず間違いなくクレームがつきます。たとえば原文に「広島地方検察庁呉支部（広島県呉市）」とあった場合、台湾で使われている繁体字にすると「<span lang="zh-tw" class="tw">廣島地方檢察廳吳支部（廣島縣吳市）</span>」となります。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/28681d5f3f946c02c40c600a23176ec3.png" rel="lightbox[1305]"><img src="http://www.karak.jp/wp-content/uploads/28681d5f3f946c02c40c600a23176ec3-300x61.png" alt="新字体から繁体字" title="新字体から繁体字" width="300" height="61" class="aligncenter size-medium wp-image-1306" /></a></p>
<p>漢字15文字の内、7文字を繁体字に直さなければならず、日本の新字体に対応する繁体字を1字ずつ調べていく地道な作業が必要となります。10文字程度ならなんとかやっつけることはできても、組織名と住所がずらっと並んだエクセルファイルなどが対象だとしたらどうでしょう。うんざりしますね。</p>
<p>さらに1例をあげれば、「戸内」という日本人名を繁体字にすると「<span lang="zh-tw" class="tw">戶內</span>」となります。新字体と繁体字に違いはないように見えるかも知れませんが「戸」と「<span lang="zh-tw" class="tw">戶</span>」、「内」と「<span lang="zh-tw" class="tw">內</span>」にはそれぞれ異なる文字コードが振られています。日本語をそのままコピー＆ペーストして一丁上がりとはいきません。「呑（U+5451）」と「<span lang="zh-tw" class="tw">吞</span>（U+541E）」などこうした字はほかにもいくつかあり、目を皿にして1字1字チェックしていく必要があります。</p>
<p>今回公開したPinconv用の「日繁.dat」は、こうした変換作業の負担を大きく軽減します。日本語のテキストが表示された状態で、このデータファイルを用いて変換を行うと、日本語の漢字が一瞬で繁体字に変換されます。あとは変換結果が妥当かどうか確認するだけ。1字ずつ調べることを考えれば随分楽です。</p>
<h2>国字の扱いや制限事項などについて</h2>
<ol>
<li>「込」や「辻」などのいわゆる国字（和製漢字）は、繁体字に変換することができないため、変換後は「★」が出力されます。国字をそのまま出力したい場合などは、用語集の編集を行って下さい。<sup>[1]</sup></li>
<li>日繁.datは、日本の新字体を台湾で使われている繁体字に変換することを目指しているため、「闘」は「<span lang="zh-tw" class="tw">鬥</span>」に変換され、「竃」は「<span lang="zh-tw" class="tw">灶</span>」に変換されます。いわゆる旧字体への変換とは処理結果が異なります。</li>
<li>「狢」から「貉」への変換など、繁体字に変換する際に異体字や別字に置き換える漢字のうち、作者が注意が必要と判断した漢字は、出力時にアスタリスクが付加されます。作者のデータ管理用に設けたマークですので不要であれば編集して下さい。</li>
<li>変換データの登録を暫時保留している漢字は、「〓」が出力されます。</li>
<li>現行バージョンのPinconvにはU+9FA6以降の漢字データを扱えないという制限があります。そのため、この範囲に含まれる漢字を変換しようとしても「〓」が表示されます。ご了承下さい。</li>
</ol>
<h2>予、台、弁、干などの処理について</h2>
<p>新字体では、繁体字の「瓣、辮、辯」などが「弁」で代替されています。「花瓣」は「花弁」に、「辮髮」は「弁髪」、「辯護」は「弁護」という風に本来は異なる漢字で表現すべきところを「弁」の1字で済ませているため、これを繁体字に変換するには単語ごとに処理を切り替える必要があります。「日繁.dat」には、こうした単語がいくつか登録されていますが（詳細は以下の一覧を参照）、正しく変換されなかったデータを見つけた場合は、お手数ですがご自分で追加してください。<sup>[2]</sup><br />
<span id="more-1305"></span></p>
<p align="center">表1　日繁.datに登録されている単語一覧</p>
<style type="text/css">
table.tableizer-table {border: 1px solid #CCC;}
.tableizer-table td {padding: 4px; margin: 3px; border: 1px solid #ccc;}
.tableizer-table th {background-color: #104E8B; color: #FFF; font-weight: bold;}
</style>
<table class="tableizer-table" width="100%">
<tr class="tableizer-firstrow">
<th width="50%">日本語</th>
<th width="50%">繁体字</th>
</tr>
<tr>
<td>台風</td>
<td lang="zh-tw" class="tw">颱風</td>
</tr>
<tr>
<td>台頭</td>
<td lang="zh-tw" class="tw">抬頭</td>
</tr>
<tr>
<td>安全弁</td>
<td lang="zh-tw" class="tw">安全瓣</td>
</tr>
<tr>
<td>花弁</td>
<td lang="zh-tw" class="tw">花瓣</td>
</tr>
<tr>
<td>支弁</td>
<td lang="zh-tw" class="tw">支辨</td>
</tr>
<tr>
<td>能弁</td>
<td lang="zh-tw" class="tw">能辯</td>
</tr>
<tr>
<td>雄弁</td>
<td lang="zh-tw" class="tw">雄辯</td>
</tr>
<tr>
<td>思弁</td>
<td lang="zh-tw" class="tw">思辨</td>
</tr>
<tr>
<td>勘弁</td>
<td lang="zh-tw" class="tw">勘辨</td>
</tr>
<tr>
<td>自弁</td>
<td lang="zh-tw" class="tw">自辨</td>
</tr>
<tr>
<td>抗弁</td>
<td lang="zh-tw" class="tw">抗辯</td>
</tr>
<tr>
<td>陳弁</td>
<td lang="zh-tw" class="tw">陳辯</td>
</tr>
<tr>
<td>答弁</td>
<td lang="zh-tw" class="tw">答辯</td>
</tr>
<tr>
<td>詭弁</td>
<td lang="zh-tw" class="tw">詭辯</td>
</tr>
<tr>
<td>口弁</td>
<td lang="zh-tw" class="tw">口辯</td>
</tr>
<tr>
<td>多弁</td>
<td lang="zh-tw" class="tw">多辯</td>
</tr>
<tr>
<td>駄弁</td>
<td lang="zh-tw" class="tw">馱辯</td>
</tr>
<tr>
<td>訥弁</td>
<td lang="zh-tw" class="tw">訥辯</td>
</tr>
<tr>
<td>熱弁</td>
<td lang="zh-tw" class="tw">熱辯</td>
</tr>
<tr>
<td>単弁</td>
<td lang="zh-tw" class="tw">單瓣</td>
</tr>
<tr>
<td>僧帽弁</td>
<td lang="zh-tw" class="tw">僧帽瓣</td>
</tr>
<tr>
<td>合弁</td>
<td lang="zh-tw" class="tw">合辦</td>
</tr>
<tr>
<td>買弁</td>
<td lang="zh-tw" class="tw">買辦</td>
</tr>
<tr>
<td>東北弁</td>
<td lang="zh-tw" class="tw">東北辯</td>
</tr>
<tr>
<td>関西弁</td>
<td lang="zh-tw" class="tw">關西辯</td>
</tr>
<tr>
<td>弁官</td>
<td lang="zh-tw" class="tw">辨官</td>
</tr>
<tr>
<td>弁慶</td>
<td lang="zh-tw" class="tw">辨慶</td>
</tr>
<tr>
<td>弁済</td>
<td lang="zh-tw" class="tw">辨濟</td>
</tr>
<tr>
<td>弁財天</td>
<td lang="zh-tw" class="tw">辨財天</td>
</tr>
<tr>
<td>弁事</td>
<td lang="zh-tw" class="tw">辨事</td>
</tr>
<tr>
<td>弁識</td>
<td lang="zh-tw" class="tw">辨識</td>
</tr>
<tr>
<td>弁償</td>
<td lang="zh-tw" class="tw">辨償</td>
</tr>
<tr>
<td>弁証</td>
<td lang="zh-tw" class="tw">辨証</td>
</tr>
<tr>
<td>弁知</td>
<td lang="zh-tw" class="tw">辨智</td>
</tr>
<tr>
<td>弁天</td>
<td lang="zh-tw" class="tw">辨天</td>
</tr>
<tr>
<td>弁別</td>
<td lang="zh-tw" class="tw">辨別</td>
</tr>
<tr>
<td>弁明</td>
<td lang="zh-tw" class="tw">辨明</td>
</tr>
<tr>
<td>弁円</td>
<td lang="zh-tw" class="tw">辨圓</td>
</tr>
<tr>
<td>弁当</td>
<td lang="zh-tw" class="tw">辨當</td>
</tr>
<tr>
<td>弁内侍</td>
<td lang="zh-tw" class="tw">辨內侍</td>
</tr>
<tr>
<td>弁座</td>
<td lang="zh-tw" class="tw">瓣座</td>
</tr>
<tr>
<td>弁膜</td>
<td lang="zh-tw" class="tw">瓣膜</td>
</tr>
<tr>
<td>弁鰓</td>
<td lang="zh-tw" class="tw">瓣鰓</td>
</tr>
<tr>
<td>弁髪</td>
<td lang="zh-tw" class="tw">辮髮</td>
</tr>
<tr>
<td>弁解</td>
<td lang="zh-tw" class="tw">辯解</td>
</tr>
<tr>
<td>弁護</td>
<td lang="zh-tw" class="tw">辯護</td>
</tr>
<tr>
<td>弁口</td>
<td lang="zh-tw" class="tw">辯口</td>
</tr>
<tr>
<td>弁巧</td>
<td lang="zh-tw" class="tw">辯巧</td>
</tr>
<tr>
<td>弁才</td>
<td lang="zh-tw" class="tw">辯才</td>
</tr>
<tr>
<td>弁士</td>
<td lang="zh-tw" class="tw">辯士</td>
</tr>
<tr>
<td>弁者</td>
<td lang="zh-tw" class="tw">辯者</td>
</tr>
<tr>
<td>弁舌</td>
<td lang="zh-tw" class="tw">辯舌</td>
</tr>
<tr>
<td>弁疏</td>
<td lang="zh-tw" class="tw">辯疏</td>
</tr>
<tr>
<td>弁難</td>
<td lang="zh-tw" class="tw">辯難</td>
</tr>
<tr>
<td>弁論</td>
<td lang="zh-tw" class="tw">辯論</td>
</tr>
<tr>
<td>弁説</td>
<td lang="zh-tw" class="tw">辯說</td>
</tr>
<tr>
<td>弁公室</td>
<td lang="zh-tw" class="tw">辦公室</td>
</tr>
<tr>
<td>予備</td>
<td lang="zh-tw" class="tw">預備</td>
</tr>
<tr>
<td>予報</td>
<td lang="zh-tw" class="tw">預報</td>
</tr>
<tr>
<td>予防</td>
<td lang="zh-tw" class="tw">預防</td>
</tr>
<tr>
<td>予定</td>
<td lang="zh-tw" class="tw">預定</td>
</tr>
<tr>
<td>予断</td>
<td lang="zh-tw" class="tw">預斷</td>
</tr>
<tr>
<td>予告</td>
<td lang="zh-tw" class="tw">預告</td>
</tr>
<tr>
<td>予感</td>
<td lang="zh-tw" class="tw">預感</td>
</tr>
<tr>
<td>予後</td>
<td lang="zh-tw" class="tw">預後</td>
</tr>
<tr>
<td>予見</td>
<td lang="zh-tw" class="tw">預見</td>
</tr>
<tr>
<td>予期</td>
<td lang="zh-tw" class="tw">預期</td>
</tr>
<tr>
<td>予習</td>
<td lang="zh-tw" class="tw">預習</td>
</tr>
<tr>
<td>予想</td>
<td lang="zh-tw" class="tw">預想</td>
</tr>
<tr>
<td>予選</td>
<td lang="zh-tw" class="tw">預選</td>
</tr>
<tr>
<td>予知</td>
<td lang="zh-tw" class="tw">預知</td>
</tr>
<tr>
<td>予兆</td>
<td lang="zh-tw" class="tw">預兆</td>
</tr>
<tr>
<td>予測</td>
<td lang="zh-tw" class="tw">預測</td>
</tr>
<tr>
<td>予算</td>
<td lang="zh-tw" class="tw">預算</td>
</tr>
<tr>
<td>予言</td>
<td lang="zh-tw" class="tw">預言</td>
</tr>
<tr>
<td>予約</td>
<td lang="zh-tw" class="tw">預約</td>
</tr>
<tr>
<td>猶予</td>
<td lang="zh-tw" class="tw">猶豫</td>
</tr>
<tr>
<td>干物</td>
<td lang="zh-tw" class="tw">乾物</td>
</tr>
<tr>
<td>干害</td>
<td lang="zh-tw" class="tw">旱害</td>
</tr>
<tr>
<td>干魚</td>
<td lang="zh-tw" class="tw">乾魚</td>
</tr>
<tr>
<td>干姜</td>
<td lang="zh-tw" class="tw">乾薑</td>
</tr>
<tr>
<td>干繭</td>
<td lang="zh-tw" class="tw">乾繭</td>
</tr>
<tr>
<td>干天</td>
<td lang="zh-tw" class="tw">旱天</td>
</tr>
<tr>
<td>干瓢</td>
<td lang="zh-tw" class="tw">乾瓢</td>
</tr>
<tr>
<td>防御</td>
<td lang="zh-tw" class="tw">防禦</td>
</tr>
</table>
<ol class="footnotes"><li id="footnote_0_1305" class="footnote">「込」に対応するデータとして「込」を登録すれば、そのまま出力されます。</li><li id="footnote_1_1305" class="footnote">ついでに私にも教えていただければ幸いです<(_ _)></li></ol>]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/articles/software/pinconv404-jpn2trad.html/feed</wfw:commentRss>
		<slash:comments>10</slash:comments>
		</item>
	</channel>
</rss>
