<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>karak &#187; Chinese</title>
	<atom:link href="http://www.karak.jp/articles/tag/chinese/feed" rel="self" type="application/rss+xml" />
	<link>http://www.karak.jp</link>
	<description>Language and Translation</description>
	<lastBuildDate>Sun, 11 Dec 2011 06:30:29 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.4</generator>
		<item>
		<title>文字認識APIにデータ提供</title>
		<link>http://www.karak.jp/chinese/recognize-api.html</link>
		<comments>http://www.karak.jp/chinese/recognize-api.html#comments</comments>
		<pubDate>Wed, 07 Dec 2011 03:36:05 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Chinese]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=2312</guid>
		<description><![CDATA[ドコモの文字認識APIに中国語データを提供しました。詳細は公式サイトに譲りますが、文字認識APIは、画像に含まれる文字を認識して単語を抽出するサービスです。今回は当方が構築しているデータベースから簡体字データと繁体字デー [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.karak.jp/wp-content/uploads/recognize.gif"><img src="http://www.karak.jp/wp-content/uploads/recognize-150x150.gif" alt="" title="recognize" width="150" height="150" class="alignright size-thumbnail wp-image-2313" /></a>ドコモの<a href="http://recognize.jp/index.html" title="文字認識API | NTTドコモ" target="_blank">文字認識API</a>に中国語データを提供しました。詳細は公式サイトに譲りますが、文字認識APIは、画像に含まれる文字を認識して単語を抽出するサービスです。今回は当方が構築しているデータベースから簡体字データと繁体字データを提供しました。文字認識APIが中国語に対応すれば、「旅先にて携帯で写真撮影」→「画像に含まれる文字認識」→「認識した文字を<a href="http://www.ctrans.org/index.php" title="中日辞書 北辞郎" target="_blank">北辞郎</a>で検索」というようなことが可能になります。実に楽しそうですね。将来的にいろんなアプリやサービスがリリースされて、そこでごく一部とはいえ自分のデータが訳に立っているとすれば、それはとてもうれしいことです。声をかけてくださった関係者の皆様、ありがとうございました。</p>
<p>念のためにお断りしておくと、今回のデータは<a href="http://www.ctrans.org/index.php" title="中日辞書 北辞郎" target="_blank">北辞郎</a>とは無関係です。生来の収集癖もあり、当方の手元には各種中国語データがたまっていて、形態素解析用の見出し語データや常用語のデータ、ピンインデータ、簡体字と繁体字の変換用テーブルなどがあります。これまでは自分でツールを作成する時に使うだけでしたが、今後は外部に提供することも検討していきますので、興味のある方はご一報ください。</p>
<p>関連：<a href="http://recognize.jp/term.html" title="文字認識API | NTTドコモ" target="_blank">文字認識API | NTTドコモ</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/chinese/recognize-api.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>異体字同一視検索</title>
		<link>http://www.karak.jp/chinese/variants.html</link>
		<comments>http://www.karak.jp/chinese/variants.html#comments</comments>
		<pubDate>Thu, 11 Nov 2010 06:08:45 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Chinese]]></category>
		<category><![CDATA[Tips]]></category>
		<category><![CDATA[php]]></category>
		<category><![CDATA[sqlite]]></category>
		<category><![CDATA[中国語]]></category>
		<category><![CDATA[正規表現]]></category>
		<category><![CDATA[漢字]]></category>
		<category><![CDATA[異体字]]></category>
		<category><![CDATA[簡体字]]></category>
		<category><![CDATA[繁体字]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=2054</guid>
		<description><![CDATA[オンライン辞書の北辞郎には、利用者が検索した際、データベースにその語句が含まれていないと候補の単語を提示する機能を設けてある。 今回システムの更新を行い、異体字を同一視して候補を表示する機能を追加した。備忘録をかねて内部 [...]]]></description>
			<content:encoded><![CDATA[<p>オンライン辞書の<a href="http://www.ctrans.org/cjdic/index.php">北辞郎</a>には、利用者が検索した際、データベースにその語句が含まれていないと候補の単語を提示する機能を設けてある。<br />
今回システムの更新を行い、異体字を同一視して候補を表示する機能を追加した。備忘録をかねて内部でどういう処理を行っているかまとめておく。</p>
<p>まず、異体字を同一視して検索する、という処理がどういうものか定義しておくと、「発展」と入力すると「発」の異体字である「發」や「发」を展開し、「發展」、「发展」に対する検索も同時に行うことを指す。正規表現で表すと「(発|發|发)展」を検索することになる。これを実現するには「発展」を与えると「(発|發|发)展」を返す関数がまず必要である。さまざまな方法があるが、今回はシンプルに単漢字をキーとし、対応する異体字のリストを値とする連想配列を用意した。以下にその一部を示す。なお、北辞郎はPHPで構築しているので以下のコードはすべてPHPである。</p>

<div class="wp_syntax"><div class="code"><pre class="php" style="font-family:monospace;"><span style="color: #000088;">$variants</span> <span style="color: #339933;">=</span> <span style="color: #990000;">array</span><span style="color: #009900;">&#40;</span>
    <span style="color: #0000ff;">&quot;皑&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;皑|皚&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;皚&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;皚|凒|皑&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;蔼&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;蔼|藹&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;藹&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;藹|譪|蔼&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;霭&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;霭|謁|靄&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;靄&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;靄|謁|霭&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;爱&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;爱|愛&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;愛&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;愛|㤅|爱&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;暧&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;暧|曖&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;曖&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;曖|暧&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;谙&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;谙|諳&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;諳&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;諳|谙&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;鏖&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;鏖|鏕|鏖&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;鳌&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;鳌|鼇|鰲&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;鰲&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;鰲|鼇|鳌&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;媪&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;媪|媼&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;媼&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;媼|媪&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;拔&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;拔|抜&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;抜&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;抜|杮|叐|㧞|拔&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;罢&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;罢|罷&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;罷&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;罷|羆|罴|罢&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;摆&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;摆|襬|擺&quot;</span><span style="color: #339933;">,</span><span style="color: #666666; font-style: italic;">#以下延々と1万文字以上続く
</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">;</span></pre></div></div>

<p>異体字のデータには、自前の簡体字と日本の漢字の対照データと<a href="http://kanji-database.sourceforge.net/variants/variants.html">漢字データベースの異体字データベース</a>を利用した。異体字データベースは、異体字の情報が網羅された素晴らしいデータベースである。作成に携わった全作業者にこの場を借りてお礼申し上げる。</p>
<p>この配列ができてしまえば、処理は半分終わったようなものである。あとは文字列が与えられるとそれを文字単位に分解し、各文字に対応する異体字を検索して正規表現を返す関数を作れば良い。</p>

<div class="wp_syntax"><table><tr><td class="line_numbers"><pre>1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
</pre></td><td class="code"><pre class="php" style="font-family:monospace;"><span style="color: #000000; font-weight: bold;">function</span> get_variants<span style="color: #009900;">&#40;</span><span style="color: #000088;">$str</span><span style="color: #009900;">&#41;</span> <span style="color: #009900;">&#123;</span>
    <span style="color: #666666; font-style: italic;">#まず先ほどの配列が保存してあるファイルをインクルードする
</span>    <span style="color: #666666; font-style: italic;">#配列の変数名は$variantsである
</span>    <span style="color: #b1b100;">include</span> <span style="color: #0000ff;">'variants.php'</span><span style="color: #339933;">;</span>
    <span style="color: #000088;">$result</span> <span style="color: #339933;">=</span> <span style="color: #0000ff;">&quot;&quot;</span><span style="color: #339933;">;</span>
    <span style="color: #b1b100;">for</span> <span style="color: #009900;">&#40;</span><span style="color: #000088;">$i</span> <span style="color: #339933;">=</span> <span style="color: #cc66cc;">0</span><span style="color: #339933;">;</span> <span style="color: #000088;">$i</span> <span style="color: #339933;">&lt;</span> <span style="color: #990000;">mb_strlen</span><span style="color: #009900;">&#40;</span><span style="color: #000088;">$str</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">;</span> <span style="color: #000088;">$i</span><span style="color: #339933;">++</span><span style="color: #009900;">&#41;</span> <span style="color: #009900;">&#123;</span>
        <span style="color: #666666; font-style: italic;">#文字単位にばらす
</span>        <span style="color: #000088;">$char</span> <span style="color: #339933;">=</span> <span style="color: #990000;">mb_substr</span><span style="color: #009900;">&#40;</span><span style="color: #000088;">$str</span><span style="color: #339933;">,</span> <span style="color: #000088;">$i</span><span style="color: #339933;">,</span> <span style="color: #cc66cc;">1</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">;</span>
        <span style="color: #b1b100;">if</span> <span style="color: #009900;">&#40;</span><span style="color: #990000;">array_key_exists</span><span style="color: #009900;">&#40;</span><span style="color: #000088;">$char</span><span style="color: #339933;">,</span> <span style="color: #000088;">$variants</span><span style="color: #009900;">&#41;</span><span style="color: #009900;">&#41;</span> <span style="color: #009900;">&#123;</span>
            <span style="color: #000088;">$result</span> <span style="color: #339933;">.=</span> <span style="color: #0000ff;">&quot;(&quot;</span> <span style="color: #339933;">.</span> <span style="color: #000088;">$variants</span><span style="color: #009900;">&#91;</span><span style="color: #000088;">$char</span><span style="color: #009900;">&#93;</span> <span style="color: #339933;">.</span> <span style="color: #0000ff;">&quot;)&quot;</span><span style="color: #339933;">;</span>
        <span style="color: #009900;">&#125;</span> <span style="color: #b1b100;">else</span> <span style="color: #009900;">&#123;</span>
            <span style="color: #000088;">$result</span> <span style="color: #339933;">.=</span> <span style="color: #000088;">$char</span><span style="color: #339933;">;</span>
        <span style="color: #009900;">&#125;</span>
    <span style="color: #009900;">&#125;</span>
    <span style="color: #b1b100;">return</span> <span style="color: #000088;">$result</span><span style="color: #339933;">;</span>
<span style="color: #009900;">&#125;</span></pre></td></tr></table></div>

<p>このget_variantsにたとえば「広東」を与えると「(広|廣|广)(東|东)」が返ってくる。この正規表現を使ってデータベースの検索を行えば、「広東」と「<span lang="zh-cn" class="cn">广东</span>」と「<span lang="zh-tw" class="tw">廣東</span>」の検索をまとめて行うことができる。北辞郎で採用しているデータベースSQLiteで正規表現を使用する方法については、こちらの<a href="http://www.karak.jp/articles/blog/sqlite-regexp.html">SQLiteで正規表現</a>にまとめたので参照されたい。実用上問題のない処理速度をマークしており、手間の割に満足のいく結果が得られた。</p>
<p>今回作成した variants.php は、以下からダウンロード可能である。興味のある向きは参照されたい。なお、このデータのライセンスは、異体字データベースと同じ<a href="http://sourceforge.jp/projects/opensource/wiki/licenses%2FMIT_license">MITライセンス</a>とする。</p>
<p>ダウンロード：<a href="http://www.karak.jp/tool/variants.zip">variants.zip</a>（文字コードはUTF-8）</p>
</pre>
]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/chinese/variants.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Pinconv 4.08 &#8211; テンプレート置換と連続置換</title>
		<link>http://www.karak.jp/chinese/pinconv408.html</link>
		<comments>http://www.karak.jp/chinese/pinconv408.html#comments</comments>
		<pubDate>Sat, 22 May 2010 01:24:56 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Chinese]]></category>
		<category><![CDATA[Pinconv]]></category>
		<category><![CDATA[Software]]></category>
		<category><![CDATA[Tcl]]></category>
		<category><![CDATA[Translate]]></category>
		<category><![CDATA[ピンイン]]></category>
		<category><![CDATA[中国語]]></category>
		<category><![CDATA[変換]]></category>
		<category><![CDATA[簡体字]]></category>
		<category><![CDATA[繁体字]]></category>
		<category><![CDATA[置換]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1558</guid>
		<description><![CDATA[テンプレート置換、連続置換、Ghost用ダイアログなどの機能を追加し、置換関連機能を大幅に拡充したPinconvのバージョン4.08を公開します。 ダウンロード： pinconv4.exe （インストーラ形式 – 3.7 [...]]]></description>
			<content:encoded><![CDATA[<p>テンプレート置換、連続置換、Ghost用ダイアログなどの機能を追加し、置換関連機能を大幅に拡充したPinconvのバージョン4.08を公開します。</p>
<ul>ダウンロード：</p>
<li><a href="http://www.karak.jp/tool/pinconv4.exe">pinconv4.exe</a> （インストーラ形式 – 3.76MB）</li>
<li><a href="http://www.karak.jp/tool/pinconv4.zip">pinconv4.zip</a> （zip形式 – 3.41MB）</li>
</ul>
<p>Pinconvの紹介は<a href="http://www.karak.jp/articles/software/pinconv-4-00.html" target="_blank">こちらのエントリ</a>、詳しい使い方については<a href="http://www.karak.jp/articles/software/pinconv%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9.html" target="_blank">Pinconvの使い方</a>を参照下さい。窓の杜による<a href="http://www.forest.impress.co.jp/docs/review/20100119_343320.html" target="_blank">紹介記事はこちら</a>です。</p>
<p>以下、新たに追加した3機能の概要を紹介します。それぞれ詳しい使い方については、ヘルプの<a href="http://www.karak.jp/?p=481#template">テンプレート置換</a>、<a href="http://www.karak.jp/?p=481#seq">連続置換</a>、<a href="http://www.karak.jp/?p=481#gdlg">Ghost用ダイアログ</a>をご参照下さい。</p>
<p><span id="more-1558"></span></p>
<h2>テンプレート置換</h2>
<p>置換前と置換後のパターンをファイルに登録しておき、そのファイルを読み込んでまとめて置換を行う機能です。読み込むファイルは、文字コードがUTF-8のテキストファイルで、置換前と置換後のパターンをタブで区切って1行にまとめてあるものとします。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/template-button.png"><img src="http://www.karak.jp/wp-content/uploads/template-button-300x176.png" alt="コマンドバー" title="コマンドバー" width="300" height="176" class="aligncenter size-medium wp-image-1607" /></a></p>
<p>Pinconvをインストールしたフォルダ（またはデータ保存フォルダ）にあるtemplateフォルダに見本用テンプレートファイル「smple.dat」がありますので、実際のファイルの内容はそちらをご参照下さい。</p>
<p>通常の置換と同様、たとえば「りんご」を「apple」にしたい場合は、「リンゴ&lt;tab&gt;apple&lt;改行&gt;」をファイルに登録しますが、「リンゴ」と「りんご」と「<span lang="zh-cn" class="cn">苹果</span>」を「apple」にしたい場合、正規表現を使用して「リンゴ|りんご|苹果&lt;tab&gt;apple&lt;改行&gt;」という風に登録することができます。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/template1.png"><img src="http://www.karak.jp/wp-content/uploads/template1-300x143.png" alt="template1" title="template1" width="300" height="143" class="aligncenter size-medium wp-image-1602" /></a></p>
<p>後方参照を利用することもできますので、「<span lang="zh-cn" class="cn">根据(\w+)进行检查</span> 」と「\1に基づいて検査を行う」の組み合わせを登録しておき、「<span lang="zh-cn" class="cn">根据公司规定进行检查</span>」という文字列に対してテンプレート置換を実行すると「<span lang="zh-cn" class="cn">公司规定</span>に基づいて検査を行う」に置換されます。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/template-sidebar.png"><img src="http://www.karak.jp/wp-content/uploads/template-sidebar-300x211.png" alt="sidebar" title="sidebar" width="300" height="211" class="aligncenter size-medium wp-image-1609" /></a></p>
<p>なお、置換サイドバーで「テンプレートファイルに登録する」オプションを有効にしておくと、置換を実行するたびに置換前と置換後の組み合わせがファイルに保存されます。</p>
<div class="box">
Pinconvの通常の「変換」と「テンプレート置換」の最大の違いは、正規表現が使えるか使えないかにあります。「テンプレート置換」は、テキストファイルを読み込んで処理を行うため、内部処理を最適化してある「変換」に比べて速度的に劣りますが、柔軟かつ強力な正規表現の機能をフル活用することができます。
</div>
<h2>連続置換</h2>
<p>対象文字列に複数の変換処理を一度に適用する機能です。Pinconvの変換データファイルやテンプレート置換ファイルへのパスが登録されたテキストファイルを読み込み、その変換用ファイルを順に使用して処理を行います。ファイルの文字コードはUTF-8とし、1行1パスの形式で登録します。</p>
<p>たとえばPinconvでは、変換データファイルの「ピンイン」を適用した後、「声調」を適用すると漢字を声調記号付きのピンインに変換することができますが、連続置換を利用すると、この処理を1つにまとめることができます。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/seq-gen1.png"><img src="http://www.karak.jp/wp-content/uploads/seq-gen1-300x161.png" alt="2つの変換をまとめる" title="2つの変換をまとめる" width="300" height="161" class="aligncenter size-medium wp-image-1614" /></a></p>
<p>インストールフォルダ（またはデータ保存フォルダ）の「seq」フォルダにサンプルファイル「sample.dat」がありますので、このファイルをPinconvで開いてみて下さい。変換データファイルのパスが2つ登録されていると思います。連続置換では、ファイルに登録されたパスに従い、データファイルを順番に読み込んで変換を行います。連続置換用のファイルとして「sample.dat」を選択し、処理を実行すれば「<span lang="zh-cn" class="cn">拼音</span>」という単語が1クリックで「<span class="pyn">pīnyīn</span>」に変換されます。</p>
<p>変換データファイルだけでなくテンプレート置換ファイルを登録することも可能です。この組み合わせを利用すると簡易翻訳処理を実現することができます。次の処理をまとめることを考えてみましょう。</p>
<ol>
<li>処理対象の文字列は「<span lang="zh-cn" class="cn">根据相关规定进行检查</span>」とします。</li>
<li>テンプレート置換ファイル「test.dat」には「根据(\w+)进行检查 」と「\1に基づいて検査を行う」の組み合わせが登録されているものとします。</li>
<li>このテンプレートを処理対象の文字列に適用すると「<span lang="zh-cn" class="cn"><u>相关规定</u></span>に基づいて検査を行う」という結果が得られます。</li>
<li>この結果に対し、さらに変換データファイル「中日.dat」を適用すると、「相関規定に基づいて検査を行う」となります。</li>
</ol>
<p><a href="http://www.karak.jp/wp-content/uploads/seq-replace.png"><img src="http://www.karak.jp/wp-content/uploads/seq-replace-300x163.png" alt="replace" title="replace" width="300" height="163" class="aligncenter size-medium wp-image-1617" /></a></p>
<p>中国語を知らない人でもこの結果ならなんとなく意味がつかめるでしょう。ちょっとした翻訳みたいで面白いですね。では、次回から何度もクリックをしないで済むように、テンプレート置換ファイル「test.dat」へのパスと変換データファイル「中日.dat」へのパスを連続置換ファイルに記録します。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/Clipboard021.png"><img src="http://www.karak.jp/wp-content/uploads/Clipboard021-300x184.png" alt="連続置換ファイルの作成" title="連続置換ファイルの作成" width="300" height="184" class="aligncenter size-medium wp-image-1664" /></a></p>
<p>「変換」メニューの「連続置換ファイルを作成」を実行すると、ファイル選択用のダイアログが表示されます。「追加」を押して選択したファイルのパスはテキストボックスに入力されます。必要なファイルを選び終わったら「OK」を押し、連続置換ファイルに名前を付けて保存します。連続置換ファイルにはいくつでもファイルを登録できます。登録する数に制限はありません。ファイルに登録してあるパスは、先頭から順に読み込まれるので、適用したい順に並べてください。</p>
<div class="box">
Ghost用のダイアログを利用し、「連続置換用のファイルを作成」オプションを有効にすると処理時に使用したファイルの組み合わせを連続置換用に保存することができます。
</div>
<h2>Ghost用ダイアログ</h2>
<p>Ghostを実行する際に変換データファイルだけでなく、テンプレート置換ファイルや連続置換ファイルを適用したい場合に使用するダイアログです。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/ghost-dialog.png"><img src="http://www.karak.jp/wp-content/uploads/ghost-dialog-255x300.png" alt="ghost-dialog" title="ghost-dialog" width="255" height="300" class="aligncenter size-medium wp-image-1619" /></a></p>
<p>画面上部でファイルを選択し、オプション部分で使用するファイルを指定した上で、「OK」を押して処理を実行します。</p>
<p>ダイアログ下部の「連続置換用のファイルを作成」オプションを有効にすると処理時に使用したファイルの組み合わせを連続置換用に保存することができます。</p>
<div class="box">
「連続置換」→「テンプレート置換」→「変換」の順にファイルが適用されます。ダイアログではこの順番を変更できませんので、順番を変更したい場合は、連続置換ファイルに好みの順番でパスを登録し、そのファイルを使ってGhostを行うと良いでしょう。
</div>
<h2>今回の修正点</h2>
<ul>
<li>Wordファイルからテキストを抜き出す機能とテキストを書き戻す機能の不具合を修正</li>
<li>「Ghostの再実行」の不具合を修正</li>
<li>登録ユーザ専用機能「データファイルの保存先を変更」の挙動をよりシンプルなかたちに変更</li>
<li>Wordから抜き出したファイルを正しく扱えるようにVacuumの挙動を修正</li>
<li>変換コマンドバーからボタンを削除する際の不具合を修正</li>
<li>繁体字と日本語の変換データを修正（<span lang="zh-tw" class="tw">值</span>→値、<span lang="zh-tw" class="tw">閒</span>→閑）
</li>
<li>データインポートの処理の不具合を修正</li>
</ul>
<div class="box">
※予告：バージョンアップの処理に不具合があるため、近日中に修正を行います。
</div>
]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/chinese/pinconv408.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>講談社中日辞典第三版レビュー</title>
		<link>http://www.karak.jp/book/cjdict.html</link>
		<comments>http://www.karak.jp/book/cjdict.html#comments</comments>
		<pubDate>Fri, 09 Apr 2010 12:54:39 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Book]]></category>
		<category><![CDATA[Chinese]]></category>
		<category><![CDATA[中国語]]></category>
		<category><![CDATA[中日]]></category>
		<category><![CDATA[第三版]]></category>
		<category><![CDATA[講談社]]></category>
		<category><![CDATA[辞典]]></category>
		<category><![CDATA[辞書]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1424</guid>
		<description><![CDATA[講談社中日辞典第三版を入手した。発売とほぼ同時に本屋に走ったわけで、何もそんなに急がなくても良さそうなものだが、この辞典はネットに接続して「現代中国語新語辞典」を1冊丸ごとダウンロードできる上、更新機能で新語・流行語など [...]]]></description>
			<content:encoded><![CDATA[<div id="attachment_1425" class="wp-caption alignleft" style="width: 170px"><a href="http://www.amazon.co.jp/exec/obidos/ASIN/4062653435/transchinese-22"><img src="http://www.karak.jp/wp-content/uploads/81720ce56fad9fb5ca328b248575fcf2.gif" alt="講談社中日辞典第三版" title="講談社中日辞典第三版" width="160" height="213" class="size-full wp-image-1425" /></a><p class="wp-caption-text">講談社中日辞典第三版</p></div>
<p>講談社中日辞典第三版を入手した。発売とほぼ同時に本屋に走ったわけで、何もそんなに急がなくても良さそうなものだが、この辞典はネットに接続して「<a href="http://www.amazon.co.jp/exec/obidos/ASIN/4062653419/transchinese-22/">現代中国語新語辞典</a>」を1冊丸ごとダウンロードできる上、更新機能で新語・流行語など最新データを入手できるという斬新な中日辞典なのである。ついに中日辞典もここまで来たかと私が興奮しても仕方ない。</p>
<p>辞書の内容は、本屋で立ち読みすれば確認できると思うので（2色刷りで実に見やすい）、以下パソコン上で利用する辞典のフロントエンドツールを中心に第一印象などを書いておく。<br clear="all"></p>
<p>下図がインストールされる辞書引きツールである。新語辞典もほぼ同じUIで、どちらも内容を全文検索（！）することができる。アプリケーションのヘルプファイルを思わせるそっけない見た目だが、動作は軽快で検索も速い。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/add37d7d9e4fd1ff8532cea2e28d4048.png"><img src="http://www.karak.jp/wp-content/uploads/add37d7d9e4fd1ff8532cea2e28d4048-300x225.png" alt="中日辞典" title="中日辞典" width="300" height="225" class="aligncenter size-medium wp-image-1433" /></a></p>
<p>日本語と中国語、ピンインのフォント表示はきれいで見やすく、ご覧の通り挿絵や画像も表示される。検索は見出し語の前方一致、後方一致、完全一致のほか、上述したように辞典の内容を全文検索することができる。中国語とピンインだけでなく日本語でも検索することができ、検索した語句はハイライト表示される。日中辞典のように使えるし、全例文を対象に検索ができるのは実に頼もしい。<br />
<span id="more-1424"></span><br />
<a href="http://www.karak.jp/wp-content/uploads/1e5142e81a34260029e8dc84c21d00d3.png"><img src="http://www.karak.jp/wp-content/uploads/1e5142e81a34260029e8dc84c21d00d3-300x225.png" alt="fulltext" title="fulltext" width="300" height="225" class="aligncenter size-medium wp-image-1436" /></a></p>
<p>右クリックから選択テキストを検索することができ、クリックして同義語にジャンプできるリンク機能もある。このあたりは電子化された辞書の強みだろう。また、紙の辞典で巻末にまとめられている固有名詞はメニュータブから確認することができる。この固有名詞の部分は、見出し語には登録されていないが全文検索を行うとヒットする。ブランド名などをさっと引けるのはなかなか便利だ。</p>
<p>初回起動時に辞典ウィンドウの「更新」ボタンを押して入手する新語辞典も画面のつくりは同じである。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/5b3bec21dadf2dcbc0709b927c63e9a5.png"><img src="http://www.karak.jp/wp-content/uploads/5b3bec21dadf2dcbc0709b927c63e9a5-300x225.png" alt="新語辞典" title="新語辞典" width="300" height="225" class="aligncenter size-medium wp-image-1440" /></a></p>
<p>少し検索してみたが「<span lang="zh-cn" class="cn"><a href="http://www.ctrans.org/cjdic/search.php?word=%E8%9A%81%E6%97%8F" target="_blank">蚁族</a></span>」や「<span lang="zh-cn" class="cn"><a href="http://www.ctrans.org/cjdic/search.php?word=%E8%9C%97%E5%B1%85" target="_blank">蜗居</a></span>」は登録されていなかったし、「<span lang="zh-cn" class="cn"><a href="http://www.ctrans.org/cjdic/search.php?word=%E8%8D%89%E6%B3%A5%E9%A9%AC" target="_blank">草泥马</a></span>」も「<span lang="zh-cn" class="cn"><a href="http://www.ctrans.org/cjdic/search.php?word=%E5%9B%A7" target="_blank">囧</a></span>」も未登録だった。下品な言葉があまり登録されていないようで<s>つまらなかった</s>残念だったが、これこそ今後の更新で追加されることを期待したい。アップデートが楽しみだ。</p>
<p>難点をあげるとすれば「辞典ウインドウ」を経由しないと中日辞典.exeと新語辞典.exeを起動できないところが不便だ。ランチャなどに登録して素早く起動できるようにしたいが、キーボードから手を離してマウスでポツポツしないといけないのが煩わしい。できればこれもアップデートしていただきたい。</p>
<p align="center">  *   *   *  </p>
<p>まだ購入して半日ほどだが、この辞典には満足している。これまでの辞典と違い、全文検索で収録されているコンテンツを隅々まで利用できるだけでも7980円の価値はある。日々生まれる新語が更新で追加される機能も売りっぱなしでない作り手の姿勢が現れているようで（実際どのような更新が行われるかは未知数だが）好感が持てる。ぜひ他社も続いて欲しい。</p>
<p>極私的評価：<span style="color:#FFCC66">★★★★★</span></p>
<p>関連：<a href="http://www.amazon.co.jp/exec/obidos/ASIN/4062653435/transchinese-22" target="_blank">Amazon.co.jp： 講談社中日辞典　第三版</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/book/cjdict.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Pinconv 4.05 &#8211; ピンインデータの追加</title>
		<link>http://www.karak.jp/chinese/pinconv405-pinyin.html</link>
		<comments>http://www.karak.jp/chinese/pinconv405-pinyin.html#comments</comments>
		<pubDate>Thu, 08 Apr 2010 02:32:32 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Chinese]]></category>
		<category><![CDATA[Pinconv]]></category>
		<category><![CDATA[Software]]></category>
		<category><![CDATA[ピンイン]]></category>
		<category><![CDATA[変換]]></category>
		<category><![CDATA[拼音]]></category>
		<category><![CDATA[漢字]]></category>
		<category><![CDATA[繁体字]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1393</guid>
		<description><![CDATA[変換データファイル「ピンイン.dat」に繁体字や日本の漢字の発音データを追加したPinconvのバージョン4.05を公開します。 ダウンロード： pinconv4.exe （インストーラ形式 – 3.75MB） pinc [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.karak.jp/wp-content/uploads/pinyin-trad.png"><img src="http://www.karak.jp/wp-content/uploads/pinyin-trad-300x151.png" alt="繁体字の変換" title="繁体字の変換" width="300" height="151" class="aligncenter size-medium wp-image-1395" /></a><br />
変換データファイル「ピンイン.dat」に繁体字や日本の漢字の発音データを追加したPinconvのバージョン4.05を公開します。</p>
<ul>ダウンロード：</p>
<li><a href="http://www.karak.jp/tool/pinconv4.exe">pinconv4.exe</a> （インストーラ形式 – 3.75MB）</li>
<li><a href="http://www.karak.jp/tool/pinconv4.zip">pinconv4.zip</a> （zip形式 – 3.41MB）</li>
</ul>
<p>Pinconvの紹介は<a href="http://www.karak.jp/articles/software/pinconv-4-00.html" target="_blank">こちらのエントリ</a>、詳しい使い方については<a href="http://www.karak.jp/articles/software/pinconv%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9.html" target="_blank">Pinconvの使い方</a>を参照下さい。窓の杜による<a href="http://www.forest.impress.co.jp/docs/review/20100119_343320.html" target="_blank">紹介記事はこちら</a>です。</p>
<div class="box">
<img class="mid" src="http://www.karak.jp/img/info.png">バージョン4.05では「ピンイン.dat」に多くのデータが追加されましたが、以前のバージョンのPinconvからバージョンアップする場合、新たに追加された変換データは自動的に更新されません。「変換」メニューの<a href="http://www.karak.jp/?p=481#convert-restore" target="_blank">データファイルの復元</a>を実行し、既存の「ピンイン.dat」を上書きして下さい。なお、これまでご自身が登録したデータは新しいファイルに引き継がれます。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/restore-import.png"><img src="http://www.karak.jp/wp-content/uploads/restore-import-300x273.png" alt="データのインポート" title="データのインポート" width="300" height="273" class="aligncenter size-medium wp-image-1394" /></a></p>
</div>
<h2>変更点</h2>
<ul>
<li>ピンイン変換データに繁体字や日本の漢字のデータを追加追加したほか、複数候補がある漢字のピンインの区切り文字を/から|に変更（データはUnihan.txtを参考にした）</li>
<li>起動時のハイライトの不具合修正</li>
<li>「データファイルの復元」を一部修正</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/chinese/pinconv405-pinyin.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Pinconv用変換データ &#8211; ピンインと注音符号の変換</title>
		<link>http://www.karak.jp/chinese/pinyin-zhuyin.html</link>
		<comments>http://www.karak.jp/chinese/pinyin-zhuyin.html#comments</comments>
		<pubDate>Tue, 06 Apr 2010 12:17:39 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Chinese]]></category>
		<category><![CDATA[Pinconv]]></category>
		<category><![CDATA[convert]]></category>
		<category><![CDATA[pinyin]]></category>
		<category><![CDATA[zhuyin]]></category>
		<category><![CDATA[ピンイン]]></category>
		<category><![CDATA[拼音]]></category>
		<category><![CDATA[注音符号]]></category>
		<category><![CDATA[转换]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1356</guid>
		<description><![CDATA[「pin1yin1」のように声調を数字で表現した簡易ピンインと注音符号を相互変換するためのデータファイルを公開します。このデータを利用してPinconvで変換を実行すれば、「pin1yin1」を「ㄆㄧㄣㄧㄣ」にすることが [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.karak.jp/wp-content/uploads/zhuyin.png"><img src="http://www.karak.jp/wp-content/uploads/zhuyin-300x165.png" alt="注音符号への変換" title="注音符号への変換" width="300" height="165" class="aligncenter size-medium wp-image-1371" /></a></p>
<p>「pin1yin1」のように声調を数字で表現した簡易ピンインと注音符号を相互変換するためのデータファイルを公開します。このデータを利用してPinconvで変換を実行すれば、「pin1yin1」を「<span lang="zh-tw" class="tw">ㄆㄧㄣㄧㄣ</span>」にすることができます。</p>
<p>ダウンロード：<a href="http://www.karak.jp/tool/zhuyin.zip">変換データファイル（zhuyin.zip）</a><sup>[1]</sup></p>
<p>ダウンロードしたZIPファイル（zhuyin.zip）には、「pin2zhu.dat」と「zhu2pin.dat」の2つのデータファイルが含まれています。「pin2zhu.dat」がピンインから注音への変換用データ、「zhu2pin.dat」が注音からピンインへの変換用データです。Pinconvを起動し、「変換」メニューから「データファイルを追加」を実行して登録を行うと使えるようになります<sup>[2]</sup>。</p>
<p>追記：lv（lü）、lve（lüe）、nv（nü）が正しく変換されない問題を修正しました。ぽんた様、ご指摘ありがとうございました（2010/4/10）。<br />
追記：er化の「r」が正しく変換されない問題を修正しました。ぽんた様、ご指摘ありがとうございました（2010/4/16）。</p>
<div class="box">
<img class="mid" src="http://www.karak.jp/img/info.png"/>注音に関する作者の知識が乏しいため、変換結果が妥当でない可能性があります。間違いを発見された場合は教えていただければ幸いです。
</div>
<ol class="footnotes"><li id="footnote_0_1356" class="footnote">4/7：ファイルが1つしか同梱されていなかったため、圧縮ファイルを差し替えました。</li><li id="footnote_1_1356" class="footnote">上の画像では変換ボタンに表示するテキストをP2Z（pin2zhu－ピンインから注音への変換）とZ2P（zhu2pin－注音からピンインへの変換）に変更しています。</li></ol>]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/chinese/pinyin-zhuyin.html/feed</wfw:commentRss>
		<slash:comments>11</slash:comments>
		</item>
		<item>
		<title>注音符号とフォント</title>
		<link>http://www.karak.jp/blog/zhuyin-font.html</link>
		<comments>http://www.karak.jp/blog/zhuyin-font.html#comments</comments>
		<pubDate>Mon, 05 Apr 2010 08:16:45 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[Chinese]]></category>
		<category><![CDATA[注音符号]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1361</guid>
		<description><![CDATA[Pinconv用にピンインと注音符号の変換データを作成しているのだが、注音についてほとんど知識がないので「ㄧ」の表示にとまどっている。なんでフォントによって縦になったり横になったりするんだ。 関連：注音符號 &#8211 [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.karak.jp/wp-content/uploads/cb9e953ce7ec87551cc65fe053d28baf.png"><img src="http://www.karak.jp/wp-content/uploads/cb9e953ce7ec87551cc65fe053d28baf-300x73.png" alt="注音" title="注音" width="300" height="73" class="aligncenter size-medium wp-image-1360" /></a></p>
<p>Pinconv用にピンインと注音符号の変換データを作成しているのだが、注音についてほとんど知識がないので「ㄧ」の表示にとまどっている。なんでフォントによって縦になったり横になったりするんだ。</p>
<p>関連：<a href="http://zh.wikipedia.org/wiki/%E6%B3%A8%E9%9F%B3%E7%AC%A6%E8%99%9F" target="_blank">注音符號 &#8211; 维基百科</a><br />
関連：<a href="http://tieba.baidu.com/f?kz=526395360" target="_blank">注音符号问题贴_注音符号吧_贴吧</a><br />
関連：<a href="http://www.hudong.com/wiki/%E6%B3%A8%E9%9F%B3%E7%AC%A6%E5%8F%B7#5" target="_blank">注音符号_互动百科</a><br />
関連：<a href="http://docs.google.com/viewer?url=http%3A%2F%2Fwww.dkuug.dk%2Fjtc1%2Fsc2%2Fwg2%2Fdocs%2Fn3246" target="_blank">Proposal to add Mahjong symbols to ISO/IEC 10646</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/blog/zhuyin-font.html/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Pinconv4.04 &#8211; 新字体から繁体字への変換</title>
		<link>http://www.karak.jp/chinese/pinconv404-jpn2trad.html</link>
		<comments>http://www.karak.jp/chinese/pinconv404-jpn2trad.html#comments</comments>
		<pubDate>Sun, 21 Mar 2010 05:56:31 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Chinese]]></category>
		<category><![CDATA[Langage]]></category>
		<category><![CDATA[Pinconv]]></category>
		<category><![CDATA[Software]]></category>
		<category><![CDATA[中国語]]></category>
		<category><![CDATA[國語]]></category>
		<category><![CDATA[変換]]></category>
		<category><![CDATA[新字体]]></category>
		<category><![CDATA[日文]]></category>
		<category><![CDATA[日本語]]></category>
		<category><![CDATA[日語]]></category>
		<category><![CDATA[漢字]]></category>
		<category><![CDATA[簡體]]></category>
		<category><![CDATA[繁体字]]></category>
		<category><![CDATA[繁體]]></category>
		<category><![CDATA[華語]]></category>
		<category><![CDATA[轉換]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1305</guid>
		<description><![CDATA[Pinconvのバージョンアップを行い、日本の新字体を繁体字に変換するためのデータファイルを追加しました。 ダウンロード： pinconv4.exe （インストーラ形式 – 3.44MB） pinconv4.zip （z [...]]]></description>
			<content:encoded><![CDATA[<p>Pinconvのバージョンアップを行い、日本の新字体を繁体字に変換するためのデータファイルを追加しました。</p>
<ul>ダウンロード：</p>
<li><a href="http://www.karak.jp/tool/pinconv4.exe">pinconv4.exe</a> （インストーラ形式 – 3.44MB）</li>
<li><a href="http://www.karak.jp/tool/pinconv4.zip">pinconv4.zip</a> （zip形式 – 3.09MB）</li>
</ul>
<p>Pinconvの紹介は<a href="http://www.karak.jp/articles/software/pinconv-4-00.html" target="_blank">こちらのエントリ</a>、詳しい使い方については<a href="http://www.karak.jp/articles/software/pinconv%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9.html" target="_blank">Pinconvの使い方</a>を参照下さい。窓の杜による<a href="http://www.forest.impress.co.jp/docs/review/20100119_343320.html" target="_blank">紹介記事はこちら</a>です。</p>
<div class="box">
<img class="mid" src="http://www.karak.jp/img/info.png">以前のバージョンのPinconvからバージョンアップする場合、新たに追加された変換データファイル（日繁.dat）は、自動的にインストールされません。「変換」メニューの<a href="http://www.karak.jp/?p=481#convert-restore" target="_blank">データファイルの復元</a>を実行して追加して下さい。</div>
<h2>新字体から繁体字への変換</h2>
<p>日本語の文章を中国語に翻訳する際、意外に面倒なのが地名や人名、組織名などの固有名詞の翻訳です。同じように漢字を使っているとはいえ、簡体字、繁体字、新字体など漢字にも種類がありますので適当にごまかそうとするとまず間違いなくクレームがつきます。たとえば原文に「広島地方検察庁呉支部（広島県呉市）」とあった場合、台湾で使われている繁体字にすると「<span lang="zh-tw" class="tw">廣島地方檢察廳吳支部（廣島縣吳市）</span>」となります。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/28681d5f3f946c02c40c600a23176ec3.png"><img src="http://www.karak.jp/wp-content/uploads/28681d5f3f946c02c40c600a23176ec3-300x61.png" alt="新字体から繁体字" title="新字体から繁体字" width="300" height="61" class="aligncenter size-medium wp-image-1306" /></a></p>
<p>漢字15文字の内、7文字を繁体字に直さなければならず、日本の新字体に対応する繁体字を1字ずつ調べていく地道な作業が必要となります。10文字程度ならなんとかやっつけることはできても、組織名と住所がずらっと並んだエクセルファイルなどが対象だとしたらどうでしょう。うんざりしますね。</p>
<p>さらに1例をあげれば、「戸内」という日本人名を繁体字にすると「<span lang="zh-tw" class="tw">戶內</span>」となります。新字体と繁体字に違いはないように見えるかも知れませんが「戸」と「<span lang="zh-tw" class="tw">戶</span>」、「内」と「<span lang="zh-tw" class="tw">內</span>」にはそれぞれ異なる文字コードが振られています。日本語をそのままコピー＆ペーストして一丁上がりとはいきません。「呑（U+5451）」と「<span lang="zh-tw" class="tw">吞</span>（U+541E）」などこうした字はほかにもいくつかあり、目を皿にして1字1字チェックしていく必要があります。</p>
<p>今回公開したPinconv用の「日繁.dat」は、こうした変換作業の負担を大きく軽減します。日本語のテキストが表示された状態で、このデータファイルを用いて変換を行うと、日本語の漢字が一瞬で繁体字に変換されます。あとは変換結果が妥当かどうか確認するだけ。1字ずつ調べることを考えれば随分楽です。</p>
<h2>国字の扱いや制限事項などについて</h2>
<ol>
<li>「込」や「辻」などのいわゆる国字（和製漢字）は、繁体字に変換することができないため、変換後は「★」が出力されます。国字をそのまま出力したい場合などは、用語集の編集を行って下さい。<sup>[1]</sup></li>
<li>日繁.datは、日本の新字体を台湾で使われている繁体字に変換することを目指しているため、「闘」は「<span lang="zh-tw" class="tw">鬥</span>」に変換され、「竃」は「<span lang="zh-tw" class="tw">灶</span>」に変換されます。いわゆる旧字体への変換とは処理結果が異なります。</li>
<li>「狢」から「貉」への変換など、繁体字に変換する際に異体字や別字に置き換える漢字のうち、作者が注意が必要と判断した漢字は、出力時にアスタリスクが付加されます。作者のデータ管理用に設けたマークですので不要であれば編集して下さい。</li>
<li>変換データの登録を暫時保留している漢字は、「〓」が出力されます。</li>
<li>現行バージョンのPinconvにはU+9FA6以降の漢字データを扱えないという制限があります。そのため、この範囲に含まれる漢字を変換しようとしても「〓」が表示されます。ご了承下さい。</li>
</ol>
<h2>予、台、弁、干などの処理について</h2>
<p>新字体では、繁体字の「瓣、辮、辯」などが「弁」で代替されています。「花瓣」は「花弁」に、「辮髮」は「弁髪」、「辯護」は「弁護」という風に本来は異なる漢字で表現すべきところを「弁」の1字で済ませているため、これを繁体字に変換するには単語ごとに処理を切り替える必要があります。「日繁.dat」には、こうした単語がいくつか登録されていますが（詳細は以下の一覧を参照）、正しく変換されなかったデータを見つけた場合は、お手数ですがご自分で追加してください。<sup>[2]</sup><br />
<span id="more-1305"></span></p>
<p align="center">表1　日繁.datに登録されている単語一覧</p>
<style type="text/css">
table.tableizer-table {border: 1px solid #CCC;}
.tableizer-table td {padding: 4px; margin: 3px; border: 1px solid #ccc;}
.tableizer-table th {background-color: #104E8B; color: #FFF; font-weight: bold;}
</style>
<table class="tableizer-table" width="100%">
<tr class="tableizer-firstrow">
<th width="50%">日本語</th>
<th width="50%">繁体字</th>
</tr>
<tr>
<td>台風</td>
<td lang="zh-tw" class="tw">颱風</td>
</tr>
<tr>
<td>台頭</td>
<td lang="zh-tw" class="tw">抬頭</td>
</tr>
<tr>
<td>安全弁</td>
<td lang="zh-tw" class="tw">安全瓣</td>
</tr>
<tr>
<td>花弁</td>
<td lang="zh-tw" class="tw">花瓣</td>
</tr>
<tr>
<td>支弁</td>
<td lang="zh-tw" class="tw">支辨</td>
</tr>
<tr>
<td>能弁</td>
<td lang="zh-tw" class="tw">能辯</td>
</tr>
<tr>
<td>雄弁</td>
<td lang="zh-tw" class="tw">雄辯</td>
</tr>
<tr>
<td>思弁</td>
<td lang="zh-tw" class="tw">思辨</td>
</tr>
<tr>
<td>勘弁</td>
<td lang="zh-tw" class="tw">勘辨</td>
</tr>
<tr>
<td>自弁</td>
<td lang="zh-tw" class="tw">自辨</td>
</tr>
<tr>
<td>抗弁</td>
<td lang="zh-tw" class="tw">抗辯</td>
</tr>
<tr>
<td>陳弁</td>
<td lang="zh-tw" class="tw">陳辯</td>
</tr>
<tr>
<td>答弁</td>
<td lang="zh-tw" class="tw">答辯</td>
</tr>
<tr>
<td>詭弁</td>
<td lang="zh-tw" class="tw">詭辯</td>
</tr>
<tr>
<td>口弁</td>
<td lang="zh-tw" class="tw">口辯</td>
</tr>
<tr>
<td>多弁</td>
<td lang="zh-tw" class="tw">多辯</td>
</tr>
<tr>
<td>駄弁</td>
<td lang="zh-tw" class="tw">馱辯</td>
</tr>
<tr>
<td>訥弁</td>
<td lang="zh-tw" class="tw">訥辯</td>
</tr>
<tr>
<td>熱弁</td>
<td lang="zh-tw" class="tw">熱辯</td>
</tr>
<tr>
<td>単弁</td>
<td lang="zh-tw" class="tw">單瓣</td>
</tr>
<tr>
<td>僧帽弁</td>
<td lang="zh-tw" class="tw">僧帽瓣</td>
</tr>
<tr>
<td>合弁</td>
<td lang="zh-tw" class="tw">合辦</td>
</tr>
<tr>
<td>買弁</td>
<td lang="zh-tw" class="tw">買辦</td>
</tr>
<tr>
<td>東北弁</td>
<td lang="zh-tw" class="tw">東北辯</td>
</tr>
<tr>
<td>関西弁</td>
<td lang="zh-tw" class="tw">關西辯</td>
</tr>
<tr>
<td>弁官</td>
<td lang="zh-tw" class="tw">辨官</td>
</tr>
<tr>
<td>弁慶</td>
<td lang="zh-tw" class="tw">辨慶</td>
</tr>
<tr>
<td>弁済</td>
<td lang="zh-tw" class="tw">辨濟</td>
</tr>
<tr>
<td>弁財天</td>
<td lang="zh-tw" class="tw">辨財天</td>
</tr>
<tr>
<td>弁事</td>
<td lang="zh-tw" class="tw">辨事</td>
</tr>
<tr>
<td>弁識</td>
<td lang="zh-tw" class="tw">辨識</td>
</tr>
<tr>
<td>弁償</td>
<td lang="zh-tw" class="tw">辨償</td>
</tr>
<tr>
<td>弁証</td>
<td lang="zh-tw" class="tw">辨証</td>
</tr>
<tr>
<td>弁知</td>
<td lang="zh-tw" class="tw">辨智</td>
</tr>
<tr>
<td>弁天</td>
<td lang="zh-tw" class="tw">辨天</td>
</tr>
<tr>
<td>弁別</td>
<td lang="zh-tw" class="tw">辨別</td>
</tr>
<tr>
<td>弁明</td>
<td lang="zh-tw" class="tw">辨明</td>
</tr>
<tr>
<td>弁円</td>
<td lang="zh-tw" class="tw">辨圓</td>
</tr>
<tr>
<td>弁当</td>
<td lang="zh-tw" class="tw">辨當</td>
</tr>
<tr>
<td>弁内侍</td>
<td lang="zh-tw" class="tw">辨內侍</td>
</tr>
<tr>
<td>弁座</td>
<td lang="zh-tw" class="tw">瓣座</td>
</tr>
<tr>
<td>弁膜</td>
<td lang="zh-tw" class="tw">瓣膜</td>
</tr>
<tr>
<td>弁鰓</td>
<td lang="zh-tw" class="tw">瓣鰓</td>
</tr>
<tr>
<td>弁髪</td>
<td lang="zh-tw" class="tw">辮髮</td>
</tr>
<tr>
<td>弁解</td>
<td lang="zh-tw" class="tw">辯解</td>
</tr>
<tr>
<td>弁護</td>
<td lang="zh-tw" class="tw">辯護</td>
</tr>
<tr>
<td>弁口</td>
<td lang="zh-tw" class="tw">辯口</td>
</tr>
<tr>
<td>弁巧</td>
<td lang="zh-tw" class="tw">辯巧</td>
</tr>
<tr>
<td>弁才</td>
<td lang="zh-tw" class="tw">辯才</td>
</tr>
<tr>
<td>弁士</td>
<td lang="zh-tw" class="tw">辯士</td>
</tr>
<tr>
<td>弁者</td>
<td lang="zh-tw" class="tw">辯者</td>
</tr>
<tr>
<td>弁舌</td>
<td lang="zh-tw" class="tw">辯舌</td>
</tr>
<tr>
<td>弁疏</td>
<td lang="zh-tw" class="tw">辯疏</td>
</tr>
<tr>
<td>弁難</td>
<td lang="zh-tw" class="tw">辯難</td>
</tr>
<tr>
<td>弁論</td>
<td lang="zh-tw" class="tw">辯論</td>
</tr>
<tr>
<td>弁説</td>
<td lang="zh-tw" class="tw">辯說</td>
</tr>
<tr>
<td>弁公室</td>
<td lang="zh-tw" class="tw">辦公室</td>
</tr>
<tr>
<td>予備</td>
<td lang="zh-tw" class="tw">預備</td>
</tr>
<tr>
<td>予報</td>
<td lang="zh-tw" class="tw">預報</td>
</tr>
<tr>
<td>予防</td>
<td lang="zh-tw" class="tw">預防</td>
</tr>
<tr>
<td>予定</td>
<td lang="zh-tw" class="tw">預定</td>
</tr>
<tr>
<td>予断</td>
<td lang="zh-tw" class="tw">預斷</td>
</tr>
<tr>
<td>予告</td>
<td lang="zh-tw" class="tw">預告</td>
</tr>
<tr>
<td>予感</td>
<td lang="zh-tw" class="tw">預感</td>
</tr>
<tr>
<td>予後</td>
<td lang="zh-tw" class="tw">預後</td>
</tr>
<tr>
<td>予見</td>
<td lang="zh-tw" class="tw">預見</td>
</tr>
<tr>
<td>予期</td>
<td lang="zh-tw" class="tw">預期</td>
</tr>
<tr>
<td>予習</td>
<td lang="zh-tw" class="tw">預習</td>
</tr>
<tr>
<td>予想</td>
<td lang="zh-tw" class="tw">預想</td>
</tr>
<tr>
<td>予選</td>
<td lang="zh-tw" class="tw">預選</td>
</tr>
<tr>
<td>予知</td>
<td lang="zh-tw" class="tw">預知</td>
</tr>
<tr>
<td>予兆</td>
<td lang="zh-tw" class="tw">預兆</td>
</tr>
<tr>
<td>予測</td>
<td lang="zh-tw" class="tw">預測</td>
</tr>
<tr>
<td>予算</td>
<td lang="zh-tw" class="tw">預算</td>
</tr>
<tr>
<td>予言</td>
<td lang="zh-tw" class="tw">預言</td>
</tr>
<tr>
<td>予約</td>
<td lang="zh-tw" class="tw">預約</td>
</tr>
<tr>
<td>猶予</td>
<td lang="zh-tw" class="tw">猶豫</td>
</tr>
<tr>
<td>干物</td>
<td lang="zh-tw" class="tw">乾物</td>
</tr>
<tr>
<td>干害</td>
<td lang="zh-tw" class="tw">旱害</td>
</tr>
<tr>
<td>干魚</td>
<td lang="zh-tw" class="tw">乾魚</td>
</tr>
<tr>
<td>干姜</td>
<td lang="zh-tw" class="tw">乾薑</td>
</tr>
<tr>
<td>干繭</td>
<td lang="zh-tw" class="tw">乾繭</td>
</tr>
<tr>
<td>干天</td>
<td lang="zh-tw" class="tw">旱天</td>
</tr>
<tr>
<td>干瓢</td>
<td lang="zh-tw" class="tw">乾瓢</td>
</tr>
<tr>
<td>防御</td>
<td lang="zh-tw" class="tw">防禦</td>
</tr>
</table>
<ol class="footnotes"><li id="footnote_0_1305" class="footnote">「込」に対応するデータとして「込」を登録すれば、そのまま出力されます。</li><li id="footnote_1_1305" class="footnote">ついでに私にも教えていただければ幸いです<(_ _)></li></ol>]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/chinese/pinconv404-jpn2trad.html/feed</wfw:commentRss>
		<slash:comments>10</slash:comments>
		</item>
		<item>
		<title>Pinconv 4.03 &#8211; 繁体字から新字体への変換</title>
		<link>http://www.karak.jp/chinese/pinconv403.html</link>
		<comments>http://www.karak.jp/chinese/pinconv403.html#comments</comments>
		<pubDate>Fri, 12 Mar 2010 01:37:28 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Chinese]]></category>
		<category><![CDATA[Pinconv]]></category>
		<category><![CDATA[Software]]></category>
		<category><![CDATA[Tcl]]></category>
		<category><![CDATA[変換]]></category>
		<category><![CDATA[日本語]]></category>
		<category><![CDATA[漢字]]></category>
		<category><![CDATA[繁体字]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1266</guid>
		<description><![CDATA[Pinconvのバージョンアップを行い、繁体字を新字体に変換するためのデータファイルを追加しました。このデータを利用することで台湾などで利用されている繁体字をふだん使っている新字体に変換することができます。また、コマンド [...]]]></description>
			<content:encoded><![CDATA[<p>Pinconvのバージョンアップを行い、繁体字を新字体に変換するためのデータファイルを追加しました。このデータを利用することで台湾などで利用されている繁体字をふだん使っている新字体に変換することができます。また、コマンドバーから変換データに対応するボタンを削除する際の不具合も修正しました。</p>
<ul>ダウンロード：</p>
<li><a href="http://www.karak.jp/tool/pinconv4.exe">pinconv4.exe</a> （インストーラ形式 – 3.42MB）</li>
<li><a href="http://www.karak.jp/tool/pinconv4.zip">pinconv4.zip</a> （zip形式 – 3.08MB）</li>
<li><a href="http://www.karak.jp/tool/terms/trad2jpn.zip">trad2jpn.zip</a> （繁体字変換データ単体 – 32KB）<sup>[1]</sup></li>
</ul>
<p>Pinconvの紹介は<a href="http://www.karak.jp/articles/software/pinconv-4-00.html" target="_blank">こちらのエントリ</a>、詳しい使い方については<a href="http://www.karak.jp/articles/software/pinconv%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9.html" target="_blank">Pinconvの使い方</a>を参照下さい。窓の杜による<a href="http://www.forest.impress.co.jp/docs/review/20100119_343320.html" target="_blank">紹介記事はこちら</a>です。</p>
<h2>修正点</h2>
<p><a href="http://www.karak.jp/wp-content/uploads/266737e1439a2c2f5d3de96e1c45bb8d.png"><img src="http://www.karak.jp/wp-content/uploads/266737e1439a2c2f5d3de96e1c45bb8d-297x300.png" alt="繁体字の変換" title="繁体字の変換" width="297" height="300" class="aligncenter size-medium wp-image-1267" /></a></p>
<ul>
<li>繁体字を新字体に変換するデータファイルを追加</li>
<li>変換データに対応するボタンをコマンドバーから削除する際の不具合（削除すると変換やghostが正しく行えなくなる）の修正</li>
</ul>
<p>新たに追加された繁体字を新字体に変換するためのデータファイルは、ツールバーの「convert」をクリックし、表示される変換コマンドバーで「繁日」を選択すると利用することができます。なお、繁体字に対応する日本語の漢字が存在しない場合、「〓」が出力されます。たとえば「<span lang="zh-tw" class="tw">能夠</span>」は「能〓」、「<span lang="zh-tw" class="tw">謊言</span>」は「〓言」に変換されます。変換データの内容は完全なものではありません。今後も見直しを行っていく予定のものですので、変換結果を利用する際は必ずご自身でチェックを行って下さい。</p>
<h2>変換データについての補足説明</h2>
<p>Pinconvの「繁日」変換データは、国語審議会の印刷標準字体に準じていません。変換データ作成時のメモ書きを以下に示しますので、必要に応じてデータを編集して下さい。<br />
<span id="more-1266"></span></p>
<style type="text/css">
table.tableizer-table {border: 1px solid #CCC;}
.tableizer-table td {padding: 4px; margin: 3px; border: 1px solid #ccc;}
.tableizer-table th {background-color: #104E8B; color: #FFF; font-weight: bold;}
</style>
<table width="100%" class="tableizer-table">
<tr class="tableizer-firstrow">
<th width="12%">繁体字</th>
<th width="13%">Pinconv</th>
<th width="20%">印刷標準字体</th>
<th width="55%">備考</th>
</tr>
<tr>
<td>鼠</td>
<td>鼠</td>
<td>鼠</td>
<td>俗字に「鼡」があるがPinconvでは採用せず</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">啞</td>
<td>唖</td>
<td lang="zh-tw" class="tw">啞</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>蘆</td>
<td>芦</td>
<td>蘆</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>鰺</td>
<td>鯵</td>
<td>鰺</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">噓</td>
<td>嘘</td>
<td lang="zh-tw" class="tw">噓</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>穎</td>
<td>頴</td>
<td>穎</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">焰</td>
<td>焔</td>
<td lang="zh-tw" class="tw">焰</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>鶯</td>
<td>鴬</td>
<td>鶯</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">鷗</td>
<td>鴎</td>
<td lang="zh-tw" class="tw">鷗</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>蠣</td>
<td>蛎</td>
<td>蠣</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>攪</td>
<td>撹</td>
<td>攪</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>竈</td>
<td>竃</td>
<td>竈</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">嚙</td>
<td>噛</td>
<td lang="zh-tw" class="tw">嚙</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>諫</td>
<td>諌</td>
<td>諫</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">俠</td>
<td>侠</td>
<td lang="zh-tw" class="tw">俠</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">俱</td>
<td>倶</td>
<td lang="zh-tw" class="tw">俱</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">軀</td>
<td>躯</td>
<td lang="zh-tw" class="tw">軀</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">繫</td>
<td>繋</td>
<td lang="zh-tw" class="tw">繫</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">鹼</td>
<td>鹸</td>
<td lang="zh-tw" class="tw">鹼</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">麴</td>
<td>麹</td>
<td lang="zh-tw" class="tw">麴</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">屢</td>
<td>屡</td>
<td lang="zh-tw" class="tw">屢</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">繡</td>
<td>繍</td>
<td lang="zh-tw" class="tw">繡</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">蔣</td>
<td>蒋</td>
<td lang="zh-tw" class="tw">蔣</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">醬</td>
<td>醤</td>
<td lang="zh-tw" class="tw">醬</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">蟬</td>
<td>蝉</td>
<td lang="zh-tw" class="tw">蟬</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>賤</td>
<td>賎</td>
<td>賤</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>曾</td>
<td>曽</td>
<td>曾</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">搔</td>
<td>掻</td>
<td lang="zh-tw" class="tw">搔</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">瘦</td>
<td>痩</td>
<td lang="zh-tw" class="tw">瘦</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">驒</td>
<td>騨</td>
<td lang="zh-tw" class="tw">驒</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>鐸</td>
<td>鐸</td>
<td>鐸</td>
<td>俗字に「鈬」があるがPinconvでは採用せず</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">簞</td>
<td>箪</td>
<td lang="zh-tw" class="tw">簞</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">摑</td>
<td>掴</td>
<td lang="zh-tw" class="tw">摑</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>壺</td>
<td>壷</td>
<td>壺</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">塡</td>
<td>填</td>
<td lang="zh-tw" class="tw">塡</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">顚</td>
<td>顛</td>
<td lang="zh-tw" class="tw">顚</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>檮</td>
<td>梼</td>
<td>檮</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>濤</td>
<td>涛</td>
<td>濤</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">禱</td>
<td>祷</td>
<td lang="zh-tw" class="tw">禱</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">瀆</td>
<td>涜</td>
<td lang="zh-tw" class="tw">瀆</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">吞</td>
<td>呑</td>
<td lang="zh-tw" class="tw">吞</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>邇</td>
<td>迩</td>
<td>邇</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>禰</td>
<td>祢</td>
<td>禰</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">囊</td>
<td>嚢</td>
<td lang="zh-tw" class="tw">囊</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>蠅</td>
<td>蝿</td>
<td>蠅</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">剝</td>
<td>剥</td>
<td lang="zh-tw" class="tw">剝</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">潑</td>
<td>溌</td>
<td lang="zh-tw" class="tw">潑</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">醱</td>
<td>醗</td>
<td lang="zh-tw" class="tw">醱</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>檜</td>
<td>桧</td>
<td>檜</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">頰</td>
<td>頬</td>
<td lang="zh-tw" class="tw">頰</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>桝</td>
<td>桝</td>
<td>枡</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>儘</td>
<td>侭</td>
<td>儘</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">麵</td>
<td>麺</td>
<td lang="zh-tw" class="tw">麵</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>藪</td>
<td>薮</td>
<td>藪</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">萊</td>
<td>莱</td>
<td lang="zh-tw" class="tw">萊</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>籠</td>
<td>篭</td>
<td>籠</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">蠟</td>
<td>蝋</td>
<td lang="zh-tw" class="tw">蠟</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">姸</td>
<td>妍</td>
<td lang="zh-tw" class="tw">姸</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">屛</td>
<td>屏</td>
<td lang="zh-tw" class="tw">屛</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">幷</td>
<td>并</td>
<td lang="zh-tw" class="tw">幷</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>彎</td>
<td>弯</td>
<td>彎</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>懺</td>
<td>懴</td>
<td>懺</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">攢</td>
<td>攅</td>
<td lang="zh-tw" class="tw">攢</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>櫟</td>
<td>檪</td>
<td>櫟</td>
<td>&nbsp;</td>
</tr>
<tr>
<td>灌</td>
<td>灌</td>
<td>灌</td>
<td>俗字に「潅」があるがPinconvでは採用せず。</td>
</tr>
<tr>
<td>濾</td>
<td>濾</td>
<td>濾</td>
<td>簡易慣用字体として「沪」があるが、賛同できないためPinconvでは採用せず。</td>
</tr>
<tr>
<td>疇</td>
<td>畴</td>
<td>疇</td>
<td>&nbsp;</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">箏</td>
<td>筝</td>
<td lang="zh-tw" class="tw">箏</td>
<td></td>
</tr>
</table>
<p>以下の繁体字は変換後のデータを弁で代替した。</p>
<table width="100%" class="tableizer-table">
<tr class="tableizer-firstrow">
<th colspan="3">弁で代替した漢字</th>
</tr>
<tr>
<td>繁体字</td>
<td>Pinconv</td>
<td>熟語例</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">辦</td>
<td>弁</td>
<td>辦公室/弁公室</td>
</tr>
<tr>
<td>辨</td>
<td>弁</td>
<td>弁証/辨証、弁当/辨當、弁別/辨別、弁明/辨明、支弁/支辨</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">瓣</td>
<td>弁</td>
<td>花瓣/花弁、瓣膜/弁膜、安全瓣/安全弁</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">辮</td>
<td>弁</td>
<td>弁髪/辮髪</td>
</tr>
<tr>
<td>辯</td>
<td>弁</td>
<td>辯解/弁解、辯護/弁護、辯舌/弁舌、辯論/弁論、雄辯/雄弁</td>
</tr>
</table>
<p>以下は、現在採用しているデータ以外の候補を示したものである。</p>
<table width="100%" class="tableizer-table">
<tr class="tableizer-firstrow">
<th colspan="3">他にも変換候補がある漢字</th>
</tr>
<tr>
<td>繁体字</td>
<td>Pinconv</td>
<td>他の候補</td>
</tr>
<tr>
<td>礦</td>
<td>砿</td>
<td>鉱</td>
</tr>
<tr>
<td>聰</td>
<td>聡</td>
<td>聰</td>
</tr>
<tr>
<td>貍</td>
<td>狸</td>
<td>貍</td>
</tr>
<tr>
<td>纃</td>
<td>緕</td>
<td>纃</td>
</tr>
<tr>
<td>艫</td>
<td>舮</td>
<td>艫</td>
</tr>
<tr>
<td>豎</td>
<td>豎</td>
<td>竪</td>
</tr>
<tr>
<td>輛</td>
<td>輌</td>
<td>輛</td>
</tr>
<tr>
<td>鑪</td>
<td>鑪</td>
<td>鈩</td>
</tr>
<tr>
<td>靱</td>
<td>靱</td>
<td>靭</td>
</tr>
<tr>
<td>頸</td>
<td>頸</td>
<td>頚</td>
</tr>
<tr>
<td>鯰</td>
<td>鯰</td>
<td>鮎</td>
</tr>
<tr>
<td>鰮</td>
<td>鰮</td>
<td>鰛</td>
</tr>
<tr>
<td>鵝</td>
<td>鵝</td>
<td>鵞</td>
</tr>
<tr>
<td>麩</td>
<td>麸</td>
<td>麩</td>
</tr>
<tr>
<td>廳</td>
<td>庁</td>
<td>廰</td>
</tr>
<tr>
<td>曠</td>
<td>昿</td>
<td>曠</td>
</tr>
<tr>
<td lang="zh-tw" class="tw">櫳</td>
<td>槞</td>
<td lang="zh-tw" class="tw">櫳</td>
</tr>
<tr>
<td>殲</td>
<td>殱</td>
<td>殲</td>
</tr>
<tr>
<td>瓔</td>
<td>珱</td>
<td>瓔</td>
</tr>
</table>
<ol class="footnotes"><li id="footnote_0_1266" class="footnote">バージョンアップでは「繁日.dat」が正しくインストールされないため、「変換」メニューの「データファイルを追加」を実行し、「繁日.dat」を追加して下さい。この不具合は近日中に修正します。</li></ol>]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/chinese/pinconv403.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>LCMapStringと潟</title>
		<link>http://www.karak.jp/blog/lcmapstring.html</link>
		<comments>http://www.karak.jp/blog/lcmapstring.html#comments</comments>
		<pubDate>Thu, 11 Mar 2010 01:51:12 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[Chinese]]></category>
		<category><![CDATA[変換]]></category>
		<category><![CDATA[日本語]]></category>
		<category><![CDATA[漢字]]></category>
		<category><![CDATA[簡体字]]></category>
		<category><![CDATA[繁体字]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1257</guid>
		<description><![CDATA[WindowsにはLCMapStringという関数が用意されている。文字列の全角/半角やひらがな/カタカナの変換機能を提供する関数で、簡体字/繁体字の変換もサポートしているのだが、この関数の変換テーブルには間違いがあるよ [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.karak.jp/wp-content/uploads/a617bb5f41626a40a52c6db4bd318627.png"><img src="http://www.karak.jp/wp-content/uploads/a617bb5f41626a40a52c6db4bd318627-300x70.png" alt="潟" title="潟" width="300" height="70" class="aligncenter size-medium wp-image-1260" /></a><br />
Windowsには<a href="http://msdn.microsoft.com/ja-jp/library/cc448052.aspx" target="_blank">LCMapString</a>という関数が用意されている。文字列の全角/半角やひらがな/カタカナの変換機能を提供する関数で、簡体字/繁体字の変換もサポートしているのだが、この関数の変換テーブルには間違いがあるようだ。</p>
<p><a href="http://jp.emeditor.com/modules/mydownloads/singlefile.php?cid=25&amp;lid=42" target="_blank">テキストエディターのEmEditorで提供されている簡繁変換のプラグイン</a>もこの関数を利用しているのだが、繁体字の<span lang="zh-tw" class="tw">潟</span>を変換すると<span lang="zh-cn" class="cn">泻</span>に変換されてしまう。<span lang="zh-cn" class="cn">泻</span>の繁体字は<span lang="zh-tw" class="tw">瀉</span>で潟とは全く別の字である。「干潟」が「<span lang="zh-cn" class="cn">干泻</span>（ひからびた下痢）」になったり、「新潟」が「<span lang="zh-cn" class="cn">新泻</span>（新しい下痢）」になったりして困る。</p>
<p>大陸のWEBサイトなどでたまに「<span lang="zh-cn" class="cn">新泻县</span>」を目にするのは、この関数が原因のひとつと考えられる。</p>
<p>追記：<a href="http://www.google.com.tw/search?num=100&amp;hl=zh-TW&amp;q=%E6%BD%9F&amp;btnG=%E6%90%9C%E5%B0%8B&amp;meta=cr%3DcountryTW&amp;aq=f&amp;oq=" target="_blank">Googleで台湾のサイトを対象に「潟」の検索をする</a>と「潟」と「<span lang="zh-cn" class="cn">泻</span>」が同一視される。問題の根は深い。</p>
<div class="box">
こうした間違いが起こる原因として、写の旧字体である「寫」と俗字の「冩」の存在が考えられる。これらの新字体はいずれも「写」であるため、「潟」の簡体字として「<span lang="zh-cn" class="cn">泻</span>」が類推されたのだろう。<br />
「<span lang="zh-cn" class="cn">泻</span>」は日本でも「潟」の略字として使われてきたのでややこしいが<sup>[1]</sup>、中国における簡体字の成立には関係ないのでここでは触れない。<br />
関連：<a href="http://www.pref.niigata.lg.jp/kokusai/1204045262575.html" target="_blank">新潟県：中国語における「新潟」の表記について</a>
</div>
<ol class="footnotes"><li id="footnote_0_1257" class="footnote">参照：<a href="http://www.amazon.co.jp/exec/obidos/ASIN/4309408575/transchinese-22" target="_blank">「異体字の世界」</a>のP84など</li></ol>]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/blog/lcmapstring.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

