<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>karak &#187; Tips</title>
	<atom:link href="http://www.karak.jp/articles/category/tips/feed" rel="self" type="application/rss+xml" />
	<link>http://www.karak.jp</link>
	<description>Language and Translation</description>
	<lastBuildDate>Sun, 11 Dec 2011 06:30:29 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.4</generator>
		<item>
		<title>異体字同一視検索</title>
		<link>http://www.karak.jp/chinese/variants.html</link>
		<comments>http://www.karak.jp/chinese/variants.html#comments</comments>
		<pubDate>Thu, 11 Nov 2010 06:08:45 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Chinese]]></category>
		<category><![CDATA[Tips]]></category>
		<category><![CDATA[php]]></category>
		<category><![CDATA[sqlite]]></category>
		<category><![CDATA[中国語]]></category>
		<category><![CDATA[正規表現]]></category>
		<category><![CDATA[漢字]]></category>
		<category><![CDATA[異体字]]></category>
		<category><![CDATA[簡体字]]></category>
		<category><![CDATA[繁体字]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=2054</guid>
		<description><![CDATA[オンライン辞書の北辞郎には、利用者が検索した際、データベースにその語句が含まれていないと候補の単語を提示する機能を設けてある。 今回システムの更新を行い、異体字を同一視して候補を表示する機能を追加した。備忘録をかねて内部 [...]]]></description>
			<content:encoded><![CDATA[<p>オンライン辞書の<a href="http://www.ctrans.org/cjdic/index.php">北辞郎</a>には、利用者が検索した際、データベースにその語句が含まれていないと候補の単語を提示する機能を設けてある。<br />
今回システムの更新を行い、異体字を同一視して候補を表示する機能を追加した。備忘録をかねて内部でどういう処理を行っているかまとめておく。</p>
<p>まず、異体字を同一視して検索する、という処理がどういうものか定義しておくと、「発展」と入力すると「発」の異体字である「發」や「发」を展開し、「發展」、「发展」に対する検索も同時に行うことを指す。正規表現で表すと「(発|發|发)展」を検索することになる。これを実現するには「発展」を与えると「(発|發|发)展」を返す関数がまず必要である。さまざまな方法があるが、今回はシンプルに単漢字をキーとし、対応する異体字のリストを値とする連想配列を用意した。以下にその一部を示す。なお、北辞郎はPHPで構築しているので以下のコードはすべてPHPである。</p>

<div class="wp_syntax"><div class="code"><pre class="php" style="font-family:monospace;"><span style="color: #000088;">$variants</span> <span style="color: #339933;">=</span> <span style="color: #990000;">array</span><span style="color: #009900;">&#40;</span>
    <span style="color: #0000ff;">&quot;皑&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;皑|皚&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;皚&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;皚|凒|皑&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;蔼&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;蔼|藹&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;藹&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;藹|譪|蔼&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;霭&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;霭|謁|靄&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;靄&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;靄|謁|霭&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;爱&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;爱|愛&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;愛&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;愛|㤅|爱&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;暧&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;暧|曖&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;曖&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;曖|暧&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;谙&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;谙|諳&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;諳&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;諳|谙&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;鏖&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;鏖|鏕|鏖&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;鳌&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;鳌|鼇|鰲&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;鰲&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;鰲|鼇|鳌&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;媪&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;媪|媼&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;媼&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;媼|媪&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;拔&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;拔|抜&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;抜&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;抜|杮|叐|㧞|拔&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;罢&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;罢|罷&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;罷&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;罷|羆|罴|罢&quot;</span><span style="color: #339933;">,</span>
    <span style="color: #0000ff;">&quot;摆&quot;</span> <span style="color: #339933;">=&gt;</span> <span style="color: #0000ff;">&quot;摆|襬|擺&quot;</span><span style="color: #339933;">,</span><span style="color: #666666; font-style: italic;">#以下延々と1万文字以上続く
</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">;</span></pre></div></div>

<p>異体字のデータには、自前の簡体字と日本の漢字の対照データと<a href="http://kanji-database.sourceforge.net/variants/variants.html">漢字データベースの異体字データベース</a>を利用した。異体字データベースは、異体字の情報が網羅された素晴らしいデータベースである。作成に携わった全作業者にこの場を借りてお礼申し上げる。</p>
<p>この配列ができてしまえば、処理は半分終わったようなものである。あとは文字列が与えられるとそれを文字単位に分解し、各文字に対応する異体字を検索して正規表現を返す関数を作れば良い。</p>

<div class="wp_syntax"><table><tr><td class="line_numbers"><pre>1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
</pre></td><td class="code"><pre class="php" style="font-family:monospace;"><span style="color: #000000; font-weight: bold;">function</span> get_variants<span style="color: #009900;">&#40;</span><span style="color: #000088;">$str</span><span style="color: #009900;">&#41;</span> <span style="color: #009900;">&#123;</span>
    <span style="color: #666666; font-style: italic;">#まず先ほどの配列が保存してあるファイルをインクルードする
</span>    <span style="color: #666666; font-style: italic;">#配列の変数名は$variantsである
</span>    <span style="color: #b1b100;">include</span> <span style="color: #0000ff;">'variants.php'</span><span style="color: #339933;">;</span>
    <span style="color: #000088;">$result</span> <span style="color: #339933;">=</span> <span style="color: #0000ff;">&quot;&quot;</span><span style="color: #339933;">;</span>
    <span style="color: #b1b100;">for</span> <span style="color: #009900;">&#40;</span><span style="color: #000088;">$i</span> <span style="color: #339933;">=</span> <span style="color: #cc66cc;">0</span><span style="color: #339933;">;</span> <span style="color: #000088;">$i</span> <span style="color: #339933;">&lt;</span> <span style="color: #990000;">mb_strlen</span><span style="color: #009900;">&#40;</span><span style="color: #000088;">$str</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">;</span> <span style="color: #000088;">$i</span><span style="color: #339933;">++</span><span style="color: #009900;">&#41;</span> <span style="color: #009900;">&#123;</span>
        <span style="color: #666666; font-style: italic;">#文字単位にばらす
</span>        <span style="color: #000088;">$char</span> <span style="color: #339933;">=</span> <span style="color: #990000;">mb_substr</span><span style="color: #009900;">&#40;</span><span style="color: #000088;">$str</span><span style="color: #339933;">,</span> <span style="color: #000088;">$i</span><span style="color: #339933;">,</span> <span style="color: #cc66cc;">1</span><span style="color: #009900;">&#41;</span><span style="color: #339933;">;</span>
        <span style="color: #b1b100;">if</span> <span style="color: #009900;">&#40;</span><span style="color: #990000;">array_key_exists</span><span style="color: #009900;">&#40;</span><span style="color: #000088;">$char</span><span style="color: #339933;">,</span> <span style="color: #000088;">$variants</span><span style="color: #009900;">&#41;</span><span style="color: #009900;">&#41;</span> <span style="color: #009900;">&#123;</span>
            <span style="color: #000088;">$result</span> <span style="color: #339933;">.=</span> <span style="color: #0000ff;">&quot;(&quot;</span> <span style="color: #339933;">.</span> <span style="color: #000088;">$variants</span><span style="color: #009900;">&#91;</span><span style="color: #000088;">$char</span><span style="color: #009900;">&#93;</span> <span style="color: #339933;">.</span> <span style="color: #0000ff;">&quot;)&quot;</span><span style="color: #339933;">;</span>
        <span style="color: #009900;">&#125;</span> <span style="color: #b1b100;">else</span> <span style="color: #009900;">&#123;</span>
            <span style="color: #000088;">$result</span> <span style="color: #339933;">.=</span> <span style="color: #000088;">$char</span><span style="color: #339933;">;</span>
        <span style="color: #009900;">&#125;</span>
    <span style="color: #009900;">&#125;</span>
    <span style="color: #b1b100;">return</span> <span style="color: #000088;">$result</span><span style="color: #339933;">;</span>
<span style="color: #009900;">&#125;</span></pre></td></tr></table></div>

<p>このget_variantsにたとえば「広東」を与えると「(広|廣|广)(東|东)」が返ってくる。この正規表現を使ってデータベースの検索を行えば、「広東」と「<span lang="zh-cn" class="cn">广东</span>」と「<span lang="zh-tw" class="tw">廣東</span>」の検索をまとめて行うことができる。北辞郎で採用しているデータベースSQLiteで正規表現を使用する方法については、こちらの<a href="http://www.karak.jp/articles/blog/sqlite-regexp.html">SQLiteで正規表現</a>にまとめたので参照されたい。実用上問題のない処理速度をマークしており、手間の割に満足のいく結果が得られた。</p>
<p>今回作成した variants.php は、以下からダウンロード可能である。興味のある向きは参照されたい。なお、このデータのライセンスは、異体字データベースと同じ<a href="http://sourceforge.jp/projects/opensource/wiki/licenses%2FMIT_license">MITライセンス</a>とする。</p>
<p>ダウンロード：<a href="http://www.karak.jp/tool/variants.zip">variants.zip</a>（文字コードはUTF-8）</p>
</pre>
]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/chinese/variants.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Wordの全画面表示</title>
		<link>http://www.karak.jp/blog/word-fullscreen.html</link>
		<comments>http://www.karak.jp/blog/word-fullscreen.html#comments</comments>
		<pubDate>Sat, 22 May 2010 05:11:54 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[Tips]]></category>
		<category><![CDATA[word]]></category>
		<category><![CDATA[ショートカット]]></category>
		<category><![CDATA[フルスクリーン]]></category>
		<category><![CDATA[全画面]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1659</guid>
		<description><![CDATA[Wordで作業に集中したい時、全画面表示にすることが多いのだが、「表示」メニューの「全画面表示」をいちいちクリックするのは面倒なのでショートカットキーを設定した。 「ツール」→「ユーザ設定」→「キーボード」で「キーボード [...]]]></description>
			<content:encoded><![CDATA[<p>Wordで作業に集中したい時、全画面表示にすることが多いのだが、「表示」メニューの「全画面表示」をいちいちクリックするのは面倒なのでショートカットキーを設定した。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/W1.png"><img src="http://www.karak.jp/wp-content/uploads/W1-300x265.png" alt="キーボードの設定" title="キーボードの設定" width="300" height="265" class="aligncenter size-medium wp-image-1660" /></a></p>
<p>「ツール」→「ユーザ設定」→「キーボード」で「キーボードのユーザ設定ダイアログ」を出す。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/W2.png"><img src="http://www.karak.jp/wp-content/uploads/W2-276x300.png" alt="表示でToggleFull" title="表示でToggleFull" width="276" height="300" class="aligncenter size-medium wp-image-1661" /></a></p>
<p>「分類」で「表示」を指定し、「コマンド」で「ToggleFull」を選ぶ。「割り当てるキーを押してください」のところで任意のキーを押す。今回は、ほかのソフトで全画面表示のショートカットキーになっていることが多いF11にしておいた。満足。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/blog/word-fullscreen.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Pinconv &#8211; ピンインをカタカナに変換する</title>
		<link>http://www.karak.jp/chinese/pinconv-pinkana.html</link>
		<comments>http://www.karak.jp/chinese/pinconv-pinkana.html#comments</comments>
		<pubDate>Thu, 04 Mar 2010 06:31:31 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Chinese]]></category>
		<category><![CDATA[Pinconv]]></category>
		<category><![CDATA[Tips]]></category>
		<category><![CDATA[カタカナ]]></category>
		<category><![CDATA[ピンイン]]></category>
		<category><![CDATA[中国語]]></category>
		<category><![CDATA[変換]]></category>
		<category><![CDATA[発音]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=1192</guid>
		<description><![CDATA[某社で中国関係の業務を担当しているA氏に社長が声をかけた。 「今度、中国の工場に行く件でちょっと相談なんだが、せっかくだから現地の従業員に中国語であいさつしようと思ってね。忙しいところ悪いんだが、この日本語を中国語に翻訳 [...]]]></description>
			<content:encoded><![CDATA[<p>某社で中国関係の業務を担当しているA氏に社長が声をかけた。<br />
「今度、中国の工場に行く件でちょっと相談なんだが、せっかくだから現地の従業員に中国語であいさつしようと思ってね。忙しいところ悪いんだが、この日本語を中国語に翻訳して中国語の読みをカタカナで下に書いてくれないか」<br />
A氏は、ピンインと声調を覚えて発音の練習しないとカタカナ読みでは通じないですよ、と出かかった言葉を飲み込み、「なるほど、現地の従業員も喜びますね。それでは一両日中に用意してお届けします」と返事をした。波風を立てない大人の対応である。<br />
社長はA氏の肩をポンと叩き、じゃあよろしくと背を向ける。A氏は軽く会釈をして渡された原稿を広げ、面倒なことを頼まれたなと溜息をついた。</p>
<p align="center">*　　*　　*</p>
<p>ということで、今回はこのA氏の手助けをしようと思う。翻訳については素晴らしい中国語訳が完成しているという前提で、その中国語をカタカナに変換する。使う道具は<a href="http://www.karak.jp/articles/software/pinconv-4-00.html">Pinconv</a>で、段取りとしては中国語→簡易ピンイン→カタカナの順に変換を行う。<span lang="zh-cn" class="cn">拼音</span>→pin1yin1→ピンインというかたちだ。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/kana-demo1.png"><img src="http://www.karak.jp/wp-content/uploads/kana-demo1-300x189.png" alt="中国語の変換" title="中国語の変換" width="300" height="189" class="aligncenter size-medium wp-image-1196" /></a></p>
<p>中国語を簡易ピンインに変換するデータファイルは、Pinconvですでに実現されているため、簡易ピンインをカタカナにするための変換データを新たに作成する。</p>
<p><span id="more-1192"></span></p>
<p>ピンインをカタカナに変換するためのデータファイルは<a href="http://www.karak.jp/tool/pinkana.zip" target="_blank">こちら</a>に用意した。ZIPファイルの中身は「ピンカナ.txt」というテキストファイルで<sup>[1]</sup>、簡易ピンインとカタカナがペアになったタブ区切りファイルである。カタカナ部分に関しては作者の感覚で入力しているため、適当でないデータもあるかもしれないが、それらについては利用者自身が適宜修正されたい。</p>
<p>データファイルのダウンロード：<a href="http://www.karak.jp/tool/pinkana.zip" target="_blank">pinkana.zip</a></p>
<p>ファイルをダウンロードできたら、Pinconvの「変換メニュー」から「データファイルの新規作成」を実行する。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/kana-demo2.png"><img src="http://www.karak.jp/wp-content/uploads/kana-demo2-300x252.png" alt="ファイルの選択" title="ファイルの選択" width="300" height="252" class="aligncenter size-medium wp-image-1197" /></a></p>
<p>ダイアログが表示されるので、ピンインをカタカナに変換するためのデータファイル（ピンカナ.txt）を選択した上で、新しい変換ファイルの名前を入力し、オプションを選択する。ダイアログ下部のOKを押すと登録処理が行われ、変換ファイルの設定画面が表示される。今回は特に設定を行う必要はないのでダイアログを閉じる。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/kana-demo4.png"><img src="http://www.karak.jp/wp-content/uploads/kana-demo4-300x277.png" alt="設定ダイアログ" title="設定ダイアログ" width="300" height="277" class="aligncenter size-medium wp-image-1202" /></a></p>
<p>以上でピンインをカタカナにする変換データができたので実際に使ってみよう。</p>
<p><a href="http://www.karak.jp/movie/pinkana.html"><img src="http://www.karak.jp/wp-content/uploads/kana-demo31-300x278.png" alt="カタカナへの変換" title="カタカナへの変換" width="300" height="278" class="aligncenter size-medium wp-image-1210" /></a></p>
<p>発音のカタカナ表記の気に入らない部分を直したい場合は、先ほどの「ピンカナ.txt」を直接編集して再度インポートしても良いし、「編集」メニューの「変換データの編集」から修正することもできる。ぜひ自分好みにカスタマイズしていただきたい。</p>
<p>A氏のところの社長も、これでスマートにあいさつできる……かもしれない。</p>
<div class="box">
Pinconvの説明は<a href="http://www.karak.jp/articles/software/pinconv-4-00.html" target="_blank">こちらのエントリ</a>、詳しい使い方については<a href="http://www.karak.jp/articles/software/pinconv%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9.html" target="_blank">Pinconvの使い方</a>を参照下さい。窓の杜による<a href="http://www.forest.impress.co.jp/docs/review/20100119_343320.html" target="_blank">紹介記事はこちら</a>です。
</div>
<ol class="footnotes"><li id="footnote_0_1192" class="footnote">本ファイルのライセンスはGFDLとする</li></ol>]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/chinese/pinconv-pinkana.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>中国語の検索</title>
		<link>http://www.karak.jp/chinese/%e4%b8%ad%e5%9b%bd%e8%aa%9e%e3%81%ae%e6%a4%9c%e7%b4%a2.html</link>
		<comments>http://www.karak.jp/chinese/%e4%b8%ad%e5%9b%bd%e8%aa%9e%e3%81%ae%e6%a4%9c%e7%b4%a2.html#comments</comments>
		<pubDate>Sat, 19 Aug 2006 02:02:47 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Chinese]]></category>
		<category><![CDATA[Tips]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[検索]]></category>
		<category><![CDATA[百度]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=81</guid>
		<description><![CDATA[訳語の調査を行うときの小技を紹介します。 中国語版の「とは検索」 知らない言葉に遭遇し、辞書などにその言葉が掲載されていない場合、日本語であれば「調査対象の単語＋とは」のかたちで検索すると、その言葉を説明したページが見つ [...]]]></description>
			<content:encoded><![CDATA[<p>訳語の調査を行うときの小技を紹介します。</p>
<h3>中国語版の「とは検索」</h3>
<p>知らない言葉に遭遇し、辞書などにその言葉が掲載されていない場合、日本語であれば「調査対象の単語＋とは」のかたちで検索すると、その言葉を説明したページが見つかることがあります。例えば「グリーン調達」を調べたい場合に、<a href="http://www.google.co.jp/search?num=100&#038;hs=IxG&#038;hl=ja&#038;c2coff=1&#038;client=firefox&#038;rls=org.mozilla%3Aja%3Aofficial&#038;q=%E3%82%B0%E3%83%AA%E3%83%BC%E3%83%B3%E8%AA%BF%E9%81%94%E3%81%A8%E3%81%AF&#038;btnG=Google+%E6%A4%9C%E7%B4%A2&#038;lr=lang_ja" target="_blank">「グリーン調達とは」</a>を検索する感じです。<br />
これと同じことを中国語でする場合、私は「調査対象の単語＋指 or 是指 or 指的是」で検索しています。結構うまくいきます。検索対象語句が「<span lang="zh-cn" class="cn">规模以上企业</span>」である場合、「<span lang="zh-cn" class="cn">规模以上企业指的是</span>」で検索すると<a href="http://www.baidu.com/s?ie=gb2312&#038;bs=%B9%E6%C4%A3%D2%D4%C9%CF%B9%A4%D2%B5%C6%F3%D2%B5%D6%B8%B5%C4%CA%C7&#038;sr=&#038;z=&#038;cl=3&#038;f=8&#038;wd=%B9%E6%C4%A3%D2%D4%C9%CF%C6%F3%D2%B5%D6%B8%B5%C4%CA%C7&#038;ct=0" target="_blank">こんな結果になります</a>。上記以外にも、検索語句の頭に「<span lang="zh-cn" class="cn">什么是</span>」や「<span lang="zh-cn" class="cn">所谓</span>」をつける手もあります。<br />
<span id="more-81"></span></p>
<h3>英訳を活用する</h3>
<p>翻訳の調査の場合、専門用語の訳語を調べる際に、その中国語の英語訳を探し、その英語の意味をさらに調べる、ということをよくやります。オンライン辞書に収録されている言葉であれば、比較的簡単に見つかりますが、そうでない場合、調査対象の言葉を検索エンジンにかけるだけではなかなか見つかりません。<br />
こういう場合、検索語句に「abstract」や「附英文」を加えてみます。「abstract」は論文などの冒頭にある「要約」を表しますので、「中国語の検索対象語句　abstract」で検索すると、中国語と英語が対訳になった論文のページが見つかる可能性があります。この方法は、専門用語を調べるときに効果的です。「附英文」は、中国の法律に英訳版が用意されていることがあるのを利用したものです。運が良ければ、中国語と英語の対訳になった法律や国家基準などのページが見つかります。</p>
<h3>質問サイトを利用する</h3>
<p><a href="http://oshiete.goo.ne.jp/" target="_blank">教えて！goo</a>や<a href="http://q.hatena.ne.jp/" target="_blank">人力検索はてな</a>のような質問サイトも便利です。中国にも<a href="http://zhidao.baidu.com/" target="_blank">百度知道</a>という質問サイトがありますが、わざわざ自分で質問しなくても、過去の回答がとても参考になります。例えば先ほど検索した「<span lang="zh-cn" class="cn">规模以上企业</span>」を百度知道で検索してみると<a href="http://zhidao.baidu.com/q?word=%B9%E6%C4%A3%D2%D4%C9%CF%C6%F3%D2%B5&#038;ct=17&#038;pn=0&#038;tn=ikaslist&#038;rn=10" target="_blank">こういう結果になります</a>。<a lang="zh-cn" class="cn" href="http://zhidao.baidu.com/question/8545992.html" target="_blank">「什么是规模以上企业」</a>なんてドンピシャです。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/chinese/%e4%b8%ad%e5%9b%bd%e8%aa%9e%e3%81%ae%e6%a4%9c%e7%b4%a2.html/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>中国語と日本語をページ内で混在させる時の注意点</title>
		<link>http://www.karak.jp/chinese/%e4%b8%ad%e5%9b%bd%e8%aa%9e%e3%81%a8%e6%97%a5%e6%9c%ac%e8%aa%9e%e3%82%92%e3%83%9a%e3%83%bc%e3%82%b8%e5%86%85%e3%81%a7%e6%b7%b7%e5%9c%a8%e3%81%95%e3%81%9b%e3%82%8b%e6%99%82%e3%81%ae%e6%b3%a8%e6%84%8f.html</link>
		<comments>http://www.karak.jp/chinese/%e4%b8%ad%e5%9b%bd%e8%aa%9e%e3%81%a8%e6%97%a5%e6%9c%ac%e8%aa%9e%e3%82%92%e3%83%9a%e3%83%bc%e3%82%b8%e5%86%85%e3%81%a7%e6%b7%b7%e5%9c%a8%e3%81%95%e3%81%9b%e3%82%8b%e6%99%82%e3%81%ae%e6%b3%a8%e6%84%8f.html#comments</comments>
		<pubDate>Fri, 29 Jul 2005 01:54:29 +0000</pubDate>
		<dc:creator>ctrans</dc:creator>
				<category><![CDATA[Chinese]]></category>
		<category><![CDATA[Tips]]></category>
		<category><![CDATA[Web]]></category>
		<category><![CDATA[css]]></category>
		<category><![CDATA[UTF-8]]></category>
		<category><![CDATA[フォント]]></category>
		<category><![CDATA[中国語]]></category>
		<category><![CDATA[同時]]></category>
		<category><![CDATA[日中]]></category>
		<category><![CDATA[混在]]></category>
		<category><![CDATA[表示]]></category>

		<guid isPermaLink="false">http://www.karak.jp/?p=67</guid>
		<description><![CDATA[HTML内で日中混在表示を実現するにあたって、CSSのfont-family設定をいくつか試してみました。備忘録をかねて以下にまとめておきます。 テストはこのページで行っていますので、まずはこちらを参照してください（文字 [...]]]></description>
			<content:encoded><![CDATA[<p>HTML内で日中混在表示を実現するにあたって、CSSのfont-family設定をいくつか試してみました。備忘録をかねて以下にまとめておきます。</p>
<p>テストは<a href="http://www.karak.jp/test/test.htm" target="_blank">このページ</a>で行っていますので、まずはこちらを参照してください（文字コードはUTF-8です）。下はFirefoxとIEで表示をチェックした際の画像です。</p>
<p><a href="http://www.karak.jp/wp-content/uploads/firefox_ie.gif"><img class="alignnone size-thumbnail wp-image-75" title="firefox_ie" src="http://www.karak.jp/wp-content/uploads/firefox_ie-150x150.gif" alt="firefox_ie" width="150" height="150" /></a></p>
<p><span id="more-67"></span></p>
<p>ソースにあるように、1～7番までのテキストをそれぞれfont-familyなどの設定が異なるspanタグで括り、表示を確認しています。Firefoxの方はほとんど問題ないので、以下では主にIEの表示を評価しています。</p>
<p>1番のnoneクラスは、ゴシック系のフォントで表示することだけを指定しています（font-family:sans-serif;）。どちらのブラウザでも日中混在表示はできていますが、サイトの訪問者全員がこれと同じ画面を見ているとは限りません。使っている環境の設定次第だと思います。「<span class="cn" lang="zh-cn">宁吓刘份</span>」が美しくありませんが、これは別の問題なのでここではスルー。</p>
<p>2番のhigeクラスは明朝系のフォントで表示するよう指定しています（font-family:serif;）。簡体字の表示にはserif系のSimsunが使われることが多いと思い、この指定ならきれいに表示されるかなと期待していたんですが、IEでの表示はボロボロです。漢字がグチャグチャに重なって読むこともできません。</p>
<p>3番のvdnクラスはゴシック系のフォント、それもできればVerdanaを使うよう指定しています（font-family:Verdana,sans-serif;）。が、残念ながらIEでは簡体字部分が中黒に化けてしまいました。指定しているフォントで表示できないのなら、代わりのフォントをシステムから探し出して、なんとか表示するくらいの対応はして欲しいのですが……。先日、当サイトの文字化けの原因となったのが、まさにこのvdnクラスです。</p>
<p>4番のthmクラスでも、同様にゴシック系のフォントを指定してますが（font-family:Tahoma, &#8216;MS Gothic&#8217;, Osaka,sans-serif;）、今回は表示できています。私が使用しているOSがWinXPで、FontLink機能が働いているためだと思います（Tahomaだけにしても表示されます）。</p>
<p>5番と6番のzhクラスのフォント指定は「font-family :宋体,SimSun,&#8217;MS Song&#8217;,'MS Mincho&#8217;,serif;」です。中国語をきちんと表示させるための指定で、5番ではspanタグにlang属性「lang=zh」も与えています。ただ、6番を見れば分かるようにlang属性があってもなくても結果に違いはありませんでした。そこで、思い切ってfont-familyなどは指定せずに、lang属性「lang=zh」のみを与えたのが7番なのですが、これも問題ないようです。ちなみに、5～7番では簡体字の「骨」もちゃんと表示されています。</p>
<p>私の環境（日本語Windows XP）だけで検証してもあまり意味がないので、各種ブラウザでの表示が確認できる<a href="http://browsershots.org/" target="_blank">Browsershots</a>で、英語版Win98のIEとMac OS XのSafariでの表示を試してみました。それぞれ以下の通りです。</p>
<p>1)英語版Win98のIE<br />
<a href="http://www.karak.jp/wp-content/uploads/ie_eng_98.gif"><img class="alignnone size-thumbnail wp-image-76" title="ie_eng_98" src="http://www.karak.jp/wp-content/uploads/ie_eng_98-150x150.gif" alt="ie_eng_98" width="150" height="150" /></a></p>
<p>2)Mac OS XのSafari<br />
<a href="http://www.karak.jp/wp-content/uploads/safari_mac_eng.gif"><img class="alignnone size-thumbnail wp-image-77" title="safari_mac_eng" src="http://www.karak.jp/wp-content/uploads/safari_mac_eng-150x150.gif" alt="safari_mac_eng" width="150" height="150" /></a></p>
<p>3)おまけ：中国語関連の設定を全くしていないWinXP<br />
<a href="http://www.karak.jp/wp-content/uploads/ie_font_test.gif"><img class="alignnone size-thumbnail wp-image-78" title="ie_font_test" src="http://www.karak.jp/wp-content/uploads/ie_font_test-150x150.gif" alt="ie_font_test" width="150" height="150" /></a></p>
<p>英語版Win98は5～7番以外全滅です。Macの表示は実に美しいですね。中国語関連の設定を全くしていないWinXP（妻のマシン）では、6番が中黒化けをしています。やはり一番大切なのはlang属性のようです。</p>
<h4><strong>まとめ</strong></h4>
<p>日中混在表示をしたい、でもフォントの指定はシンプルにしたいと思っていたのですが、シェアNo.1のIEがボロボロの状態でしたので、きちんと表示させるには中国語を括るタグにlang属性を与えておく必要があるようです。見た目のこともあるのでfont-familyも指定した方が良いでしょう（ページの文字コードはUTF-8）。<br />
参考：<a href="http://blue.ribbon.to/~akene/fontlink.htm" target="_blank">Windows 2000/XPのFont Link機能(Font Linking)の紹介</a><br />
参考：<a href="http://221.186.146.27/1089350189" target="_blank">はてな 以下のスタイルシートを、Mac、Unix対応にもするには……</a><br />
推薦：<a href="http://browsershots.org/" target="_blank">Browsershots</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.karak.jp/chinese/%e4%b8%ad%e5%9b%bd%e8%aa%9e%e3%81%a8%e6%97%a5%e6%9c%ac%e8%aa%9e%e3%82%92%e3%83%9a%e3%83%bc%e3%82%b8%e5%86%85%e3%81%a7%e6%b7%b7%e5%9c%a8%e3%81%95%e3%81%9b%e3%82%8b%e6%99%82%e3%81%ae%e6%b3%a8%e6%84%8f.html/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>

