Karak http://www.karak.jp Language and Translate Wed, 10 Mar 2010 01:33:52 +0000 http://wordpress.org/?v=2.8.2 ja hourly 1 埓と埒2 http://www.karak.jp/articles/chinese/u57d2-2.html http://www.karak.jp/articles/chinese/u57d2-2.html#comments Wed, 10 Mar 2010 01:33:52 +0000 ctrans http://www.karak.jp/?p=1251 繁体字の埓と埒の字体について、昨日のエントリでは確認しなかったが、他の繁体字フォントも試してみた。以下はGRF FontとMingLiuの比較である。GRFの方は期待通りだ。

GRFとMingLiuの比較

]]>
http://www.karak.jp/articles/chinese/u57d2-2.html/feed 0
埓と埒 http://www.karak.jp/articles/chinese/u57d2.html http://www.karak.jp/articles/chinese/u57d2.html#comments Tue, 09 Mar 2010 07:25:53 +0000 ctrans http://www.karak.jp/?p=1235 57D2

「埒が明かない」などに使う「埒」という漢字は、MS明朝などの日本語フォントでは上図左のように表示され、繁体字のMingLiuでは真ん中のように、簡体字のSimSunでは右のように表示される。少しずつ形が違うが、いずれもUnicodeでは57D2という番号が与えられている同じ漢字である。「同じ漢字でも国によって形が違うんですなあ、面白いですなあ」とのんきに流しておきたいところだが、この字の場合は異体字に「埓」(U+57D3)があるのでややこしい。

現在、Pinconvで繁体字を日本の漢字に変換するデータファイルを作成しているのだが、繁体字の「」に対応するデータをどうするかで脳内会議が紛糾した。字形が同じなんだから繁体字から日本の漢字への変換なら57D2→57D3でもいいんじゃない?そんなこと言ったら「吞(U+541E)」と「呑(U+5451)」なんかぱっと見違いがないから変換しないでいいという話になるだろう。いやそうはならんだろう。そもそもこれはMingLiuの問題じゃないのか。ほかのフォントだとどうなんだ。文字コードに字形の話を持ち込むなよ。いや今してるのは変換の話だ。黙れ小童。なんだとこのヤロウ、わーわー。……侃々諤々、丁々発止である。

MS-IMEでは「不埒」と「放埓」で違う文字が出力されるそうだが他人事ではない。MingLiuの埒の字形が10pt以下ではSimSunと同じになったりして混乱に拍車をかける。困った時の駆け込み寺である教育部異體字字典でも軽く門前払いされた。うーむ。

結局、異体字に変換するわけにもいかんだろうということでU+57D2のままにしている。こんなのがたくさん出てこないことを祈る。

参考:旧い漢字の使い方~旧字・異体字・俗字~ 【埒】と【埓】
関連:字典中 埒 字的解释

]]>
http://www.karak.jp/articles/chinese/u57d2.html/feed 0
BABYBANZ http://www.karak.jp/articles/blog/babybanz.html http://www.karak.jp/articles/blog/babybanz.html#comments Sun, 07 Mar 2010 01:54:38 +0000 ctrans http://www.karak.jp/?p=1233 外出時に太陽光が目に差し込むとエビ反りになっていやがる息子のためにサングラスを購入した。ちょっと貫禄が出過ぎている気がするけど、これで問題解決だな>息子。

BANYBANZ

関連:BABYBANZ

]]>
http://www.karak.jp/articles/blog/babybanz.html/feed 0
たまには政治について http://www.karak.jp/articles/blog/%e3%81%9f%e3%81%be%e3%81%ab%e3%81%af%e6%94%bf%e6%b2%bb%e3%81%ab%e3%81%a4%e3%81%84%e3%81%a6.html http://www.karak.jp/articles/blog/%e3%81%9f%e3%81%be%e3%81%ab%e3%81%af%e6%94%bf%e6%b2%bb%e3%81%ab%e3%81%a4%e3%81%84%e3%81%a6.html#comments Thu, 04 Mar 2010 14:23:28 +0000 ctrans http://www.karak.jp/?p=1217 政治家というのは、国のあるべき姿を提示するのが仕事で、細かい実務は優秀な東大出の官僚たちが徹夜して片付けるものだと思っていた。それが民主党が政権を取ってからなんかおかしい。事業仕分けなんて本当に必要なのか大いに疑問だ。政治家の仕事ではなくて、それこそ木っ端役人の仕事という気がする。重箱の隅をつついて、この国が少しでも前に進んだのだろうか。

普天間の問題では、はじめから落としどころはこのあたりだろうと見当をつけて、議論のまねごとをし、与党の人間が視察ばかりしているのが腹が立つ。米軍を国外に追い出したいのなら、その前に代替抑止力として我が国の再軍備をきちんと議論すべきだろう。国防を他の国の軍隊に任せるから他人事のようになっている。

Twitterにちまちま投稿している政治家が多いのにも腹が立つ。ぶつ切れの情報を投稿し、いちいちこちらの顔色を伺っているようで気持ちが悪い。百歩譲ったとしてせめて国産のマイクロブログを使うべきだろう。外国のサービスを締め出して雇用を確保している(もちろんそれだけが目的じゃないが)中国を見習って欲しい。

自民党は自民党でせっかく相手が脱税して失言して迷走してくれているのに、それを利用して相手を自分のペースに引き込み、持論を展開することすらしない。どんな汚い手でも使えば良いのに使わない。きれい事ばかり言っているうちに時間だけが過ぎている[1]

零細自営業者が大上段に構えて何を偉そうにと思うかもしれない。だが、今の日本に必要なのはひとりひとりが大上段に構えて国のあり方を考えることだと思う。どこで誰か偉い人ががんばっているから明日も今日と同じ穏やかな日になるだろうとぼんやり期待できた時代は過ぎ去ってしまった。最近、新聞を読めば読むほど胸が不安でざわざわする。

  1. 私が子供のころ、「日本人は建前ばかりで本音が見えない」という外国人のコメントをよく目にした。今にして思えば、これはほめ言葉だったのだなと思う。タフネゴシエーターやポーカーフェイスと同義だ。きれい事や建前を並べるのは、相手を反論できないところに追い詰めて最終的な目的を達成するためだろう。いちいち本音を開帳するのはただの馬鹿だ。だが、きれい事を並べているうちに自分がそれを信じてしまうのはもっと馬鹿だ。
]]>
http://www.karak.jp/articles/blog/%e3%81%9f%e3%81%be%e3%81%ab%e3%81%af%e6%94%bf%e6%b2%bb%e3%81%ab%e3%81%a4%e3%81%84%e3%81%a6.html/feed 0
Pinconv – ピンインをカタカナに変換する http://www.karak.jp/articles/chinese/pinconv-pinkana.html http://www.karak.jp/articles/chinese/pinconv-pinkana.html#comments Thu, 04 Mar 2010 06:31:31 +0000 ctrans http://www.karak.jp/?p=1192 某社で中国関係の業務を担当しているA氏に社長が声をかけた。
「今度、中国の工場に行く件でちょっと相談なんだが、せっかくだから現地の従業員に中国語であいさつしようと思ってね。忙しいところ悪いんだが、この日本語を中国語に翻訳して中国語の読みをカタカナで下に書いてくれないか」
A氏は、ピンインと声調を覚えて発音の練習しないとカタカナ読みでは通じないですよ、と出かかった言葉を飲み込み、「なるほど、現地の従業員も喜びますね。それでは一両日中に用意してお届けします」と返事をした。波風を立てない大人の対応である。
社長はA氏の肩をポンと叩き、じゃあよろしくと背を向ける。A氏は軽く会釈をして渡された原稿を広げ、面倒なことを頼まれたなと溜息をついた。

*  *  *

ということで、今回はこのA氏の手助けをしようと思う。翻訳については素晴らしい中国語訳が完成しているという前提で、その中国語をカタカナに変換する。使う道具はPinconvで、段取りとしては中国語→簡易ピンイン→カタカナの順に変換を行う。拼音→pin1yin1→ピンインというかたちだ。

中国語の変換

中国語を簡易ピンインに変換するデータファイルは、Pinconvですでに実現されているため、簡易ピンインをカタカナにするための変換データを新たに作成する。

ピンインをカタカナに変換するためのデータファイルはこちらに用意した。ZIPファイルの中身は「ピンカナ.txt」というテキストファイルで[1]、簡易ピンインとカタカナがペアになったタブ区切りファイルである。カタカナ部分に関しては作者の感覚で入力しているため、適当でないデータもあるかもしれないが、それらについては利用者自身が適宜修正されたい。

データファイルのダウンロード:pinkana.zip

ファイルをダウンロードできたら、Pinconvの「変換メニュー」から「データファイルの新規作成」を実行する。

ファイルの選択

ダイアログが表示されるので、ピンインをカタカナに変換するためのデータファイル(ピンカナ.txt)を選択した上で、新しい変換ファイルの名前を入力し、オプションを選択する。ダイアログ下部のOKを押すと登録処理が行われ、変換ファイルの設定画面が表示される。今回は特に設定を行う必要はないのでダイアログを閉じる。

設定ダイアログ

以上でピンインをカタカナにする変換データができたので実際に使ってみよう。

カタカナへの変換

発音のカタカナ表記の気に入らない部分を直したい場合は、先ほどの「ピンカナ.txt」を直接編集して再度インポートしても良いし、「編集」メニューの「変換データの編集」から修正することもできる。ぜひ自分好みにカスタマイズしていただきたい。

A氏のところの社長も、これでスマートにあいさつできる……かもしれない。

Pinconvの説明はこちらのエントリ、詳しい使い方についてはPinconvの使い方を参照下さい。窓の杜による紹介記事はこちらです。
  1. 本ファイルのライセンスはGFDLとする
]]>
http://www.karak.jp/articles/chinese/pinconv-pinkana.html/feed 0
sqliteの覚え書き – replace http://www.karak.jp/articles/blog/sqlite-replace.html http://www.karak.jp/articles/blog/sqlite-replace.html#comments Thu, 04 Mar 2010 02:08:50 +0000 ctrans http://www.karak.jp/?p=1152 先日、北辞郎のデータベースの内容を修正した。「一边~一边~」のように一部を省略した見出し語を登録できるようにしたのだが、これまで「~」(波線、中国語では波浪线、波折线)で表していた省略部分は、一般的な中日辞典に合わせて「……」(省略号)で表すことにした。こうなると過去に登録してあった「愈~愈~」なども「愈……愈……」に修正する必要がある。

ここで私の思考が停止した。さて、文字列の一部を置換するにはどういうSQLを実行すればいいんだっけか?

検索して調べた結果、TkSQLiteでreplace関数を利用すれば上述の置換処理を行うことができた。SQLiteのCore Functionsにもreplaceはあるみたいだが、こっちについては確認していないのでよく分からない(え)

実行例:
dictionaryというテーブルにchinese, pinyin, japaneseというカラムがあるとする。DBをTkSQLiteで開いて以下のSQLを実行する。

UPDATE dictionary SET chinese = replace(chinese, '~', '……');

蛇足:中国語のIMEで「……」を入力するには[Shift + 6]、「~」は[Shift + 全角/半角]を押す(日本語キーボードの場合)。

]]>
http://www.karak.jp/articles/blog/sqlite-replace.html/feed 0
Pinconv 4.02 http://www.karak.jp/articles/software/pinconv402.html http://www.karak.jp/articles/software/pinconv402.html#comments Mon, 01 Mar 2010 12:53:43 +0000 ctrans http://www.karak.jp/?p=1162 Pinconvのマイナーバージョンアップを行いました。ステータスバーをダブルクリックまたは右クリックして変換データファイルの切り替えが出来るようになったほか、いくつか不具合を修正しています。

Pinconvの紹介はこちらのエントリ、詳しい使い方についてはPinconvの使い方を参照下さい。窓の杜による紹介記事はこちらです。

修正点

ステータスバー

  • 変換データの切り替えをステータスバーから行えるように変更
  • 変換データの新規作成が正常に実行できない不具合の修正
  • 変換データのインポートが正常に実行できない不具合の修正
  • 置換後のハイライトが正常に動作しない不具合を修正
]]>
http://www.karak.jp/articles/software/pinconv402.html/feed 0
翻訳用の正規表現小技 http://www.karak.jp/articles/blog/regexp.html http://www.karak.jp/articles/blog/regexp.html#comments Sat, 27 Feb 2010 02:30:58 +0000 ctrans http://www.karak.jp/?p=1155 クライアントから特許の請求項の項番を日本の特許と同じように【請求項1】の形式に統一するようリクエスト。
中国の特許文書では「1、2、」という風に数字+顿号で番号を振ってあることが多い。一通り翻訳し終わってから手作業で【請求項1】の形式に直してもそれほど手間ではないが、正規表現を使えば作業は一瞬で終わる。

置換前:^([0-9]+)、
置換語:【請求項\1】

エディタで上掲の正規表現を使い「すべて置換」するだけである。
正規表現って素晴らしい。

]]>
http://www.karak.jp/articles/blog/regexp.html/feed 0
ロジクールのZ523 http://www.karak.jp/articles/blog/z523.html http://www.karak.jp/articles/blog/z523.html#comments Sat, 20 Feb 2010 14:02:53 +0000 ctrans http://www.karak.jp/?p=1138 週刊アスキーを読んでいたら、テレビの音響改善に適したロジクールのスピーカーシステムが紹介してあった。

ロジクール スピーカーシステム Z523BK ロジクール スピーカーシステム Z523BK

ロジクール 2009-08-28
売り上げランキング : 519
おすすめ平均

Amazonで詳しく見る by G-Tools

実は少し前に「色即ぜねれいしょん」を借りてきて自宅で鑑賞したのだが、会話がものすごく聞き取りにくく、テレビのボリュームを上げたり下げたりする苦行を強いられることになった。面白い映画だったため、この点がとても残念であり、「DVDにするときは家庭で鑑賞することをきちんと考慮すべきだ」と若きヴェルギリウスはこぶしを振り上げた。

以前も押井守氏の「スカイクロラ」を借りたときに、戦闘音ばかり大きくて会話がまったく聞こえず、途中で見るのを放棄したことがある。そういえば同氏の「イノセンス」も音のバランスが最悪だった。

ホームシアターみたいな環境があれば、こういう音のバランスのストレスから解放されるのかもしれないが、そんな予算はないし、たいていのDVDは問題なく鑑賞できるので放置していた。そこにアスキーの記事である。1万円未満で音響が改善されるなら試してみる価値はありそうだ。Amazonでの評価も高い。うむ……(ヴェルギリウスはしばし黙考するとおもむろにクリックした)。

で、そのZ523が届いたので早速つないでみた。音を絞ってオリンピック関係のニュースを見てみたら、それまで聞こえなかったベース音がずんどこ響き始めた。ニュースって意外といろんな効果音使ってるのね。解説の声もよく聞こえる。ほかのスピーカーを試したことはないが、この感覚はたいへん新鮮である。あとで試してみたのだが、台所で洗い物をしていてもテレビの音がよく聞こえるようになった(これまでは水の音でよく聞こえなかった)。すばらしい。色即ぜねれいしょんをもう1回借りて見てみよう。

]]>
http://www.karak.jp/articles/blog/z523.html/feed 0
IEとYouTubeとわたし http://www.karak.jp/articles/blog/ie-youtube-bug.html http://www.karak.jp/articles/blog/ie-youtube-bug.html#comments Fri, 19 Feb 2010 13:37:00 +0000 ctrans http://www.karak.jp/?p=1131 このブログをご覧になっているIさんから「IEでメニューのBlogをクリックするとエラーが出る」とのご指摘をいただく。あう。

dialog

エラーが出る際の「インターネットサイトを開けません。操作は中断されました」というメッセージを検索すると、私と同じような迷える子羊たちの阿鼻叫喚で画面が埋め尽くされた。なんということだ。

Google様によれば、「divタグをネストするとダメ」であり、「Javascriptが原因だから</body>の直前にスクリプトを置こう」とのことであり、「YouTubeもやばい」そうである。ちょっと待て。

divってネストしてないサイトの方が少なくないか。Javascriptの記述場所ってなんだ。そんなルールは父さん知らないぞ。YouTubeのembed云々ってそんなもんに不具合があったからって描画をやめて仕事放棄するのか。貴様それでも軍人か。だいたい問題が発生したならどこで発生したのかくらい示したらどうだ。だんまりを決め込んでからにこの唐変木のうすらとんかちめ。

と、ひとしきり罵倒してからYouTubeの動画を貼り付けていたエントリを非公開にしたら無事表示されるようになった。IEはやればできる子なのだ、と言いたいところだが、なんだろう、この胸を締め付ける想いは。

I様、本当にありがとうございました<(_ _)>

]]>
http://www.karak.jp/articles/blog/ie-youtube-bug.html/feed 0