
WindowsにはLCMapStringという関数が用意されている。文字列の全角/半角やひらがな/カタカナの変換機能を提供する関数で、簡体字/繁体字の変換もサポートしているのだが、この関数の変換テーブルには間違いがあるようだ。
テキストエディターのEmEditorで提供されている簡繁変換のプラグインもこの関数を利用しているのだが、繁体字の潟を変換すると泻に変換されてしまう。泻の繁体字は瀉で潟とは全く別の字である。「干潟」が「干泻(ひからびた下痢)」になったり、「新潟」が「新泻(新しい下痢)」になったりして困る。
大陸のWEBサイトなどでたまに「新泻县」を目にするのは、この関数が原因のひとつと考えられる。
追記:Googleで台湾のサイトを対象に「潟」の検索をすると「潟」と「泻」が同一視される。問題の根は深い。
繁体字の埓と埒の字体について、昨日のエントリでは確認しなかったが、他の繁体字フォントも試してみた。以下はGRF FontとMingLiuの比較である。GRFの方は期待通りだ。


「埒が明かない」などに使う「埒」という漢字は、MS明朝などの日本語フォントでは上図左のように表示され、繁体字のMingLiuでは真ん中のように、簡体字のSimSunでは右のように表示される。少しずつ形が違うが、いずれもUnicodeでは57D2という番号が与えられている同じ漢字である。「同じ漢字でも国によって形が違うんですなあ、面白いですなあ」とのんきに流しておきたいところだが、この字の場合は異体字に「埓」(U+57D3)があるのでややこしい。
現在、Pinconvで繁体字を日本の漢字に変換するデータファイルを作成しているのだが、繁体字の「埒」に対応するデータをどうするかで脳内会議が紛糾した。字形が同じなんだから繁体字から日本の漢字への変換なら57D2→57D3でもいいんじゃない?そんなこと言ったら「吞(U+541E)」と「呑(U+5451)」なんかぱっと見違いがないから変換しないでいいという話になるだろう。いやそうはならんだろう。そもそもこれはMingLiuの問題じゃないのか。ほかのフォントだとどうなんだ。文字コードに字形の話を持ち込むなよ。いや今してるのは変換の話だ。黙れ小童。なんだとこのヤロウ、わーわー。……侃々諤々、丁々発止である。
MS-IMEでは「不埒」と「放埓」で違う文字が出力されるそうだが他人事ではない。MingLiuの埒の字形が10pt以下ではSimSunと同じになったりして混乱に拍車をかける。困った時の駆け込み寺である教育部異體字字典でも軽く門前払いされた。うーむ。
結局、異体字に変換するわけにもいかんだろうということでU+57D2のままにしている。こんなのがたくさん出てこないことを祈る。
参考:旧い漢字の使い方~旧字・異体字・俗字~ 【埒】と【埓】
関連:字典中 埒 字的解释
外出時に太陽光が目に差し込むとエビ反りになっていやがる息子のためにサングラスを購入した。ちょっと貫禄が出過ぎている気がするけど、これで問題解決だな>息子。

関連:BABYBANZ
政治家というのは、国のあるべき姿を提示するのが仕事で、細かい実務は優秀な東大出の官僚たちが徹夜して片付けるものだと思っていた。それが民主党が政権を取ってからなんかおかしい。事業仕分けなんて本当に必要なのか大いに疑問だ。政治家の仕事ではなくて、それこそ木っ端役人の仕事という気がする。重箱の隅をつついて、この国が少しでも前に進んだのだろうか。
普天間の問題では、はじめから落としどころはこのあたりだろうと見当をつけて、議論のまねごとをし、与党の人間が視察ばかりしているのが腹が立つ。米軍を国外に追い出したいのなら、その前に代替抑止力として我が国の再軍備をきちんと議論すべきだろう。国防を他の国の軍隊に任せるから他人事のようになっている。
Twitterにちまちま投稿している政治家が多いのにも腹が立つ。ぶつ切れの情報を投稿し、いちいちこちらの顔色を伺っているようで気持ちが悪い。百歩譲ったとしてせめて国産のマイクロブログを使うべきだろう。外国のサービスを締め出して雇用を確保している(もちろんそれだけが目的じゃないが)中国を見習って欲しい。
自民党は自民党でせっかく相手が脱税して失言して迷走してくれているのに、それを利用して相手を自分のペースに引き込み、持論を展開することすらしない。どんな汚い手でも使えば良いのに使わない。きれい事ばかり言っているうちに時間だけが過ぎている[]。
零細自営業者が大上段に構えて何を偉そうにと思うかもしれない。だが、今の日本に必要なのはひとりひとりが大上段に構えて国のあり方を考えることだと思う。どこで誰か偉い人ががんばっているから明日も今日と同じ穏やかな日になるだろうとぼんやり期待できた時代は過ぎ去ってしまった。最近、新聞を読めば読むほど胸が不安でざわざわする。
先日、北辞郎のデータベースの内容を修正した。「一边~一边~」のように一部を省略した見出し語を登録できるようにしたのだが、これまで「~」(波線、中国語では波浪线、波折线)で表していた省略部分は、一般的な中日辞典に合わせて「……」(省略号)で表すことにした。こうなると過去に登録してあった「愈~愈~」なども「愈……愈……」に修正する必要がある。
ここで私の思考が停止した。さて、文字列の一部を置換するにはどういうSQLを実行すればいいんだっけか?
検索して調べた結果、TkSQLiteでreplace関数を利用すれば上述の置換処理を行うことができた。SQLiteのCore Functionsにもreplaceはあるみたいだが、こっちについては確認していないのでよく分からない(え)
実行例:
dictionaryというテーブルにchinese, pinyin, japaneseというカラムがあるとする。DBをTkSQLiteで開いて以下のSQLを実行する。
UPDATE dictionary SET chinese = replace(chinese, '~', '……');
蛇足:中国語のIMEで「……」を入力するには[Shift + 6]、「~」は[Shift + 全角/半角]を押す(日本語キーボードの場合)。
クライアントから特許の請求項の項番を日本の特許と同じように【請求項1】の形式に統一するようリクエスト。
中国の特許文書では「1、2、」という風に数字+顿号で番号を振ってあることが多い。一通り翻訳し終わってから手作業で【請求項1】の形式に直してもそれほど手間ではないが、正規表現を使えば作業は一瞬で終わる。
置換前:^([0-9]+)、
置換語:【請求項\1】
エディタで上掲の正規表現を使い「すべて置換」するだけである。
正規表現って素晴らしい。
週刊アスキーを読んでいたら、テレビの音響改善に適したロジクールのスピーカーシステムが紹介してあった。
実は少し前に「色即ぜねれいしょん」を借りてきて自宅で鑑賞したのだが、会話がものすごく聞き取りにくく、テレビのボリュームを上げたり下げたりする苦行を強いられることになった。面白い映画だったため、この点がとても残念であり、「DVDにするときは家庭で鑑賞することをきちんと考慮すべきだ」と若きヴェルギリウスはこぶしを振り上げた。
以前も押井守氏の「スカイクロラ」を借りたときに、戦闘音ばかり大きくて会話がまったく聞こえず、途中で見るのを放棄したことがある。そういえば同氏の「イノセンス」も音のバランスが最悪だった。
ホームシアターみたいな環境があれば、こういう音のバランスのストレスから解放されるのかもしれないが、そんな予算はないし、たいていのDVDは問題なく鑑賞できるので放置していた。そこにアスキーの記事である。1万円未満で音響が改善されるなら試してみる価値はありそうだ。Amazonでの評価も高い。うむ……(ヴェルギリウスはしばし黙考するとおもむろにクリックした)。
で、そのZ523が届いたので早速つないでみた。音を絞ってオリンピック関係のニュースを見てみたら、それまで聞こえなかったベース音がずんどこ響き始めた。ニュースって意外といろんな効果音使ってるのね。解説の声もよく聞こえる。ほかのスピーカーを試したことはないが、この感覚はたいへん新鮮である。あとで試してみたのだが、台所で洗い物をしていてもテレビの音がよく聞こえるようになった(これまでは水の音でよく聞こえなかった)。すばらしい。色即ぜねれいしょんをもう1回借りて見てみよう。
このブログをご覧になっているIさんから「IEでメニューのBlogをクリックするとエラーが出る」とのご指摘をいただく。あう。

エラーが出る際の「インターネットサイトを開けません。操作は中断されました」というメッセージを検索すると、私と同じような迷える子羊たちの阿鼻叫喚で画面が埋め尽くされた。なんということだ。
Google様によれば、「divタグをネストするとダメ」であり、「Javascriptが原因だから</body>の直前にスクリプトを置こう」とのことであり、「YouTubeもやばい」そうである。ちょっと待て。
divってネストしてないサイトの方が少なくないか。Javascriptの記述場所ってなんだ。そんなルールは父さん知らないぞ。YouTubeのembed云々ってそんなもんに不具合があったからって描画をやめて仕事放棄するのか。貴様それでも軍人か。だいたい問題が発生したならどこで発生したのかくらい示したらどうだ。だんまりを決め込んでからにこの唐変木のうすらとんかちめ。
と、ひとしきり罵倒してからYouTubeの動画を貼り付けていたエントリを非公開にしたら無事表示されるようになった。IEはやればできる子なのだ、と言いたいところだが、なんだろう、この胸を締め付ける想いは。
I様、本当にありがとうございました<(_ _)>
朝7時過ぎに起床。息子が起床したので妻は授乳。雨戸を開け、新聞を取り、久しぶりに晴れている空を見て元気になる。
朝食はホットケーキ。
午前は仕事。隣室で息子が泣いたが、妻があやしたらすぐに寝た。
昼過ぎに息子起床。昼食の用意をする妻と交代して息子をあやす。
昼食はおむすびと味噌汁、辛い(赤い)ぶり大根。
昼食後、息子を妻に任せて掃除。はたきをかけて、掃除機かけて、ぞうきんモップで床を拭く。実に気持ちいい。
抱っこひもを付けて息子を抱き、3人で近所の西友にでかける。息子の靴下とおむつ、便所用に突っ張り棚、1500円くらいのワイン(なんかの金賞を取ったらしい)を購入し、天神通り商店街で買った今川焼きを食べながら帰宅。今川焼きがとても美味しかった。また買おう。天神様の骨董市が終わっていて残念。
いったん帰宅してから借りていたビデオを返却するためツタヤまで自転車を走らせ、戻ってから玄関先を掃き、お茶を淹れ、取引先にメールを書き、洗濯物をたたむ。
息子が起きたので膝に抱いて上村愛子選手の活躍ぶりをテレビで見る。
夕食は肉じゃがと白菜の和え物と豆腐。食事をしている我々に相手してもらえなくて息子号泣。
息子と風呂。ザブンと勢いよく入ったのが気に入らなかったようでまたも号泣。ごめん。
息子が泣き疲れて寝た後、メールを一本。これで今日の仕事はおしまい。
ワインを開ける。おお、期待してなかったけどいける。1日の締めくくりにふさわしい。