PHPで日本語の形態素解析

対訳データベースの実装に際し、中国語の原文と日本語の訳文を形態素解析で単語単位にばらし、それをインデックスにしようとしたのですが、PHPで形態素解析ってどういうライブラリがあるのかしらん、と疑問の壁に激突したのでメモ。 […]

続きを読む →

nl2br

PHPには文字列中の改行をHTMLのbrタグに変換してくれるnl2brという関数がある。便利なのだが、textareaに入力された内容をそのまま投げると「rn」が「<br><br>」に変換されてし […]

続きを読む →

異体字同一視検索

オンライン辞書の北辞郎には、利用者が検索した際、データベースにその語句が含まれていないと候補の単語を提示する機能を設けてある。 今回システムの更新を行い、異体字を同一視して候補を表示する機能を追加した。備忘録をかねて内部 […]

続きを読む →