中国語の単語分割

中国語や日本語の情報に対してコンピューターで何らかの処理、たとえば統計的な処理、要約、キーワード抽出などを行いたいと思った場合、まずは文章を単語単位に分割する必要がある。欧米の言語と違い、中国語などは単語間にスペース(区...

対訳データベースを作りたい

ずいぶん前に手持ちの中国語辞書データを提供する件で某社に出向いたことがあります。まだ北辞郎をつくる前の話で、手持ちのデータも5~6万語くらいの規模だったと記憶しています。いろいろ話をして、結局データ提供の件は流れたのです...