[PHP]中国語単語分割ライブラリ – guoba
中国語の文字列を単語単位に分割するためのライブラリ guoba を公開します。 ダウンロード:guoba 1.07(ZIPファイル:3.65MB) 動作環境:PHP7.3.25にて動作確認。動作にはライブラリimdrが必...
中国語の文字列を単語単位に分割するためのライブラリ guoba を公開します。 ダウンロード:guoba 1.07(ZIPファイル:3.65MB) 動作環境:PHP7.3.25にて動作確認。動作にはライブラリimdrが必...
ある漢字が簡体字なのか繁体字なのか日本の漢字なのかを判定する関数が欲しかったので作成してみました。 ダウンロード:kcheck 0.1(ZIPファイル:9KB) 使用例 require_once 'kcheck...
中国語や日本語の情報に対してコンピューターで何らかの処理、たとえば統計的な処理、要約、キーワード抽出などを行いたいと思った場合、まずは文章を単語単位に分割する必要がある。欧米の言語と違い、中国語などは単語間にスペース(区...