SEO対策
SEO BLOG | SEO 博客 | SEO ブログ

mecab - 词分析工具

MeCabは 京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトを通じて開発されたオープンソース 形態素解析エンジンです. 言語, 辞書,コーパスに依存しない汎用的な設計を 基本方針としています. パラメータの推定に Conditional Random Fields (CRF) を用 いており, ChaSenが採用している 隠れマルコフモデルに比べ性能が向上しています。また、平均的に ChaSen, Juman, KAKASIより高速に動作します. ちなみに和布蕪(めかぶ)は, 作者の好物です.



MeCabはオープンソースの形態素解析エンジンで、奈良先端科学技術大学院大学出身、現GoogleソフトウェアエンジニアでGoogle 日本語入力開発者の一人である工藤拓によって開発されている。名称は開発者の好物「和布蕪(めかぶ)」から取られた。

開発開始当初はChaSenを基にし、ChaSenTNGという名前で開発されていたが、現在はChaSenとは独立にスクラッチから開発されている。ChaSenに比べて解析精度は同程度で、解析速度は平均3-4倍速い。

品詞情報を利用した解析・推定を行うことができる。MeCabで利用できる辞書はいくつかあるが、ChaSenと同様にIPA品詞体系で構築されたIPADICが一般的に用いられている。

做这个工具的人叫工藤拓,毕业于奈良先端科学技術大学院大学,这个工具可以分析词性,只限于日文,但是感觉准确性一般,中文不行!
安装很简单,yum install mecab就行了!
使用更简单,mecab一个命令就ok了,然后把要分析的句子输入进去,就可以分析了

2010-01-21 16:08:24 撰写


相关文章:
  mecab - 词分析工具

日本来中国留学说明

什么叫多余?夏天的棉袄,冬天的蒲扇,还有等我已经心冷后你的殷勤

等待touch3破解,geohot is real man

cts-v这汽车真是太猛了!!!!

终于拿到了签证.....

雅歌塔克里斯多夫的《第三谎言》,已经看完了

两个前轮胎换成了普利司通的了,后面两个什么时候才能换呢????

在女朋友的允许下我终于买了ndsi

It was the best of times. It was the worst of times --《A Tale of Two Cities》

《神经浪游者》阅读到第18页。。。。没时间看了。。。可能再也看不完了

Philip Kindred Dick的《Minority Report》已经看完了。。。。。