使用Ansj进行分词及词性标注

1、下载源码或Jar包
https://github.com/NLPchina/ansj_seg
http://maven.nlpcn.org/org/ansj/ansj_seg/

2、下载训练库,并解压到项目根目录
http://maven.nlpcn.org/down/

3、写一些代码

	public static void tag(String sentence) throws Exception {
	    //下载训练库
	    //DownLibrary.main(args);
		
	    //List<Term> termsA = BaseAnalysis.parse(sentence);
	    //System.out.println(termsA);
	    //List<Term> termsB = ToAnalysis.parse(sentence);
	    //System.out.println(termsB);
	    List<Term> termsC = NlpAnalysis.parse(sentence);
	    System.out.println(termsC);
	    //List<Term> termsD = IndexAnalysis.parse(sentence);
	    //System.out.println(termsD);
	}

4、输入
zh.txt

别让别人告诉你你成不了才,即使是我也不行。
如果你有梦想的话,就要去捍卫它。
那些一事无成的人想告诉你你也成不了大器。
如果你有理想的话,就要去努力实现。
就这样。

5、输出
zhout.txt

[别让/nrf, 别人/r, 告诉/v, 你/r, 你/r, 成不了/l, 才/d, ,/w, 即使/c, 是/v, 我/r, 也/d, 不行/a, 。/w, 如果/c, 你/r, 有/v, 梦想/n, 的话/udh, ,/w, 就要/d, 去/v, 捍卫/v, 它/r, 。/w, 那些/r, 一事无成/i, 的/uj, 人/n, 想/v, 告诉/v, 你/r, 你/r, 也/d, 成不了/l, 大器/n, 。/w, 如果/c, 你/r, 有/v, 理想/n, 的话/udh, ,/w, 就要/d, 去/v, 努力/ad, 实现/v, 。/w, 就/d, 这样/r, 。/w]

Comments are closed.