使用HanLP进行分词及词性标注

1、下载Jar、配置文件及训练库
http://hanlp.linrunsoft.com/services.html

2、修改配置文件中的根目录,到训练库的根目录

3、写一些代码

	public static void tag(String sentence) throws Exception {
		List<Term> terms = StandardTokenizer.segment(sentense);
		System.out.println(terms);

		//terms = NLPTokenizer.segment(sentense);
		//System.out.pr1intln(terms);
		
		//terms = IndexTokenizer.segment(sentense);
		//System.out.println(terms);
		
		//terms = SpeedTokenizer.segment(sentense);
		//System.out.println(terms);
		
		//terms = new NShortSegment().seg(sentense);
		//System.out.println(terms);
		
		//terms = new DijkstraSegment().seg(sentense);
		//System.out.println(terms);
        }

4、输入
zh.txt

别让别人告诉你你成不了才,即使是我也不行。
如果你有梦想的话,就要去捍卫它。
那些一事无成的人想告诉你你也成不了大器。
如果你有理想的话,就要去努力实现。
就这样。

5、输出
zhout.txt

[别/d, 让/v, 别人/rr, 告诉/v, 你/rr, 你/rr, 成不了/l, 才/d, ,/w, 即使/c, 是/vshi, 我/rr, 也/d, 不行/a, 。/w, 如果/c, 你/rr, 有/vyou, 梦想/n, 的/ude1, 话/n, ,/w, 就要/d, 去/vf, 捍卫/v, 它/rr, 。/w, 那些/rz, 一事无成/vl, 的/ude1, 人/n, 想/v, 告诉/v, 你/rr, 你/rr, 也/d, 成不了/l, 大/a, 器/ng, 。/w, 如果/c, 你/rr, 有/vyou, 理想/n, 的话/udh, ,/w, 就要/d, 去/vf, 努力/ad, 实现/v, 。/w, 就/d, 这样/rzv, 。/w]

Comments are closed.