NLPIR/ICTCLAS2014中科院分词系统Api接口 For 易语言

Categorized | 中文分词

Tags | API, ICTCLAS, NLPIR, 中文分词, 中科院分词系统, 易语言

NLPIR/ICTCLAS2014中科院分词系统Api接口 For 易语言

发布于 2014年04月09日作者：simon

NLPIR汉语分词系统（官网：http://ictclas.nlpir.org/）

NLPIR汉语分词系统(又名ICTCLAS2014),主要功能包括中文分词；词性标注；命名实体识别；用户词典功能；支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取。

中科院的NLPIR分词系统应该是目前公认做的比较好的，支持自定义词典、支持批量分词、关键词提取、词性标注、文章指纹识别，2014版本添加了新词(未登录词)的识别等。

之前因为准备用里面的一个接口，找了一番发现其官方并没有提供易语言的api接口文档及源码示例。。。很多人对NLPIR分词系统还是很有需求的，所以制作了一个易语言的模块，封装了最新2014版的所有接口以供调用。

1、关键词提取接口：NLPIR_GetKeyWords()、NLPIR_GetFileKeyWords()这两个接口，分别为从文本中提取关键词和从文件中提取关键词，支持指定数量的提取和TF/IDF权重的输出，用来做tag标签啥的，比较合适。

2、指纹识别接口：NLPIR_FingerPrint()返回的貌似是一个多维度十六进制的向量，可以用在检测文章相似度上面，比如计算两篇文章指纹向量的余弦相似度；或者对采集的多个文件进行去重等等。而且这个分词系统支持多线程，大批量运行应该没太大问题。

3、新词识别接口：除自己定义的词典，此接口支持将识别到的新词自动导入到自定义词典中。里面新词识别接口有2个，建议使用后添加的NLPIR_NWI_Start() API.

4、关于用户词典和核心词典中同时有的分词词汇，谁优先? 可以在data/Configure.xml中设置

中科院分词模块.ec 下载地址: http://pan.baidu.com/s/1mgqMfrE 密码: h1a5

模块使用很简单：

1、去官方下载通用的NLPIR/ICTCLAS2014分词系统下载包（2014.3.24发布的），并解压到本地，只需要里面的NLPIR.dll（要找一下）和data目录文件即可

2、之后直接用易语言调用模块即可，如果不会用模块调用，请注意看模块里的每个参数说明，或查看官方的接口文档说明。

文档信息

版权声明：自由转载-非商用-非衍生-保持署名 | Creative Commons BY-NC-ND 3.0
原文网址： https://sunweiwei.com/1658/
最后修改时间： 2014年04月09日 11:50:42

看了此文的人貌似还看了这些:

∵RESTful API 最佳实践(转) 2018-10-10

∵斗牛NLPIR中文分词工具V1.1 – 支持目录级文件的批量分词、新词识别 2014-05-19

∵winhttp api和com对象版区别 2017-05-10

∵新浪SAE中文分词接口 2014-01-24

∴斗牛NLPIR中文分词工具V1.1 – 支持目录级文件的批量分词、新词识别 2014-05-19

∴新浪SAE中文分词接口 2014-01-24

什么是死链接？ [ SEO新手入门]

亲，中秋国庆福利来了~【2012版倒计时】 [ Life/网络技术]

wordpress相关文章代码增强版 [ 网络技术]

什么是nofollow属性？nofollow有什么作用？ [ SEO/SEO新手入门]

发表评论

斗牛SEO工具集（免费）

精选内容
随便看看
最新评论

<推荐：PC端最专业的SEO综合工具>

分类目录
- Life (13)
- SEO (16)
- SEO新手入门 (12)
- 个人软件 (20)
- 中文分词 (3)
- 思维想法 (4)
- 推荐阅读 (42)
- 数据分析 (3)
- 网络技术 (45)

文章归档
- 2026 年 5 月 (2)
- 2026 年 3 月 (2)
- 2025 年 12 月 (2)
- 2025 年 10 月 (1)
- 2025 年 9 月 (2)
- 2025 年 1 月 (1)
- 2023 年 2 月 (2)
- 2018 年 11 月 (1)
- 2018 年 10 月 (1)
- 2017 年 10 月 (3)
- 2017 年 5 月 (1)
- 2017 年 3 月 (1)
- 2017 年 1 月 (1)
- 2015 年 11 月 (1)
- 2015 年 6 月 (1)
- 2015 年 5 月 (2)
- 2015 年 4 月 (1)
- 2015 年 2 月 (3)
- 2014 年 11 月 (1)
- 2014 年 10 月 (2)
- 2014 年 7 月 (1)
- 2014 年 6 月 (1)
- 2014 年 5 月 (3)
- 2014 年 4 月 (3)
- 2014 年 3 月 (2)
- 2014 年 2 月 (1)
- 2014 年 1 月 (2)
- 2013 年 12 月 (2)
- 2013 年 11 月 (1)
- 2013 年 10 月 (5)
- 2013 年 9 月 (6)
- 2013 年 8 月 (6)
- 2013 年 6 月 (1)
- 2013 年 5 月 (1)
- 2013 年 3 月 (1)
- 2012 年 10 月 (2)
- 2012 年 9 月 (3)
- 2012 年 8 月 (7)
- 2012 年 7 月 (12)
- 2012 年 6 月 (5)
- 2012 年 5 月 (4)
- 2011 年 2 月 (3)
- 2010 年 5 月 (2)

Categorized | 中文分词

NLPIR/ICTCLAS2014中科院分词系统Api接口 For 易语言

文档信息

看了此文的人貌似还看了这些:

发表评论

分类目录

友情链接

文章归档