文本关键词提取

所属类别:大数据挖掘

注:灵玖所有免费下载软件及中间件授权均为1月,如下载任何软件及中间件涉及到授权延长问题请拨打电话:62648216 62648067

文章关键词提取中间件能够在全面把握文章的中心思想的基础上,提取出若干个代表文章语义内容的词汇或短语,相关结果可用于精化阅读、语义查询和快速匹配等。

采用基于语义的统计语言模型,所处理的文档不受行业领域限制,且能够识别出最新出现的新词语,所输出的词语可以配以权重。

文本关键词提取组件的主要特色在于:

1、速度快:可以处理海量规模的网络文本数据,平均每小时处理至少50万篇文档;

2、处理精准:Top N的分析结果往往能反映出该篇文章的主干特征;

3、精准排序:关键词按照影响权重排序,可以输出权重值;

4、开放式接口:文章关键词提取组件作为LJParser的一部分,采用灵活的开发接口,可以方便地融入到用户的业务系统中,可以支持各种操作系统,各类调用语言。

图:关键词提取结果展示

Insert title here