大数据文本聚类

所属类别:大数据挖掘

系统简介:

大数据文本聚类能够对大数据文档进行自动梳理,归纳热点趋势,把内容相近的信息归为一类,按照热度进行排名,并自动为该类生成标题和主题词。适用于自动生成热点排行、热门事件识别、热点趋势发现等诸多应用。

主要功能:

能够从大数据中分析出热点类别,按照热度进行排名,并自动为该类生成标题和主题词。

应用案例:

大数据文本聚类已经应用在舆情监测系统中,如下是针对新闻大数据生成的结果图。

图:新闻大数据聚类结果展示

技术特点:

1、聚类速度快;

2、准确率高;

3、自动得到类别主题词

运行环境:

操作系统:Linux2.6及以上;Windows Server

硬件配置:PC即可,内存2G以上

Insert title here