系统简介:
大数据文本聚类能够对大数据文档进行自动梳理,归纳热点趋势,把内容相近的信息归为一类,按照热度进行排名,并自动为该类生成标题和主题词。适用于自动生成热点排行、热门事件识别、热点趋势发现等诸多应用。
主要功能:
能够从大数据中分析出热点类别,按照热度进行排名,并自动为该类生成标题和主题词。
应用案例:
大数据文本聚类已经应用在舆情监测系统中,如下是针对新闻大数据生成的结果图。
图:新闻大数据聚类结果展示
技术特点:
1、聚类速度快;
2、准确率高;
3、自动得到类别主题词
运行环境:
操作系统:Linux2.6及以上;Windows Server
硬件配置:PC即可,内存2G以上