以布局于全国多个IDC机房的分布式爬虫服务器集群,实现对人工定义的15万重点站点中的新闻、论坛、博客、问答等信息快速全面的抓取,另外系统能够自动识别支持多编码(如GBK、UTF-8、BIG等)和多语言,并能抓取境外网站信息、封闭系统等信息。
信息抽取技术自动从杂乱无章的HTML网页中提取文章标题、内容、作者、来源等信息,准确率98%以上。过滤技术自动过滤90%以上的垃圾贴、广告等无效信息。
对于突发事件,系统可以实现快速报警功能,自动发出预警信号,在最短时间内通过短信或邮件方式通知用户。
根据客户需要,系统可以生成各种格式的报告,方便用户查看。同时由专业的舆情分析师提供包括日报、周报、月报等各种报告格式,并可以针对重点突发事件做专题报告,帮助客户对于舆情状况深度掌控。
采用云计算的服务模式和人性化的操作界面,用户可以随时随地便捷的查看舆情信息。采用专业的加密模式,使用更加安全放心。
红麦舆情监测系统率先实现了微博舆情监测功能,可以实时对新浪微博、腾讯微博、网易微博、搜狐微博等主要微博平台进行监测,对于重要微博舆情快速预警。