自然语言处理
结合电子政务应用大背景下,通过党政机关公文大数据研究、处理和分析,归纳公文表达特征,解决自然语言处理相关应用面临的技术挑战,重点突破自然语言的语法逻辑、字符向量表征和深度语义分析等核心技术,实现基于语义理解的公文智能分类、公文智能推荐、公文摘要的自动生成等应用需求,从而推进政府公文拟制、办理、管理等流程从数字化、网络化向智能化加速跃升。
成果:“远虑”政务信息智能分析系统
该系统能通过深度学习技术分析政务信息的语义信息,智能的对政务信息精准分类,推荐相关结果,并能自动生成简明的摘要内容。本系统的数据采集模块实现实时抓取公文,并把文本信息保存到数据存储层的数据库。数据预处理模块则基于业务需求对数据进行清洗整理,会经过在线计算模块的NLP引擎,进行分类、文本摘要、文本推荐、关键词提取模型,把模型结果再保存到数据库中。