当前位置: 首页 > 文章 > 基于改进文本表示的农产品贸易摩擦新闻文本聚类及应用展望 农业展望 2020,16 (6) 80-88
Position: Home > Articles > Clustering of Agricultural Trade Friction News Text Based on Improved Text Representation and Its Application Prospect Agricultural Outlook 2020,16 (6) 80-88

基于改进文本表示的农产品贸易摩擦新闻文本聚类及应用展望

作  者:
潘尧;王末;王健
单  位:
中国农业科学院农业信息研究所/农业农村部农业大数据重点实验室
关键词:
农产品贸易摩擦;文本表示;词向量;文本聚类
摘  要:
传统文本表示方法应用于农产品贸易摩擦新闻文本上,数据维度高、稀疏性较大、结构信息和语义信息表达不充分,会造成文本聚类时间复杂度和计算复杂度较大等问题.为解决这些问题,在Word2Vec词向量表示方法的基础上,结合TF-IDF表示新闻文本,提出基于关键词文本表示矩阵KTRM方法,通过深度学习聚类DEC模型进行文本聚类.在有标注的新闻语料上进行包括参数调节实验、文本表示方法对比实验和聚类方法对比实验,并应用于实际的农产品贸易摩擦新闻文本.结果 表明,该方法聚类精度ACC及标准化互信息NMI均有显著提高,验证了该方法的有效性.最后,对该方法的应用前景进行了展望.
译  名:
Clustering of Agricultural Trade Friction News Text Based on Improved Text Representation and Its Application Prospect

相似文章

计量
文章访问数: 7
HTML全文浏览量: 0
PDF下载量: 1

所属期刊

推荐期刊