CINO-:融合CINO与的藏文文本分类模型研究

果1,2 杨 进*3 陈 晨1,2

(1.西藏大学信息科学技术学院 西藏拉萨

2.西藏大学藏文信息技术教育部工程研究中心 西藏拉萨

3.四川大学网络空间安全学院 四川成都 )

摘要:为提高藏文新闻文本分类准确性,文章提出一种融合少数民族语言预训练模型( Model, CINO)和图卷积神经网络模型(Text Graph ,)的方法,即CINO-模型。为有效评测该模型对藏文文本的分类性能,自建了较大规模和较高质量的藏文新闻文本公开数据集 TNEWS(),通过实验发现,CINO-在公开数据集TNCC上的准确率为74.20%,在TNEWS上为83.96%。因此,该融合模型能够较好地捕捉到藏文文本语义,提升藏文文本分类性能。

关键词:藏文;图卷积神经网络;融合模型;新闻文本;文本分类

基金项目:国家自然科学基金项目(,,).

第一作者简介:李果文本分类模型,男,汉族文本分类模型,贵州兴义人,西藏大学信息科学技术学院硕士研究生,主要研究方向为自然语言处理。

通讯作者简介:杨进,男,汉族,四川乐山人,四川大学网络空间安全学院教授,主要研究方向为网络空间安全、人工智能、深度学习。

文本模型分类包括_文本模型分类有哪几种_文本分类模型

文本模型分类包括_文本模型分类有哪几种_文本分类模型

文本分类模型_文本模型分类包括_文本模型分类有哪几种

文本模型分类包括_文本分类模型_文本模型分类有哪几种

文本模型分类包括_文本模型分类有哪几种_文本分类模型

中国高校特色科技期刊

中国高校优秀科技期刊

中国科学引文数据库(CSCD)来源期刊

科技期刊世界影响力指数(WJCI)来源期刊

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注