CINO-:融合CINO与的藏文文本分类模型研究
(1.西藏大学信息科学技术学院 西藏拉萨
2.西藏大学藏文信息技术教育部工程研究中心 西藏拉萨
3.四川大学网络空间安全学院 四川成都 )
摘要:为提高藏文新闻文本分类准确性,文章提出一种融合少数民族语言预训练模型( Model, CINO)和图卷积神经网络模型(Text Graph ,)的方法,即CINO-模型。为有效评测该模型对藏文文本的分类性能,自建了较大规模和较高质量的藏文新闻文本公开数据集 TNEWS(),通过实验发现,CINO-在公开数据集TNCC上的准确率为74.20%,在TNEWS上为83.96%。因此,该融合模型能够较好地捕捉到藏文文本语义,提升藏文文本分类性能。
关键词:藏文;图卷积神经网络;融合模型;新闻文本;文本分类
基金项目:国家自然科学基金项目(,,).
第一作者简介:李果文本分类模型,男,汉族文本分类模型,贵州兴义人,西藏大学信息科学技术学院硕士研究生,主要研究方向为自然语言处理。
通讯作者简介:杨进,男,汉族,四川乐山人,四川大学网络空间安全学院教授,主要研究方向为网络空间安全、人工智能、深度学习。
中国高校特色科技期刊
中国高校优秀科技期刊
中国科学引文数据库(CSCD)来源期刊
科技期刊世界影响力指数(WJCI)来源期刊
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。