投稿指南
一、稿件要求: 1、稿件内容应该是与某一计算机类具体产品紧密相关的新闻评论、购买体验、性能详析等文章。要求稿件论点中立,论述详实,能够对读者的购买起到指导作用。文章体裁不限,字数不限。 2、稿件建议采用纯文本格式(*.txt)。如果是文本文件,请注明插图位置。插图应清晰可辨,可保存为*.jpg、*.gif格式。如使用word等编辑的文本,建议不要将图片直接嵌在word文件中,而将插图另存,并注明插图位置。 3、如果用电子邮件投稿,最好压缩后发送。 4、请使用中文的标点符号。例如句号为。而不是.。 5、来稿请注明作者署名(真实姓名、笔名)、详细地址、邮编、联系电话、E-mail地址等,以便联系。 6、我们保留对稿件的增删权。 7、我们对有一稿多投、剽窃或抄袭行为者,将保留追究由此引起的法律、经济责任的权利。 二、投稿方式: 1、 请使用电子邮件方式投递稿件。 2、 编译的稿件,请注明出处并附带原文。 3、 请按稿件内容投递到相关编辑信箱 三、稿件著作权: 1、 投稿人保证其向我方所投之作品是其本人或与他人合作创作之成果,或对所投作品拥有合法的著作权,无第三人对其作品提出可成立之权利主张。 2、 投稿人保证向我方所投之稿件,尚未在任何媒体上发表。 3、 投稿人保证其作品不含有违反宪法、法律及损害社会公共利益之内容。 4、 投稿人向我方所投之作品不得同时向第三方投送,即不允许一稿多投。若投稿人有违反该款约定的行为,则我方有权不向投稿人支付报酬。但我方在收到投稿人所投作品10日内未作出采用通知的除外。 5、 投稿人授予我方享有作品专有使用权的方式包括但不限于:通过网络向公众传播、复制、摘编、表演、播放、展览、发行、摄制电影、电视、录像制品、录制录音制品、制作数字化制品、改编、翻译、注释、编辑,以及出版、许可其他媒体、网站及单位转载、摘编、播放、录制、翻译、注释、编辑、改编、摄制。 6、 投稿人委托我方声明,未经我方许可,任何网站、媒体、组织不得转载、摘编其作品。

自动化技术论文_基于信息论的TF-IDF算法在文本

来源:统计与信息论坛 【在线投稿】 栏目:期刊导读 时间:2022-02-11
作者:网站采编
关键词:
摘要:文章目录 引言 一、文本分类的一般过程 二、相关基础知识 1.词向量表示 2. Bi LSTM相关知识 三、融合信息论的TF-IDF算法 1.TF-IDF 2.信息论基础 (1)熵 (2)相对熵 3. 基于信息论的TF-IDF

文章目录

引言

一、文本分类的一般过程

二、相关基础知识

1.词向量表示

2. Bi LSTM相关知识

三、融合信息论的TF-IDF算法

1.TF-IDF

2.信息论基础

    (1)熵

    (2)相对熵

3. 基于信息论的TF-IDF

4. Word2vec结合改进后的TF-IDF

四、不同特征选择方法的Bi LSTM分类

1.实验数据

2.参数设置

3.分类性能评价指标

4.不同特征选择方法的Bi LSTM分类结果

五、结论

文章摘要:为了解决传统TF-IDF算法太过依赖词频,未考虑关键词在不同文本的不同分布对其权重影响的问题,提出一种基于信息论的TF-IDF特征选择和文本分类方法。首先,对文本进行分词以及去停用词的处理,然后使用Word2vec的skip-gram模型结合基于信息论的TF-IDF对处理后的文本进行特征选择,以更准确的表征文本,最后使用双向长短时记忆网络(BiLSTM)来进行访问上下文信息,得到文本分类的结果。结果表明,该方法与原始TF-IDF相比,分类的精确率、召回率和F1值都分别有所提升。

文章关键词:

论文分类号:TP391.1;TP18

文章来源:《统计与信息论坛》 网址: http://www.tjyxxltzzs.cn/qikandaodu/2022/0211/726.html



上一篇:电力工业论文_基于关系探索和KTBoost的暂态稳
下一篇:高等教育论文_面向计算机人才培养的信息论与编

统计与信息论坛投稿 | 统计与信息论坛编辑部| 统计与信息论坛版面费 | 统计与信息论坛论文发表 | 统计与信息论坛最新目录
Copyright © 2021 《统计与信息论坛》杂志社 版权所有 Power by DedeCms
投稿电话: 投稿邮箱: