需要金币:500 个金币 | 资料包括:完整论文 | ||
转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:6719 | ||
折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) |
下一篇:专业词语的泛化研究.doc
摘要:时代特征是常见的词语附加义。时代特征能够体现词语所在时代的气息,人们能够根据已有的经验和知识获取词语时代信息,并进一步推断词语所在语篇的时代。计算机自动识别时代特征难度则很大。对此,我们提出了基于历时语料库的词语时代特征自动获取方法,提高计算机对社会体验的缺陷;使用TF-IDF算法为词语加权算分,量化词语的时代风格,并依此计算语篇的时代风格。我们以54年(1946-1999)的人民日报语料进行实验,取得了较理想的结果。 关键词:时代特征,语篇年代,语义计算
目录 摘要 ABSTRACT 1-引言-1 2-时代特征和动态流通语料库-1 3-语料来源和统计分析-2 3.1-语料来源-2 3.2-时代统计分析-3 3.2.1-年代高频词-3 3.2.2-月份高频词-3 4-基于TF-IDF的词语时代特征获取-4 4.1-TF-IDF-4 4.2-时代风格量化-4 5-语篇时代风格计算-6 6-结论及未来工作-7 7-谢辞-7 8-参考文献-8 |