segmentProject-summer

http://ir.hit.edu.cn/demos
哈工大

http://www.52nlp.cn/
语义相似度

依存分析、指代消解

http://licstar.net/archives/328
【必读】Deep Learning in NLP (一)词向量和语言模型

一文详解如何用 TensorFlow 实现基于 LSTM 的文本分类
https://www.leiphone.com/news/201704/5F6DpoQUpNk8Pbzs.html

LSTM 文本情感分析/序列分类 Keras
http://www.17bigdata.com/lstm-%E6%96%87%E6%9C%AC%E6%83%85%E6%84%9F%E5%88%86%E6%9E%90%E5%BA%8F%E5%88%97%E5%88%86%E7%B1%BB-keras.html

利用lstm模型实现短文本主题相似——qjzcy的博客

【*】深度学习—情感分析(Rnn,LSTM)
http://blog.csdn.net/nanjifengzi/article/details/72822456

语料库中有两个语料库可供选择:
https://github.com/ZixuanKe/Ch2r_ood_understanding

某师兄的paper全是Sentiment相关
http://ir.hit.edu.cn/~dytang/

如何用深度学习更好的的解一个短文本相似度计算问题?
https://www.zhihu.com/question/49424474/answer/167182802

CNN在中文文本分类的应用
http://www.cnblogs.com/cl1024cl/p/6205012.html

使用Python后台处理,用tcp与服务器通信,定时获取搜集的数据来进行
采用深度神经网络模型,预先训练的数据需要一定的量,如果数据太少会造成过拟合

(一) 文本相似度分析
1. 尝试利用lstm模型实现短文本主题相似
2. word2vec,分词之后计算词语的word2vec向量后,计算两条短文本之间的间距
3. 主题模型,例如LDA,将短文本词语投射到主题空间之后比较两句文本的主题相似性

(二) 文本主题分类(给出对应关键词最可能与什么有关联)
短文本分析任务中(例如微博),由于句子句长长度有限、结构紧凑、能够独立表达意思,优先考虑使用CNN进行分类

(三) 情感分析
1. 使用神经网络LSTM模型,无监督学习不需要人工标注
2. 依据最后数据量大小决定是否用GRU更替LSTM方法
3. 如果训练花费时间太久,或最后效果不如线性模型,则考虑更改为传统的人工标注数据的方法,基于分词Jieba使用TF-IDF等提取句子的关键词构建特征


版权声明:本文为lei396601057原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。