NLP 词向量

词向量

为什么要用词向量,因为文本作为训练数据是必须转化为矩阵

词向量种类

1. bag of word
  1. one-hot
  2. tf-idf
  3. textRank
2. topic model
  1. LSA(SVD)
  2. PLSA
  3. LDA
3. word embedding 固定表征
  1. word2vec
  2. fasttext
  3. glove
4. word dynamic embedding 动态表征
  1. elmo
  2. GPT
  3. BERT

版权声明:本文为hvgdfx原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。