Textrank – 源码巴士

大体流程：（无监督方法）

EX : 欧式定理 and 余弦相似度算句子间相似度

句子向量间的相关性矩阵 ----> Similarity Matrix

3.Graph 造图 ----> 类似于 Link 和Matrix

4.Sentence Rankings 按照 Pagerank 和句子间相似度，选句子

转换成向量：

EX :

Tf--Idf : 根据频次和重要性转化向量

Length = word number (但容易稀疏)

Word2vec：非稀疏，低维---》分布表示法

Charcter—based(字符方式)：最小单元为字符，而得单词

或者借用LSTM和Bert 模型

计算两两间的相似度

（然后）

构建成 Matrix 的有向图

再通过 Pagerank 把每个图节点进行排序即可如：p(s1)>p(s2)>p(s3)>p(s4)