对datafrmae某一列进行分词,并对分词后的所有字符串进行统计

import pandas as pd
import jieba

def cut_word(word):
	cw = jieba.cut(word)
    return list(cw)

df['cut_word'] = df['word'].apply(cut_word)

pd.Series(df['cut_word'].sum()).value_counts()


版权声明:本文为longwei92原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。