英语教材提取单词制作生词表
教材分解成单词
vim下:
- 以非英语字符为界,切割所有文本
:%s/\W/\r/g
- 删除重复单词,并排序
:sort u
- 删除含有数字的“单词”部分
:g/\d/d
查英语字典生成单词表
- Python
import pandas as pd
#读入单词和字典
words = pd.read_csv(版权声明:本文为gongqingkui原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。
vim下:
:%s/\W/\r/g
:sort u
:g/\d/d
import pandas as pd
#读入单词和字典
words = pd.read_csv(