GitHub - vre4/TextRank4ZH: :deciduous_tree:从中文文本中自动提取关键词和摘要

Skip to content

Navigation Menu

Sign in

Appearance settings

算法fork自 https://github.com/letiantian/TextRank4ZH

在此基础上修改源码,增添了自定义词典,以及介绍了修改源码、安装、再删除的方法

自定义词典

example/dict.txt里自定义词典 需要注意的是要标明词典的性质,如果不标,默认是字符串,即/x,会在Segmentation的segment方法里被当做特殊字符去除,整个程序运行的结果反而没有自定义词汇。

修改源码、安装、再删除的方法

修改TextRank4ZH/textrank4zh相关文件的代码

安装

python setup.py install --record files.txt

卸载

sudo cat files.txt | sudo xargs rm -rf  

这种就可以反复按需要调试了