nltk是常用的自然语言工具包,但是由于默认的服务器是基于https的,很难连接。在下载nltk包的尤其是使用nltk.download()图像化界面的时候,经常会碰到无法连接的情况,或者连接很慢。下面介绍两种方法解决这个问题。
方法一:在弹出的NLTK Downloader界面将Server Index里的内容改成NLTK官网http://www.nltk.org/nltk_data/这个服务器。替换后如下图:
方法二:下载第三方扩展包
step 1 : 下载扩展包,以下途径任选其一。
(1)百度云:https://pan.baidu.com/s/1LWM3o7iRZMF8XaD91vx9Dw;提取码:cnpf。
(2)
码云:
nltk_data: NLTK Data - Gitee.com
(3)github:
GitHub - nltk/nltk_data: NLTK Data
(4)github镜像站:https://gitee.com/qwererer2/nltk_data/tree/gh-pages/
step 2 : 文件夹解压,将里面的packages重命名为nltk_data,放在Download Directory路径里。
※ 注:如果不清楚Download Directory路径路径在哪,可通过以下步骤查找路径
① 输入以下代码
import nltk
nltk.find('.')
② 打印结果:
Searched in:
'C:\Users\15839/nltk_data'
'E:\python_env\nlp\nltk_data'
'E:\python_env\nlp\share\nltk_data'
'E:\python_env\nlp\lib\nltk_data'
'C:\Users\15839\AppData\Roaming\nltk_data'
'C:\nltk_data'
'D:\nltk_data'
'E:\nltk_data'
③ 将nltk_data文件夹移到上述任意文件路径即可。
step 3 : 解压nltk_data文件夹里面对应的每个语料库的压缩文件,即zip文件解压才能用。
step 4 : 打开jupyter,输入以下代码,若出现下图所示画面,说明安装成功。
import nltk
from nltk.book import *
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)