解决nltk download('punkt')连接尝试失败_nltk.download()运行不了_coasxu的博客

link管理
链接快照平台
输入网页链接，自动生成快照
标签化管理网页链接
解决nltk download(‘punkt’)连接尝试失败

原文链接：https://blog.csdn.net/weixin_44633882/article/details/104494276
1. 尝试下载

import nltk
nltk.download()
>d punkt
这种方法在第二步就会抛出“连接尝试失败”，一方面因为nltk文件很大，另一方面当前的网络不太稳定。 
2. 解决方法
 
不能直接下载，那只好看看它要下载什么文件，存到什么地方。然后我们自己去下载，放到指定的目录下。 
运行需要的nltk分词代码 
import nltk
nltk.word_tokenize("A pivot is the pin or the central point on which something balances or turns")
会抛出异常 
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Applications\Anaconda3\lib\site-packages\nltk\tokenize\__init__.py", line 144, in word_tokenize
  ...
  File "C:\Applications\Anaconda3\lib\site-packages\nltk\data.py", line 701, in find
    raise LookupError(resource_not_found)
LookupError:
**********************************************************************
  Resource punkt not found.
  Please use the NLTK Downloader to obtain the resource:
  >>> import nltk
  >>> nltk.download('punkt')
  For more information see: https://www.nltk.org/data.html
  Attempted to load tokenizers/punkt/english.pickle
  Searched in:
    - 'C:\\Users\\11244/nltk_data'
    - 'C:\\Applications\\Anaconda3\\nltk_data'
    - 'C:\\Applications\\Anaconda3\\share\\nltk_data'
    - 'C:\\Applications\\Anaconda3\\lib\\nltk_data'
    - 'C:\\Users\\11244\\AppData\\Roaming\\nltk_data'
    - 'C:\\nltk_data'
    - 'D:\\nltk_data'
    - 'E:\\nltk_data'
    - ''
**********************************************************************
我们可以看到，尝试加载了tokenizers/punkt/english.pickle文件，但没有找到。系统会从'C:\\Users\\11244/nltk_data'这几个路径下进行搜索。 
OK，我们知道了需要什么文件，应该将这个文件放到哪里。从哪里下载呢？ 
访问nltk_data，可以选择直接download下来需要的包，再按刚才的路径放好。大概14分钟才能下好吧。 
github最近网不稳定，我们来找到另一个下载地址，而非github的下载地址。 
从这里下载更快(●’◡’●)，推荐放到迅雷！ 
下载好了punkt.zip文件，我选择放到C:\\Applications\\Anaconda3\\share\\nltk_data目录下，完成解压。 
λ python
Python 3.6.5 |Anaconda, Inc.| (default, Mar 29 2018, 13:32:41) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.word_tokenize("A pivot is the pin or the central point on which something balances or turns")
['A', 'pivot', 'is', 'the', 'pin', 'or', 'the', 'central', 'point', 'on', 'which', 'something', 'balances', 'or', 'turns']
3. 小结
 
因为我在github上需要使用的项目，仅要求我下载nltk库中的punkt，所以我就这么下载了。 
希望也能帮助到其他人！ 
 https://blog.csdn.net/qq_43376013/article/details/102883773
https://blog.csdn.net/weixin_44574186/article/details/90748946
https://www.cnblogs.com/zrmw/p/10869325.html 
                    解决nltk download(‘punkt’)连接尝试失败原文链接：1. 尝试下载import nltknltk.download()&gt;d punkt这种方法在第二步就会抛出“连接尝试失败”，一方面因为nltk文件很大，另一方面当前的网络被墙的比较厉害。2. 解决方法不能直接下载，那只好看看它要下载什么文件，存到什么地方。然后我们自己去下载，放到指定的目录下。运行需要...
				通常我们在终端是不能用nltk.download(‘punkt’)下载的
我把下载好的punkt.zip放到网盘里面了，应该是永久有效的，失效了可以联系我。
链接: https://pan.baidu.com/s/1aaFpRWKA2rKV-a2OD6r0cQ  密码: r98k
那么下载后的punkt放到哪里呢???
我们打开python
import nltk
nltk.word_tokenize("dsd dcascacav  ds")
不出意外的话，他应该是显示如下问题:
我们看它显示的Sear
					NLTK下载报错[nltk_data] Error loading reuters: ＜urlopen error [Errno 11004] [nltk_data] getaddrinfo
后面在网上各种搜寻终于成功解决，步骤如下：
1.下载nltk_data包
百度链接：https://pan.baidu.com/s/14WikrjpFE8z9SBvwgi8tLw
提取码：请留言，我会发的，谢谢！
2....
				今天准备理解一下  TF-IDF，于是下载安装nltk包，但是import word_tokenize后使用word_tokenize进行分词，报错：
LookupError:
Resource [93mpunkt[0m not found.
Please use the NLTK Downloader to obtain the resource:
nltk.download(‘punkt...
LookupError:
**********************************************************************
 Resource punkt not found.
 Please use the NLTK Downloader to obtain the resource:
 >>> import nltk
 >>> nltk.download('punkt')
 Fo...
				因国际网络连接不稳定，很多国内的小伙伴在使用NLTK下载停用词表时都碰到过下载失败的情况。其实解决方法很简单，只要先下载官网停用词包，然后在手动复制到NLTK对应目录下就好了，具体方法如下：
1、首先打开官网，下载NLTK停用词文件包，如下图所示。（ps: 官网连接不好时，作者也提供自己从官网下载好的文件共大家使用）
2、将解压后的停用词文件复制到如下路径：C:\Users\你账户的用户名\AppData\Roaming\nltk_data\corpora，如下图所示。之后就可以正常使用啦~
				nltk.download()命令运行失败解决方案
当我们在安装NLTK包时会使用nltk.download(),但是通常是连接不上服务器，经过搜索，发现一种解决的方案，在这里做个记录。
通常出错截图如下
解决方案
下载nltk的数据文件。链接：https://pan.baidu.com/s/1UTNZZwQDSjECdcpq5qXPPQ
提取码：jq3j
下载之后将其解压，放在上面图片所示的路径下面
注意nltk_data的文件夹下面就是所有文件，不要在嵌套一层，如下图所示
				>>>import nltk
>>>nltk.download()
---------------------------------------------------------------------------
    d) Download   l) List    u) Update   c) Config   h) Help   q) Quit
LookupError:
**********************************************************************
  Resource 'taggers/averaged_perceptron_tagger/averaged_perceptron
  _tagger.pickle' not found.  Please use the NLTK Downloader to
  obtain the resource:  >>> nltk.download()
  Searched in:
    - 'C:\\Users\\Dr
				pycharm远程服务器运行Can‘t run remote python interpreter:Can‘t get remote credentials for deployment server
					19079
                    m0_51723282: 
                    官方文档上说nltk_data/gh-pages/packages/corpora/brown.zip is to be unzipped to nltk_data/corpora/brown.就是说不需要packages这一层
https://www.nltk.org/data.html
                Google Colab 保存和恢复模型（Pytorch）
                    jjjokerrr: 
                    NameError: name 'torch' is not defined
                VSCode ssh Server卡在Setting up SSH Host XX: Downloading VS Code Server
                    再补充一点:在本地vscode中按F1输入Remote-ssh:kill vscode server on host. 先关掉这个服务,在进行上述步骤
                VSCode ssh Server卡在Setting up SSH Host XX: Downloading VS Code Server
                    把这两个都删掉再按博主的方法做应该就行了.
                VSCode ssh Server卡在Setting up SSH Host XX: Downloading VS Code Server
                    亲测有用,
有额外的两点需要补充:
第一,把C:\Users\ZBT\.ssh下known_hosts里面对应的IP地址那一行删掉;
第二,把服务器中/home/wuyang/.vscode_servser这个文件夹删掉