添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
相关文章推荐
鬼畜的番茄  ·  Thread.Sleep 方法 ...·  2 月前    · 
苦恼的跑步机  ·  配置 Swagger UI - FastAPI·  2 月前    · 
酒量大的板栗  ·  log4j ...·  10 月前    · 

解决nltk download(‘punkt’)连接尝试失败

原文链接:https://blog.csdn.net/weixin_44633882/article/details/104494276

1. 尝试下载

import nltk
nltk.download()
>d punkt

这种方法在第二步就会抛出“连接尝试失败”,一方面因为nltk文件很大,另一方面当前的网络不太稳定。

2. 解决方法

不能直接下载,那只好看看它要下载什么文件,存到什么地方。然后我们自己去下载,放到指定的目录下。

运行需要的nltk分词代码

import nltk
nltk.word_tokenize("A pivot is the pin or the central point on which something balances or turns")

会抛出异常

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Applications\Anaconda3\lib\site-packages\nltk\tokenize\__init__.py", line 144, in word_tokenize
  ...
  File "C:\Applications\Anaconda3\lib\site-packages\nltk\data.py", line 701, in find
    raise LookupError(resource_not_found)
LookupError:
**********************************************************************
  Resource punkt not found.
  Please use the NLTK Downloader to obtain the resource:
  >>> import nltk
  >>> nltk.download('punkt')
  For more information see: https://www.nltk.org/data.html
  Attempted to load tokenizers/punkt/english.pickle
  Searched in:
    - 'C:\\Users\\11244/nltk_data'
    - 'C:\\Applications\\Anaconda3\\nltk_data'
    - 'C:\\Applications\\Anaconda3\\share\\nltk_data'
    - 'C:\\Applications\\Anaconda3\\lib\\nltk_data'
    - 'C:\\Users\\11244\\AppData\\Roaming\\nltk_data'
    - 'C:\\nltk_data'
    - 'D:\\nltk_data'
    - 'E:\\nltk_data'
    - ''
**********************************************************************

我们可以看到,尝试加载了tokenizers/punkt/english.pickle文件,但没有找到。系统会从'C:\\Users\\11244/nltk_data'这几个路径下进行搜索。

OK,我们知道了需要什么文件,应该将这个文件放到哪里。从哪里下载呢?

访问nltk_data,可以选择直接download下来需要的包,再按刚才的路径放好。大概14分钟才能下好吧。

github最近网不稳定,我们来找到另一个下载地址,而非github的下载地址。

从这里下载更快(●’◡’●),推荐放到迅雷!

下载好了punkt.zip文件,我选择放到C:\\Applications\\Anaconda3\\share\\nltk_data目录下,完成解压。

λ python
Python 3.6.5 |Anaconda, Inc.| (default, Mar 29 2018, 13:32:41) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.word_tokenize("A pivot is the pin or the central point on which something balances or turns")
['A', 'pivot', 'is', 'the', 'pin', 'or', 'the', 'central', 'point', 'on', 'which', 'something', 'balances', 'or', 'turns']

3. 小结

因为我在github上需要使用的项目,仅要求我下载nltk库中的punkt,所以我就这么下载了。

希望也能帮助到其他人!

  1. https://blog.csdn.net/qq_43376013/article/details/102883773
  2. https://blog.csdn.net/weixin_44574186/article/details/90748946
  3. https://www.cnblogs.com/zrmw/p/10869325.html
解决nltk download(‘punkt’)连接尝试失败原文链接:1. 尝试下载import nltknltk.download()&gt;d punkt这种方法在第二步就会抛出“连接尝试失败”,一方面因为nltk文件很大,另一方面当前的网络被墙的比较厉害。2. 解决方法不能直接下载,那只好看看它要下载什么文件,存到什么地方。然后我们自己去下载,放到指定的目录下。运行需要...
通常我们在终端是不能用nltk.download(‘punkt’)下载的 我把下载好的punkt.zip放到网盘里面了,应该是永久有效的,失效了可以联系我。 链接: https://pan.baidu.com/s/1aaFpRWKA2rKV-a2OD6r0cQ 密码: r98k 那么下载后的punkt放到哪里呢??? 我们打开python import nltk nltk.word_tokenize("dsd dcascacav ds") 不出意外的话,他应该是显示如下问题: 我们看它显示的Sear
NLTK下载报错[nltk_data] Error loading reuters: <urlopen error [Errno 11004] [nltk_data] getaddrinfo
后面在网上各种搜寻终于成功解决,步骤如下: 1.下载nltk_data包 百度链接:https://pan.baidu.com/s/14WikrjpFE8z9SBvwgi8tLw 提取码:请留言,我会发的,谢谢! 2....
今天准备理解一下 TF-IDF,于是下载安装nltk包,但是import word_tokenize后使用word_tokenize进行分词,报错: LookupError: Resource [93mpunkt[0m not found. Please use the NLTK Downloader to obtain the resource: nltk.download(‘punkt...
LookupError: ********************************************************************** Resource punkt not found. Please use the NLTK Downloader to obtain the resource: >>> import nltk >>> nltk.download('punkt') Fo...
因国际网络连接不稳定,很多国内的小伙伴在使用NLTK下载停用词表时都碰到过下载失败的情况。其实解决方法很简单,只要先下载官网停用词包,然后在手动复制到NLTK对应目录下就好了,具体方法如下: 1、首先打开官网,下载NLTK停用词文件包,如下图所示。(ps: 官网连接不好时,作者也提供自己从官网下载好的文件共大家使用) 2、将解压后的停用词文件复制到如下路径:C:\Users\你账户的用户名\AppData\Roaming\nltk_data\corpora,如下图所示。之后就可以正常使用啦~
nltk.download()命令运行失败解决方案 当我们在安装NLTK包时会使用nltk.download(),但是通常是连接不上服务器,经过搜索,发现一种解决的方案,在这里做个记录。 通常出错截图如下 解决方案 下载nltk的数据文件。链接:https://pan.baidu.com/s/1UTNZZwQDSjECdcpq5qXPPQ 提取码:jq3j 下载之后将其解压,放在上面图片所示的路径下面 注意nltk_data的文件夹下面就是所有文件,不要在嵌套一层,如下图所示
>>>import nltk >>>nltk.download() --------------------------------------------------------------------------- d) Download l) List u) Update c) Config h) Help q) Quit LookupError: ********************************************************************** Resource 'taggers/averaged_perceptron_tagger/averaged_perceptron _tagger.pickle' not found. Please use the NLTK Downloader to obtain the resource: >>> nltk.download() Searched in: - 'C:\\Users\\Dr
pycharm远程服务器运行Can‘t run remote python interpreter:Can‘t get remote credentials for deployment server 19079
m0_51723282: 官方文档上说nltk_data/gh-pages/packages/corpora/brown.zip is to be unzipped to nltk_data/corpora/brown.就是说不需要packages这一层 https://www.nltk.org/data.html Google Colab 保存和恢复模型(Pytorch) jjjokerrr: NameError: name 'torch' is not defined VSCode ssh Server卡在Setting up SSH Host XX: Downloading VS Code Server 再补充一点:在本地vscode中按F1输入Remote-ssh:kill vscode server on host. 先关掉这个服务,在进行上述步骤 VSCode ssh Server卡在Setting up SSH Host XX: Downloading VS Code Server 把这两个都删掉再按博主的方法做应该就行了. VSCode ssh Server卡在Setting up SSH Host XX: Downloading VS Code Server 亲测有用, 有额外的两点需要补充: 第一,把C:\Users\ZBT\.ssh下known_hosts里面对应的IP地址那一行删掉; 第二,把服务器中/home/wuyang/.vscode_servser这个文件夹删掉