python-nltk на Ubuntu 12.04 LTS: nltk.download ('коричневый') приводит к ошибке HTML 401

Я установил python-nltk на Сервере Ubuntu, который получают 12,04 склонных использований-.

Но когда я пытаюсь загрузить корпус, я получаю следующую ошибку:

$ python
Python 2.7.3 (default, Feb 27 2014, 19:58:35)
[GCC 4.6.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.download('brown')
[nltk_data] Error loading brown: HTTP Error 401: Authorization
[nltk_data]     Required
False

Я пропускаю некоторую конфигурацию или дополнительный пакет?

9
задан 25 June 2015 в 23:47

3 ответа

Эти DEFAULT_URL используемый в downloader.py из Ubuntu упаковал версию, все еще использует:

DEFAULT_URL = 'http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml'

, Но текущий сервер данных:

DEFAULT_URL = "http://nltk.github.com/nltk_data/"

можно, конечно, установить из источника или... изменить уже установленную версию для указания на новый сервер как это:

 sudo perl -pi -e 's#DEFAULT_URL = .*#DEFAULT_URL = "http://nltk.github.com/nltk_data/"#' /usr/lib/python2.7/dist-packages/nltk/downloader.py

можно тогда установить "коричневый" корпус:

$ python
Python 2.7.6 (default, Mar 22 2014, 22:59:56) 
[GCC 4.8.2] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.download('brown')
[nltk_data] Downloading package 'brown' to /home/sylvain/nltk_data...
[nltk_data]   Unzipping corpora/brown.zip.
True
>>> from nltk.corpus import brown
>>> brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]
>>> 
12
ответ дан 23 November 2019 в 04:47

Возможно зафиксировать это, не изменяя исходный код. Создайте пользовательский загрузчик в Python:

>>> dl = nltk.downloader.Downloader("http://nltk.github.com/nltk_data/")

тогда Вы открываете диалоговое окно графического интерфейса пользователя:

>>> dl.download()

Проверка Вы имеете доступ для записи к каталогу загрузки и загружаете то, в чем Вы нуждаетесь.

12
ответ дан 23 November 2019 в 04:47
pip install nltk --upgrade

Эти обновления nltk и затем nltk.download() работы снова.

0
ответ дан 23 November 2019 в 04:47

Другие вопросы по тегам:

Похожие вопросы: