2017-04-14 1 views
6

나는 다음과 같은 명령파이썬 ntlk의 donwload 파서 eror

import nltk 
nltk.download('all') 

을 실행하려고하지만

Traceback (most recent call last): 
    File "./update.py", line 3, in <module> 
    nltk.download('all') 
    File "/usr/lib/python3.6/site-packages/nltk/downloader.py", line 664, in download 
    for msg in self.incr_download(info_or_id, download_dir, force): 
    File "/usr/lib/python3.6/site-packages/nltk/downloader.py", line 534, in incr_download 
    try: info = self._info_or_id(info_or_id) 
    File "/usr/lib/python3.6/site-packages/nltk/downloader.py", line 508, in _info_or_id 
    return self.info(info_or_id) 
    File "/usr/lib/python3.6/site-packages/nltk/downloader.py", line 875, in info 
    self._update_index() 
    File "/usr/lib/python3.6/site-packages/nltk/downloader.py", line 825, in _update_index 
    ElementTree.parse(compat.urlopen(self._url)).getroot()) 
    File "/usr/lib/python3.6/xml/etree/ElementTree.py", line 1196, in parse 
    tree.parse(source, parser) 
    File "/usr/lib/python3.6/xml/etree/ElementTree.py", line 597, in parse 
    self._root = parser._parse_whole(source) 
xml.etree.ElementTree.ParseError: not well-formed (invalid token): line 23, column 143 

내가 파이썬에 새로운 오전이 오류를 얻고 있습니다, 그래서 난 정말 확실하지 않다 무엇을 해야합니까? 위에서보고 한 소스 모듈을 조사한 결과 xml 파일을 다운로드하려고합니다. 그래서 나는 아래 명령을 실행하고 어떤 오류도주지 않았다.

compat.urlopen('https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml') 

그래서 다운로드에는 문제가 없지만 파서에는 문제가 없다고 가정합니다. 누군가 여기에서 어떻게 진행할 것을 제안 할 수 있습니까?

+0

같은 문제가 여기 – Bart

+0

나는 또한 –

+0

이 나와 함께 몇 시간 전 일이 시작 있어요 .. 감사합니다 – silentser

답변

1

NLTK가 반환 한 XML 문제가 있습니다. 23

xml.etree.ElementTree.ParseError: not well-formed (invalid token): line 23, column 143 

: 우리가 문제를 볼 (143)는 '='실종 : 나는 최고의 응답이 무엇인지 확실하지 않다 때까지

... unzip="1" unzipped_size"1917" url="https... 

NTLK 반드시, 빨리이 문제를 해결합니다.

6

index.xml은 오타가 있습니다. 이미 패치되었습니다. 그냥 확인하고 nltk.download('all') 잘 작동합니다!

참조 : nltk/nltk_data#70

+0

그래 지금은 잘 작동이 문제 – user3602300