2017-04-08 1 views
0

내 코드 - 각 이력서가 포함 된 링크 목록이 포함 된 csv 파일을 열어 이력서, 기본 정서 및 해당 링크에 텍스트를 인쇄합니다. - 때때로 만 작동합니다.실행시 Jupyter 노트는 아무 것도 출력하지 않습니다.

원래 코드가 작동하지 않았다고 생각했지만 사실 지금까지 몇 번이나 인쇄물을 인쇄하는 데 성공했지만 드문 경우입니다.

'test.csv'파일에는 링크가 3 개로 매우 작습니다. 노트북은 생각하지 않는 것 같습니다.

Graph Lab Create에서 Jupyter 노트북을 사용하고 있으며 Microsoft 설치 및 OSX 설치에서 인쇄물을 성공적으로 가져 왔습니다. 지금은 Mac에 있는데 Shift + Enter를 누르면 아무 일도 일어나지 않습니다. 어떤 결과도없이 [num]로 돌아 가기 전에 나는 순간적인 [*]을 얻는다.

나는 세 개의 개별 셀로 분할하고 동시에 실행하려고 시도했다. 코드가 세 개의 셀로 분리 된 후에 만 ​​작동합니다.

이전에이 문제가 발생 했습니까? 어떤 조언도 크게 감사 할 수 있습니다.

파이썬 문제로 인해 당신은 루프 내부 words, dec_sent을 정의하고 links 전혀하지만, 이전의 세포에서 다시 사용할 수 있다는 사실을 가능성이 2.7

import urllib 
from bs4 import BeautifulSoup 
from textblob import TextBlob 

all_links = open('test.csv', 'r') 

for links in all_links: 
    html = urllib.urlopen(links).read() 
    soup = BeautifulSoup(html, "lxml") 

    for script in soup(["script", "style"]): 
     script.extract() 

     text = soup.get_text() 

     lines = (line.strip() for line in text.splitlines()) 
     chunks = (phrase.strip() for line in lines for phrase in line.split(" ")) 
     text = '\n'.join(chunk for chunk in chunks if chunk) 

     words = text.encode('utf-8') 
     sent = words.decode('utf-8') 

     dec_sent = TextBlob(sent) 

     print links, words, dec_sent.sentiment.polarity 

답변

0

...

html이 비어있는 경우 루프가 실행 중이 지 않으므로 vars가 정의되지 않았으므로 오류가 발생하거나 이전 실행 값이 인쇄됩니다.

jupyter 커널을 다시 시작하고 모든 셀을 다시 실행하십시오. 정의 된 변수를 보려면 print locals()을 입력하십시오.

+0

답장을 보내 주셔서 감사합니다. 커널을 다시 시작하고 run-all을 사용하면 동일한 결과를 얻습니다. 그것 [*] s 몇 초 동안 아무것도 인쇄하지 않습니다. all_links의 링크에 을 추가하는 경우 : 인쇄 링크 열린 줄 아래에 아무 것도 인쇄되지 않습니다. 여기서 나는 적어도 나를 위해 인쇄 된 csv의 내용을 얻을 것이라고 생각할 것이다. 하지만 아무것도 아니야. –

+0

또한 위의 코드를 잘못 작성한 것에 대해 사과드립니다. 나는 그것이 지금 달리고있는 실제 방법과 함께 그것을 정장에 고쳤다. –

관련 문제