0
연구 프로젝트를 위해 온라인 포럼에 하이퍼 링크로 저장된 URL을 모두 저장하려고합니다.BeautifulSoup를 사용하여 csv로 html로 스크랩 URL
내가 '인쇄'할 때 html 스크래핑 결과가 제대로 작동하는 것처럼 보이지만 원하는 모든 URL을 인쇄한다는 의미에서 CSV의 행을 구분할 수 없습니다.
나는 분명히 뭔가 잘못하고있다. 그러나 나는 무엇을 몰라! 그래서 어떤 도움을 주시면 감사하겠습니다.
import urllib2
from bs4 import BeautifulSoup
import csv
import re
soup = BeautifulSoup(urllib2.urlopen('http://forum.sex141.com/eforum/forumdisplay.php? fid=28&page=5').read())
urls = []
for url in soup.find_all('a', href=re.compile('viewthread.php')):
print url['href']
csvfile = open('Ss141.csv', 'wb')
writer = csv.writer(csvfile)
for url in zip(urls):
writer.writerow([url])
csvfile.close()
감사합니다. 정말 잘되었습니다. – Isak