python2.7과 lxml을 사용하여 페이지를 가져옵니다. 아래 오류가 계속 발생합니다.)python과 lxml을 사용하여 페이지를 크롤링했습니다. (<type 'exceptions.UnicodeEncodeError'>, UnicodeEncodeError ('ascii',
(<type 'exceptions.UnicodeEncodeError'>, UnicodeEncodeError('ascii', u'Approximate Dimensions: 4\xbd" x 4" x 7" (assembled)', 25, 26, 'ordinal not in range(128)'), <traceback object at 0x7f9198ac48c0>)
나는 다음과 같은 시도 :
doc = lxml.html.document_fromstring(html)
for el in doc.iter('h2'):
el.text_content().decode('utf-8','ignore')
OR
el.text_content().encode('ascii', 'ignore')
내가 이러한 오류를 해결하기 위해 어떻게) 일에 할 수있는 텍스트 파일 다음 2로 저장) MySQL로 텍스트 파일을 업로드해야합니다.
감사
흠하면
unicode
str
변환 적절한 인코딩을 디코딩한다 ('U'로 시작) ... 시도 ... .still the same result – Tampa그런 다음 더 많은 컨텍스트, 즉 추적 코드와이 코드가 참조하는 코드와 데이터베이스/테이블/열에 대해 설정 한 인코딩을 제공해야합니다. – thebjorn