2011-07-06 11 views
-2

프로젝트에 대한 나의 임무는 특정 이름에 대해 웹 사이트를 데이터 마이닝하는 것입니다. 파이썬에 대한 나의 경험은 높지 않다.Python/Scrapy 질문 : 더 깨끗한 결과를 얻으려면 어떻게해야합니까?

[u'Bob 조 ']
[u'Tim 톰']
[u'Anne 프랭크 ']
[u'superman': 나는 모든 이름을 긁어 때, 그들은이 형식으로 나올 ]

어떻게 이러한 값을 정리할 수 있습니까? 'u'는 무엇을 의미합니까? 내 xpath가 잘못 되었나요? 내가 치료 파이프 라인에서 청소해야합니까 (나는 이것을 피하고 싶습니다)? 나는 그저 주변에 여분의 쓰레기가 아니라 이름 만 원한다.

답변

1

파이썬 2에서 'u'접두사는 유니 코드 문자열임을 나타냅니다. [u'Bob Joe']은 유니 코드 문자열을 포함하는 목록입니다.

+0

접두사를 제거하는 방법을 설명해 주시겠습니까? 그래서 내가 입력하면 인쇄 item.name 그것은 전적으로 이름을 인쇄 할 것인가? 죄송합니다.이 질문이 정말 초보적인 것이지만 저는 새로운 Python이며 시간 제약으로 인해 언어 학습에 시간을 충분히 할애 할 수 없게됩니다. – Tom

+0

목록입니다. 목록의 0 번째 요소, 즉 문자열'print item.name [0]'을 인쇄 해보십시오. – MRAB

+0

당신이 나를 구 했어요! 고맙습니다! – Tom

관련 문제