2012-11-22 1 views
0

웹 사이트를 스크랩하기 위해 치료를 사용하고 있습니다. 내 아이템은 내가이 u의 아픈 생각이파이썬 텍스트의 모든 텍스트 앞에 'u'가 표시되는 이유

{'company': [u'Resource Agility'],

처럼 나타나고있다.

정상입니까?

나는 데이터베이스에 내 가치를 저장하는 경우 u도 거기에 들어가는 지 알고 싶습니다.

u을 숨길 방법이 있습니까?

+0

psst! 이 문자열은 유니 코드로되어 있습니다.이 문자열은 원시 문자열입니다. 즉, 백 슬래시 (\)는 따옴표 (\ ')'를 제외하고 아무 것도 이스케이프하지 않습니다. ' – inspectorG4dget

답변

4

아니요 ... 당신은 파이썬 2.x에서 단지 syntactic sugar for unicode strings입니다. 데이터베이스에 저장되지 않습니다.

+1

텍스트가 유니 코드 인 경우 데이터베이스와 관련이 있습니다. 텍스트를 저장하기 전에 텍스트를 ['encode'] (http://docs.python.org/2/library/stdtypes.html#str.encode)해야 할 수도 있습니다 (데이터베이스가 대신 할 수도 있음). – Blckknght

+0

고마워, 그 '유'가 나를 미치게했다. 나는 그것을 대체 할 REGEX 모든 종류의 시도 : – user825904

+0

도움이 될 것이라고 다행, @ user32 – hd1

1

콘솔에서 유니 코드 문자열을 인쇄하는 방법입니다. 그냥 그들에 대해 읽어보십시오.

http://docs.python.org/2/tutorial/introduction.html#unicode-strings

그것은 말한다 "따옴표 앞의 작은 'U'는 유니 코드 문자열이 생성되어야 함을 의미합니다."

+1

OP를 읽을 수 있도록 링크를 게시하는 데주의하십시오. 그들에 대해서 "? – inspectorG4dget

2

u 기호가 문자열 표시에 추가되어 개체가 유니 코드 문자열임을 나타냅니다. 마찬가지로 코드에서 유니 코드 문자열을 사용하는 경우 문자열 자체 옆에 u 기호를 추가하여 유니 코드 리터럴을 사용할 수 있습니다.

관련 문제