2009-08-11 10 views
1

업데이트 : 분명히 이들은 유니 코드 문자가 아닌 제어 문자입니다.이 캐릭터가 무엇인지 어떻게 알 수 있습니까?

잘못된 문자가있는 XML 파일을 구문 분석하려고하는데이 도구가 유효하지 않게 만들고 내 도구 (Firefox, Nokogiri)가 불평을 일으키고 있습니다.

파이어 폭스에서 캐릭터가 어떻게 생겼는지, 그리고 그것을 텍스트 메이트에 복사하여 붙여 넣으면 어떻게 생겼는지 (필자는 분명히 OS X에 있습니다).

crazy characters http://img.skitch.com/20090811-ghu43k5u9nhpcjmh443dpq76jp.preview.jpg

내가 정말하고 싶은 단지 비밀 아이콘과 작은 회색 다이아몬드는 이러한 문자 (예를 들어 진수/DEC 코드)하지만 내가 그걸 알아낼 방법을 잘 모르겠어요 알고보다는.

+0

Firefox가 어떤 문자인지 알려주려고합니다. 어디에도 나타나지 않는다고 확신합니까? –

+0

읽을 수없는 흐릿한 글리프의 숫자는 무엇입니까? – joeforker

답변

4

Firefox의 페이지를 파일로 저장하고 hexdump -C으로 전달합니다. ASCII 부분에서 HTML 조각을 찾아 16 진수 바이트를 찾습니다. 대부분 UTF-8이므로 멀티 바이트 코드를 기대합니다.

4

귀하의 스크린 샷은 작지만 Firefox 샘플에는 4 개의 16 진수 문자가있는 글리프가 포함되어 있습니까? 그렇다면 유니 코드 문자의 코드 번호입니다. Unicode code charts에서 다이아몬드 글씨를 검색하거나 다이아몬드를 Google 검색에 복사하면 문자 이름이 상단 부근에서 나타납니다.

하지만 진짜 질문은 프로그램에서 유니 코드 입력을 처리하는 방법입니다. XML을 처리하는 경우 올바르게 수행해야합니다. Nokogiri는 Ruby 라이브러리입니까? 유니 코드를 자동으로 처리하지 않는다는 사실에 놀랐습니다.

+0

Google에 붙여 넣기를 시도했습니다. (원래 질문에서 언급했음을 유감스럽게 생각합니다.) 빈칸이 생겼습니다. 나는 지금 이것들 중 몇 개를 발견했으며 모두 Textmate에서 회색 다이아몬드로 나타납니다. 나는 그들이 실제로 다이아몬드 기호에 대한 코드라고 생각하지 않습니다. –

0

xvi32과 같은 16 진수 편집기를 사용하여 파일을 열기 만하면됩니다.

0

파일 hexeditor를 열고 16 진수 표현을 추출하십시오. 문자의 이름을 찾으려면 http://unicode.org에있는 코드를 찾아보십시오.

0

터미널 명령 줄에서 hexdump -c 문자 코드가 표시됩니다. 터미널 사용에서 다음

1

이맥스에 복사하고 hexl 모드를 시작합니다.

0

당신이 빔을 사용하는 경우, 상태 영역

2

당신이 찾고있는 검색 용어 U+2603 또는 U2603, 분명히에서 숫자를 대체하다의 진수를 보여주기 위해 문자를 입력 조지아 위로 커서를 이동 너의 애매 모호한 "알 수없는 글씨"상자. 처음 몇 가지 결과는 유니 코드 문자에 관한 것입니다.

+0

+1 재미 있습니다. [Rails trivia] (http://stackoverflow.com/questions/3222013/what-is-the-snowman-param-in-rails-3-forms-for) –

0

당신은 String 클래스의 루비 16 진 덤프 확장을 다운로드하고 직접 루비에서 16 진 덤프를 인쇄 할 수 있습니다 :

:

require 'hexdump' 

#... whatever you do in your program 

puts your_string.hexdump 

출력하면 쉘

페이지에 hexdump -C에서 무엇을 얻을처럼 보인다

http://www.unixgods.org/~tilo/Ruby/hexdump.html

관련 문제