내 컴퓨터에는이 문자가 무엇인지 알 수 없습니다. Excel에서 왔습니다.루비의 CSV에서 특수 문자를 생성 한이 악명 높은 악보를 필사적으로 제거하려고 시도했습니다.
에서 그것은 이상한 공간이었습니다. 이제 문자 그대로 여러 기호로 표현됩니다. 내 컴퓨터는 그것이 무엇인지 전혀 모른다.
이 문자는 엑셀로 표시됩니다 (csv에서는 xls과 같은 종류의 공백 임). OS X의 TextEdit은 이것을 긴 공간으로 처리합니다. " 입니다. 루비의 CSV 파서는 일반 utf-8을 사용하여 파싱을 시도 할 때 파열되며, 구문 분석을 위해 :encoding => "windows-1251:utf-8"
을 추가해야합니다.이 경우 Ruby는이를 "K"로 바꿉니다. 이 K는 내 CSV에서 9, 12, 15 및 18 그룹 (KKKKKKKKKK 등)으로 표시되며 은 gsub(/K/)
을 통해을 (를) 제거 할 수 없습니다 (K 그룹,/KKKKKKKKK/등은 제거 할 수 없습니다). 나는 또한 opensource 도구 CSVfix을 사용했지만 "선행 및 후행 공백 제거"명령은 K에 영향을주지 않았습니다.
내가 Remove non-ascii characters from csv에 제안 sed
를 사용했지만,
같은 오류를 가지고 : 1 : "output.csv"
오 잘못된 명령 코드는 sed -i 's/[\d128-\d255]//' input.csv
뭔가를 실행하는 경우 Mac에서.
나는이 문자에 "no"/ replace-with-nothing이라고 말하는 루비를 얻는 방법을 원하고 완전히 처음부터 무시합니다. –
ASCII가 아닌 텍스트는 사용할 수 없지만 ASCII-8BIT를 사용하여 Ruby로 텍스트를 열어 보았습니다. 그런 식으로 사악한 문자를 찾아서 바꾸시겠습니까? –
요즘 빌 중 하나는 질문을 삭제하겠습니다. –