정규 표현식에 다음과 같은 문제가 있습니다. 텍스트 (txt) 파일의 단어를 읽고 다른 파일에 쓰면서 한 줄에 한 단어 씩 작성하는 프로그램을 작성했습니다.Regex는 특수 문자를 삭제했습니다.
읽을 단어에 특수 문자 ľščťžýáíé
이 있으면 예외입니다. 정규 표현식은 char을 삭제하고 특수 문자가있는 단어를 분할합니다. 예를 들어
:
입력 :
I am Jožo.
출력 대신이 정규식의
while((line = br.readLine())!= null){
Pattern p = Pattern.compile("[\\w']+");
Matcher m = p.matcher(line);
}
을 사용하십시오. http://stackoverflow.com/questions/2276200/cha nging-default-encoding-of-python. ¼의 바이트 표현이 무엇인지 아십니까? – JustinDanielson