입력이 유니 코드 형식 일 때 줄과 열을 가리키는 컴파일러 스타일 오류 메시지를 제공하는 표준/공통 방법이 있습니까?유니 코드로 컴파일러 오류 메시지 줄/열 번호보고
예를 들어, 매우 일반적인 컴파일러 오류 메시지 형식은 다음과 같습니다 "파일 이름 : LINE_NUMBER는 : column_number : 오류 메시지"예 :
- (GCC에서) :
bad.c:1:10: syntax error, unexpected STRING
- (사용자 지정 도구에서)
입력이 고정 된 8 비트 인코딩 (예 : ISO-8859-1) 인 경우 명확합니다. 그러나 입력이 유니 코드 (UTF-8, UTF-16 등) 인 경우이 경우 "열"은 무엇을 의미합니까 (또는해야합니까?)? 어떤 바이트 요? 어떤 코드 포인트? 어떤 글씨인가? 선례를 선택하는 도구가 있습니까?
나는 당신의 대답과 일치하는 것이 내가 원하는 것을 발견했다고 생각한다. http://unicode.org/reports/tr29/에서 정의 된 확장 된 제자 클러스터. ICU의 BreakIterator를 통해이 문제를 해결할 수 있습니다. – wjl