2010-06-25 3 views

답변

3

TidyPas는 HTML Tidy 라이브러리 API를 둘러싼 단순한 래퍼입니다. 이 API는 UnicodeString facade를 제공하지 않으며, API를있는 그대로 보여줍니다.

As far as I can tell from the docs, HTML Tidy 자체는 제한된 범위의 문자 집합 만 지원하지만 유니 코드의 UTF8 인코딩은 여기에 포함됩니다. API에서 사용하는 ANSIString 및 ANSIChar 유형에서는 괜찮을 것으로 생각됩니다.

UTF8 이외의 HTML Tidy의 유니 코드 지원에 대한 추가 문의 사항은 the HTML Tidy community itself으로 보내주십시오. 그래도 (2008 년 이후) 잠시 동안 업데이트 된 것 같지 않습니다.

+0

에 있습니다. 유일한 선택은 TidyPas를 유니 코드로 변경하는 것입니다. 권리? –

+1

아니, 폴, 그 유일한 선택은 아니야. 또 다른 선택은 HTML을 UTF-8 (어쨌든 할 수있는 현명한 방법)으로 인코딩하고이를 HTML Tidy에 AnsiString으로 전달하는 것입니다. 델파이의 UTF8String 타입은 이미 AnsiString 타입이므로 아무런 문제가 없어야합니다. –

+0

@Rob, 더 높은 델파이에서 AnsiString 매개 변수에 UTF8String을 전달할 때 암시 적 변환이있을 수 있습니다. 나는 그것을 시험 할 것이다. 고맙습니다. –

1

예, Delphi 2010에서 작동합니다 .- 코드를 업데이트했습니다 .-) 그렇습니다. 입력을 유니 코드에서 UTF8로 변환하여 처리해야합니다. 내가 사용하는 (작동하는) 코드는 http://www.csinnovations.com/framework_delphi.htm

+0

비슷한 문제가있어서 csinnovations에 대한 링크가 깨졌습니다. D2010에 tidyPas를 사용하여 아랍어 문자가 포함 된 문자열을 정리하려고합니다. http://qvwx.de/tmp/TidyPas_Test.7z 문제를 보여주는 완전한 자체 콘솔 응용 프로그램이 있습니다. –

관련 문제