현재 파이썬으로 작성된 간단한 IRC 봇이 있습니다.파이썬 IRC 봇 및 인코딩 문제
바이트와 유니 코드 문자열을 구별하는 python 3.0으로 마이그레이션 한 이래로 인코딩 문제가 발생하기 시작했습니다. 특히, 다른 사람들이 UTF-8을 보내지 않는 경우.
이제 모든 사람들에게 UTF-8을 보내라고 말할 수 있습니다.하지만 더 나은 솔루션은 파이썬을 다른 인코딩이나 기본값으로 설정하려고하는 것입니다.
는 지금까지 코드는 다음과 같습니다
data = str(irc.recv(4096),"UTF-8", "replace")
적어도 예외가 발생하지 않는. 그러나 나는 그것을 지나치기를 원한다. 나는 로봇이 다른 인코딩을 기본으로하고 싶어하거나, "귀찮은 등장 인물"을 어떻게 든 감지하려고 노력한다.
또한 mIRC가 실제로 사용하는이 신비한 인코딩이 무엇인지 파악해야합니다. 다른 클라이언트가 제대로 작동하고 UTF-8을 보내야하는 것처럼 보입니다.
어떻게해야합니까?
0을 제외한 모든 바이트 값에 코드 포인트를 할당하므로 cp1252는 0이 아닌 바이트 시퀀스에 대해 항상 작동하는 것처럼 보입니다. – RichieHindle