나는 파일에서 중복 라인을 모두 제거해야하지만 모든 캐릭터의 모습 무시 : 예를 들어특정 문자를 무시하면서 중복 행을 삭제하는 방법은 무엇입니까?
(),、“”。!?#
을이 두 라인은 그래서 그들 중 하나가 삭제 될 것입니다 중복으로 간주 될 것이다 :
“This is a line。“
This is a line
마찬가지로,이 세 가지 라인은 중복으로 간주 될 것이며, 하나만 남아있을 것입니다 :
This is another line、 with more words。
“This is another line with more words。”
This is another line! with more words!
- 중복 된 줄이 문서에 남아 있는지 여부는 중요하지 않습니다.
- 중복을 제거한 후에는 줄의 순서를 변경하면 안됩니다.
- 거의 모든 줄에는 중요한 구두점이 있지만 구두점은 다소 다를 수 있습니다. 어느 행을 보관해도 구두점이있을 수 있으므로 구두점을 최종 출력에서 삭제하면 안됩니다.
일부 문자를 무시하면서 파일에서 중복 줄을 모두 삭제하려면 어떻게해야합니까?