2009-10-07 7 views
0

Windows (이 경우 XP)의 filespec을 기반으로 중복 파일을 삭제하는 가장 효과적인 방법은 무엇입니까? 나는 정규식 일부 VB 스크립트 생각하고 있지만, 더 나은 방법이 있는지 ...중복 파일 삭제 (근접)

예 slighlty 중 하나 끝이나 beggining에서 하나 또는 두 개의 (함) 추가 문자로 이름에서 차이가 있지만에서 동일한 파일 이름을 포함 크기가 다른 slighlty 파일도 있습니다.

Regex는 경계가 알려진 경우 이러한 차이를 처리하는 가장 좋은 방법입니다.

답변

2

아니요, 저는 정규식이 올바른 도구라고 생각하지 않습니다. 네가 나 한테 물으면 조금 위험 해. 어쨌든 두 파일 이름 사이에 Levenshtein distance을 계산할 수 있으며 충분히 작 으면 (두 자로 구성된 파일 이름에주의하십시오!) 두 파일 중 하나를 삭제하십시오.

크기는 간단한 산술을 사용하여 수행 할 수 있습니다.

+0

정규 표현식의 위험에 대한 우려를 공유합니다 (쉽게 오버 매치하기 쉽습니다). 캐릭터 교체/교체 같은 것이 괜찮 으면 Levenshtein이 당신이 원하는 것일 수 있습니다. 접두어/접미사가 모두 필요한 경우 그래도 확인하는 것이 좋습니다. – Cascabel

+0

이 메서드를 모든 관련 파일 특성에 사용하여 전체적인 계량 가능 메트릭을 만들 수 있습니까? 아니면 RegEx를 사용하고 동일한 크기의 임의 비율 (중요도 배수와 함께 가중치)을 기반으로 개별 메트릭을 할당 한 다음 합산하는 것이 더 좋을까요? – MaSuGaNa

+0

@ Jefromi - 접미사/접미사 unfortuanlty 일뿐만 아니라 간단한 문자열 조작 (왼쪽/오른쪽/중간) 등을 사용합니다. – MaSuGaNa

0

regex를 사용하여 파일 이름을 일치 시키거나 (거의 일치시킬 수 있습니다.)

정규식을 사용하여 이름을 일치시키고 파일 크기 목록을 작성합니다. 해당 분산에 해당하는 파일 크기를 기반으로 분산을 계산할 수 있습니다.

일치하는 파일 목록을 작성한 후에는 다른 파일 속성 (크기, 날짜 등)에 액세스하여 삭제할 파일을 표시 할 수 있습니다.