문자열 파일 목록을보고 가장 공통적 인 하위 문자열에 대한 보고서를 만드는 스크립트를 만들려고합니다. 예를 들어문자열 집합을 비교하여 일반적인 하위 문자열을 찾는 방법
:
- 안녕하세요, 저는 문자열 하나입니다. 나는 사과와 오렌지를 좋아한다. 우리는 모두 여기에 문자열입니다.
- 안녕하세요, 저는 두 번째 문자열입니다. 나는 사과와 오렌지를 좋아한다. 우리는 모두 여기에 문자열입니다.
- 안녕하세요, 저는 문자열 3입니다. 나는 사과와 오렌지를 좋아한다. 우리는 모두 여기에 문자열입니다.
- 안녕하세요, 저는 4 번 문자열입니다. 나는 사과와 오렌지를 좋아한다. 나는 나의 개성을 표현하고 싶습니다.
스크립트가 특정 임계 값 (예 : 5 자) 이상인 문자열 사이의 공통 요소를 알려주고 싶습니다.
이 이상적으로는
- "나는 사과와 오렌지를 좋아한다" 말했다 거라고하는 것은
- "우리는 모든 문자열이 여기에있는 모든 파일에서 발생 "세 파일에서 발생합니다.
기능을 내가 잘 알고있어 기술에서이 작업을 수행 할 수있는 경우 - SQL, 자바 스크립트, PHP, 루비 또는 배쉬 매우 행복 오티스 ...
많은 감사,
Jack
이 질문은 밀접하게 관련되어 있으며 많은 관련 답변이 있습니다. http://stackoverflow.com/questions/1410822/how-can-i-detect-common-substrings-in- a-list-of-strings –