2017-10-27 1 views
1

프롤로그 : 가능한 한 빨리 두뇌 통역사를 구현하는 과제가 주어졌습니다. 이 통역관을 최대한 빨리 만들기 위해 우리는 우리 통역사가 가지고있는 [- < +>]와 같은 두뇌의 지시를하고 싶습니다. 우리는 더 많은 지시 사항을 원한다. 그래서 우리는 어떤 지침을 구현해야하는지 궁금해했다.가장 자주 발생하는 문자열을 1 파일로 찾으십시오.

두 개의 개별 파일을 비교하는 것에 대한 많은 정보를 찾았지만 파일 내에서 재발생하는 문자열을 찾는 방법이 있습니까?

파일 :

Hi, this is my text 
also, it is an example of my question 

결과 : 예를 들어

2 x ' is ' 
2 x ' my ' 
2 x ', ' 

당신이 실행할 수있는 Windows 또는 Linux에서 모든 프로그램을 알고 있습니까?

awk 'BEGIN { FS="[,. ;!?]" } { for (i=1; i<=NF;i++) { A[$i]++ } } END { for (a in A) { print A[a], a } }' | sort -k1 -n -r 

당신이 FS 변수에 구분 기호를 사용자 정의 할 수 있습니다 : SH,로 coreutils/종류 및 AWK를 사용

+0

문자열에 공백을 포함 하시겠습니까? 구획 문자는 무엇입니까? – jurez

+0

예. 분리 기호가 없도록 공백을 넣으려고합니다. – Maarten

+0

공백은 어느 단어에 적용됩니까? 왼쪽, 오른쪽, 둘 다? – jurez

답변

관련 문제