1
프롤로그 : 가능한 한 빨리 두뇌 통역사를 구현하는 과제가 주어졌습니다. 이 통역관을 최대한 빨리 만들기 위해 우리는 우리 통역사가 가지고있는 [- < +>]와 같은 두뇌의 지시를하고 싶습니다. 우리는 더 많은 지시 사항을 원한다. 그래서 우리는 어떤 지침을 구현해야하는지 궁금해했다.가장 자주 발생하는 문자열을 1 파일로 찾으십시오.
두 개의 개별 파일을 비교하는 것에 대한 많은 정보를 찾았지만 파일 내에서 재발생하는 문자열을 찾는 방법이 있습니까?
파일 :
Hi, this is my text
also, it is an example of my question
결과 : 예를 들어
는2 x ' is '
2 x ' my '
2 x ', '
당신이 실행할 수있는 Windows 또는 Linux에서 모든 프로그램을 알고 있습니까?
awk 'BEGIN { FS="[,. ;!?]" } { for (i=1; i<=NF;i++) { A[$i]++ } } END { for (a in A) { print A[a], a } }' | sort -k1 -n -r
당신이 FS 변수에 구분 기호를 사용자 정의 할 수 있습니다 : SH,로 coreutils/종류 및 AWK를 사용
문자열에 공백을 포함 하시겠습니까? 구획 문자는 무엇입니까? – jurez
예. 분리 기호가 없도록 공백을 넣으려고합니다. – Maarten
공백은 어느 단어에 적용됩니까? 왼쪽, 오른쪽, 둘 다? – jurez