1000 개 이상의 텍스트가 포함 된 파일이 있습니다. 파일의 일부 기능은 동일하지만, 다른 사용자는 예를 들어, 다른 방법으로 그것을 입력 :Matlab을 사용하여 텍스트 파일을 필터링하는 방법
사용자 1은 입력 : 구글
사용자 2가 입력 : 구글, (쉼표의 :
사용자 3가 입력 (모두 소문자)를 구글 끝)
위의 모든 항목이 동일한 기능을 가지고 있음은 분명합니다. 필자의 목표는 기능 파일을 필터링하여 출력물에 중복 기능이없는 고유 한 기능 만 제공하도록하는 것입니다.
Matlab을 사용하여이 작업을 수행해야합니다. 어떻게하면이 작업을 수행 할 수 있는지 알 수 있습니까?
정말 txt 파일과 비슷합니다. 세 개의 열, 행 번호, 기능 설명 및 기능 자체는
입니다.
.
.
JOB_TITLE 909 : 비 ascii_909
JOB_TITLE 910 : 비 ascii_910
JOB_TITLE 911 : 비 ascii_911
912 LAST_NAME 아론
913 LAST_NAME 아담
.
.
이미 matlab에서이 파일을 읽었습니다. 파일을 드래그했습니다. 그것을 행렬에로드하는 방법을 알고 있습니다.
두 특징의 문자 순서가 동일하고 차이가 대문자, 소문자, 공백 또는 다른 문자 인 경우 해당 사본을 말하게 할 수 있습니다.
많은 감사
자세한 내용은 다음과 같습니다. 파일에 이러한 기능이 어떻게 포함되어 있습니까? Matlab에 이미이 파일을 읽었습니까? 중복으로 기능을 선언하는 기준은 무엇입니까? 스페이스? 대시? –
수정 됨. 다른 것이 있습니까? –
[FLX] (http://www.mathworks.com/matlabcentral/fileexchange/32449-edit-distances) 예제와 같이 편집 거리를 사용하는 것이 좋습니다. – Shai