2011-09-27 5 views
3

입력 된 텍스트를 읽고 모든 단어를 구문 분석하여 데이터 구조에 저장하는 프로그램을 만들고 싶습니다. 나중에 해당 단어에 대한 통계 (가장 자주 사용되는 단어 등)를 가질 수 있습니다.Java Text Reader

을 :

나는 두 가지에 대한 지침이 필요합니다. "구문 분석 함수"에 대한 최선의 접근 방식으로 텍스트를 구분합니다.

b. 데이터 구조 선택을위한 최선의 방법, 복잡성, 액세스 시간 및 가장 적합한 경우.

답변

0

다른 통계에 따라 Map<String, Integer>을 사용하려는 것 같습니다. 그런 다음 각 키 (당신이 읽은 단어)에 대해 읽은 횟수를 저장할 수 있습니다. 나머지는 숙제처럼 들립니다. ...

4

가) 내 "분석 기능"

사용이 next (단어에 대해 좋은 기능을 가진 Scanner) 등

B) datastruture 선택

을위한 최선의 방법에 대한 최선의 방법

단어에서 통계 개체까지의 맵 : Map<String, WordStatistics>.

+0

문자열 토큰 화가도 잘 작동합니다. 토큰화할 항목을 간단히 기술 할 수 있습니다. – csaunders

+0

@csaunders 스캐너는 훨씬 간단하고 [다음 (패턴 패턴)]이 있습니다. (http://download.oracle.com/javase/6/docs/api/java/util/Scanner.html# next (java.util.regex.Pattern)) 메소드에서도 사용할 수 있습니다. – dacwe