2012-12-09 3 views
3

설정 : 실험실 장치 및 측정 또는 계산에 대한 정보를 저장하는 다른 프로그램에서 만든 (간단한) .csv 및 .dat 파일이 있습니다. 나는 다른 언어에 대해서도 이것을 찾았지만 R에 대해서 찾지 못했습니다.R : 키워드 (텍스트 파일 마이닝) 후 값 및 행 추출

문제 : R을 사용하여 생성 된 파일을 열지 않고 결과를 빠르게 표시하기 위해 값을 추출하려고합니다. 이로써 나는 두 개의 전형적인 설정을 :

난 후 핵심 단어 나 선

나는 기능은 할 수 없습니다 알려진 라인을 읽을 필요) 후 키워드를 B 알려진 선험적으로 알 수없는 값을 읽기 위해 필요) scan() 및 grep()이 작동합니다. 내가 도움이 모든 형태의 감사 woul

나는이 부분을 관리합니다) :

C) 마지막으로 나는 폴더에있는 파일의 수십 이상의 루프에 좋아하고 (그림이 완료 만들기 위해 나에게 요약을 줄 것입니다. 확인

+0

'grep'과'scan'으로는 작동하지 않는 것은 무엇입니까? ('grepl'가 더 좋을 수도 있습니다)? (아마도 아주 좋은 것은 아니지만) 변수 <-scan (= 무엇을 "file.csv", 문자()가 9 월이 = "") 이 변수 charactor 벡터를 [반환 확인 –

+0

, 그것은 키 값 작동 grep ("keyword", ks) +2] 실제 값으로 # + 2 앞에 두 자리가 저장됩니다. 은 seaked 값의 문자를 반환합니다. as.numeric (lapply (변수, gsub, patt = ","대체 = ".")) 완료 : 데이터를 숫자로 변경하고 ","및 "." 문제를 해결해야했습니다. 줄에 : 데이터 = as.numeric (lapply (ks [grep ("Ks_Boden", ks) +2], gsub, patt = ",", replace = "."))) 그게 – Toby

+0

죄송합니다 긴 문자열^.- – Toby

답변

0

, 그것은

variable<-scan("file.csv", what=character(),sep="") 

는 모든 seaked 값

variable[grep("keyword", ks)+2]  # + 2 as the actual value is stored two places ahead 

반환 문자의 charactor 벡터를 반환 (아마도 아주 좋은 것은 아니지만) 키 값을 사용할 수 있습니다.

as.numeric(lapply(variable, gsub, patt=",", replace=".")) 

완료 : 데이터를 숫자로 변경하고 ","및 "." 문제를 해결해야했습니다. 라인에

: 데이터 = as.numeric (lapply (KS [그렙 ("Ks_Boden"KS) +2] GSUB, PATT = ""= 교체) ".")

견디는 것이 자산에 나쁜 영향을주지는 않습니다 .-)

나머지는 끝나지 않았지만, 일단 게시를 완료합니다.