다른 매개 변수의 값이 저장되는 긴 파일이 있습니다. 다음은 데이터의 아주 간단한 예입니다. C5
위에 몇 줄이 있습니다. ISVEG
및 ISDISP
값을 찾고 싶습니다. 나는 ISVEG
의 가치를 찾기 위해 MATLAB에 대한 명령을 발견하지만 난 R code
R을 사용하여 값을 찾는 텍스트 마이닝
C5 MOMENTUM ADVEC AND HORIZ DIFF SWITCHES AND MISC SWITCHES
*
*
C5 ISCDMA ISAHMF ISDISP ISWASP ISDRY ISQQ ISRLID ISVEG ISVEGL ISITB ISEVER IINTPG
0 1 0 0 -99 1 0 0 0 0 0 0
C6 Testing
*
*
C6 par1 par2
10 12
MATLAB 코드에 있음을 변경할 수 :
% inpfile is the file where the above sample data is stored
fid=fopen(inpfile,'r');
%C5
linestr = getstring(fid,'C5');
linestr = getstring(fid,'C5');
linestr = fgets(fid);
val = str2num(linestr);
isveg = val(8);
나는 우리가 readLines
를 사용할 수 있다고 생각하지만, 나는 독서 후에 붙어 선. 정규 표현식을 사용합니까?
sampledata <- readLines("sampledata.txt")
dput (샘플 데이터)는이 내가 생각 해낸 것입니다
dput(sampledata)
c(" C5 MOMENTUM ADVEC AND HORIZ DIFF SWITCHES AND MISC SWITCHES",
" *", " *", " C5 ISCDMA ISAHMF ISDISP ISWASP ISDRY ISQQ ISRLID ISVEG ISVEGL ISITB ISEVER IINTPG",
" 0 1 0 0 -99 1 0 0 0 0 0 0",
" C6 Testing", " * ", " *", " C6 par1 par2 ", " 10 12"
)
파일의 텍스트 조직/형식의 어떤 종류가 있습니까 : 이것은 당신에게 관심 분야와 dataframe을 제공 을 (그렇지 않을 경우, 관심있는 선을 잘라 몇 가지 코드를 추가)? 의미, 그것은 어떤 구조화 된 형태로 들어갈 수 있을까요? 그것은 당신의 견본에서 그렇게 보이지 않습니다. –
@RichardScriven 데이터가 구조화 된 형식이 아닌 것 같습니다. –