20 분 전에 openrefine을 배우기 시작했습니다. 데이터의 각 청크 시작 부분에 일관된 헤더 ("JP")로 구분 된 데이터가있는 텍스트 파일이 있습니다. 데이터 덩어리가 모두 동일한 수의 줄이 아닙니다. 원본 데이터의 각 덩어리를 오픈 라인에 1 행 씩 넣기를 원합니다. 어떻게해야합니까?행의 열을 파일로 구분
편집 : 여기 샘플이 있습니다. 그것은 꽤 지저분한 파일이지만 각 개별 항목의 시작 부분에 JP를 의지 할 수 있습니다.
JP
0034
1-25-60
01
checked 1/92
I am so happy to have taken these. The brown envelopes, blah blah. roll 1: Is a retirement event [EW]
JP
0035
2-1-60
01
checked 1/92
Bill therapy
JP
0036
2-11-60
01
Checked 1/92
Bill: there are many
EW: The bills look good.
I remember Babies used to look like this everyday, with the staff coming and going, all nice and professional.
JP
0037
2-11-60
01
checked 1/92
BLAHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH. blah blah blah blah bal…
oops>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
again
JP
0039
2-11-60
01
checked 1/92
JP
0041
3-14-60
질문은 – pintoch
일이 pintoch하는 예를 훨씬 명확 것입니까? 'JP'가 줄 사이의 구분자인지 필드 사이의 구분자인지, 그리고 이것이 어떻게 '줄 구분 파일'이라는 생각과 관련이 있는지 명확하지 않습니다. –
원래 질문에서 샘플을 추가했습니다. 그것은 내가 처리해야하는 지저분한 파일입니다. "JP"사이의 모든 행에 대해 행을 원합니다. 나는 각 줄마다 한 칸을 원한다. 일부 행에는 다른 행보다 많은 열이 있습니다. 이 맥락에서는 괜찮습니다. –