질문은 다음과 같습니다 : 우리는 데이터에 대한 비정상적인 형태의 csv 파일을 가지고 있습니다. R은 거대하고, 나는 확실히 짧은 해결책을 놓치고있다.데이터 프레임을 정규화하는 관용적 인 방법이 있습니까?
을 감안할 때 우리가 그것을 읽고 아래의 양식의 dataframe 얻을 파일 :
id file topic proportion
0 file1.txt 0 0.01
1 file2.txt 0 0.01
1 file2.txt 1 0.03
우리가 일정을이 dataframe이 점을 변환 할 수있는 간단한 방법이 있나요
# id, file, topic, proportion, [topic, proportion]*
0,file1.txt,0,0.01
1,file2.txt,0,0.01,1,0.03
을 열 수? 주제 - 비율 쌍의 수는 정의되지 않으며 매우 클 수 있습니다. 고맙습니다!
귀하의 질문에 명확하지 않습니다. 데이터를 R로 읽는 중입니까? 또한, 당신은 행의 수가 아니라 행의 수가 일정하다는 것을 믿습니다. –
그래, 필자는 파일을 읽고 열 수가 다른 데이터 프레임을 얻고이 데이터를 정규화하여 각 레코드를 분할하는 고정 된 수의 열을 얻고 싶습니다. –