2016-07-17 4 views
-2

문자열 (탭이없고 공백 및 열 이름 없음)로 구성된 데이터 파일이 있습니다. 첫 번째 두 열은 한 데이터와 같고 세 번째 열은 다른 열이며 네 번째와 네 번째는 다른 것입니다.파이썬 또는 팬더로 데이터 파일 분할

이 문자열을 명명 된 열이있는 데이터 프레임으로 가져 오려면 어떻게해야합니까? 내가 본 모든 대답은 탭, 공백 등이 있다고 가정합니다.

+5

당신은 당신의 데이터의 예를 줄 수 :

ieafxfrjzyxfxkymiwuy lqqmceegjnbjpxnidygr zssawojanxbrfwkgbvnl ahcwwhtayjwozzrgfftt 

이되다? 나는 "열"을 가지고 있다는 것이 무엇을 의미하는지 모르지만 "탭, 공백 등"이 없다고 말합니다. 값 사이. 한 가치가 멈추고 다음이 시작되는 곳을 어떻게 알 수 있습니까? – smarx

+0

각 열이 엄격한 문자 수로 정의되는 "고정 너비 형식"파일을 설명하고 있습니까? 그렇다면'pandas.read_fwf'를보십시오. – BrenBarn

답변

3

widths 매개 변수와 함께 pd.read_fwf을 사용할 수 있습니다. 이러한 내용의 파일 :

pd.read_fwf('test.txt', widths = [2, 4, 3, 11], names=['first', 'second', 'third', 'fourth']) 
Out[226]: 
    first second third  fourth 
0 ie afxf rjz yxfxkymiwuy 
1 lq qmce egj nbjpxnidygr 
2 zs sawo jan xbrfwkgbvnl 
3 ah cwwh tay jwozzrgfftt 
+0

그게 내가 필요한 것입니다. @ayhan - 고마워. – TIll

+1

@ TIll 질문에 대한 답변을 얻었다면 [이 대답에 동의합니다] (https://stackoverflow.com/help/someone-answers) 할 수 있습니다. –