내가 분류를위한 텍스트를 전처리하고 기반으로, 나는이처럼 내 데이터 집합을 가져옵니다, 때분할 dataframe 열 구분
lyrics,classification
0 I should have known better with a girl like yo...
1 You can shake an apple off an apple tree\nShak...
2 It's been a hard day's night\nAnd I've been wo...
3 Michelle, ma belle\nThese are words that go to...
그러나 : 터미널에
dataset = pd.read_csv('lyrics.csv', delimiter = '\t', quoting = 2)
dataset
인쇄 spyder
을 사용하여 변수 dataset
을 더 자세히 살펴보면 원하는 두 열 대신 하나의 열만있는 것을 알 수 있습니다.
1) 하나의 열 lyrics
을 위해 :
가사 자체가 ","구분자가 작동하지 않을 쉼표를 가지고 있음을 고려,
는 어떻게해야하는 순서로 위 내 dataframe를 해결합니까
2)와 하나의 컬럼에 대응 classification
각 행에 대한 데이터?
세트는'구분 기호 = ','' – DJK