저는 파이썬을 처음 사용합니다. 트윗을 정리 한 CSV 파일이 있습니다. 나는이 짹짹의 단어의 가방을 만들고 싶다. 다음 코드가 있지만 제대로 작동하지 않습니다.어떻게 파이썬에서 CSV 파일에서 단어의 가방을 만들 수 있습니까?
import pandas as pd
from sklearn import svm
from sklearn.feature_extraction.text import CountVectorizer
data = pd.read_csv(open("Twidb11.csv"), sep=' ')
count_vect = CountVectorizer()
X_train_counts = count_vect.fit_transform(data.Text)
count_vect.vocabulary_
오류 :
.ParserError: Error tokenizing data. C error: Expected 19 fields in line 5, saw 22
[Python Pandas Error tokenizing data] (https://stackoverflow.com/questions/18039057/python-pandas-error-tokenizing-data)의 가능한 복제본 –
코드에서 * 정확하게 어디에서 확인할 수 있습니까? 오류가 발생했습니다 ... – desertnaut
지금 코드를 실행할 때 'DataFrame'개체에 'Text'특성이 없습니다 –