나는 14784 개의 텍스트 문서가 있는데, 나는 벡터화하려고하고 있는데, 그래서 나는 약간의 분석을 할 수 있습니다. 저는 sklearn에서 CountVectorizer
을 사용하여 문서를 피쳐 벡터로 변환했습니다. 나는 호출하여 이런 짓을 :팬더 데이터 보드에 sklearn CountVectorizer의 결과를 입력하십시오.
의 배열입니다
vectorizer = CountVectorizer
features = vectorizer.fit_transform(examples)
, 내가 추가 기능 이용을 위해 노력하고 있어요. 이를 위해 팬더 데이터 프레임에 기능을 저장합니다. 현재 팬더 데이터 프레임 (텍스트 기능을 삽입하지 않은 상태)의 모양은 (14784, 5)
입니다. 내 특성 벡터의 모양은 (14784, 21343)
입니다.
벡터화 된 기능을 팬더 데이터 프레임에 삽입하는 좋은 방법은 무엇입니까? 당신의 기본 데이터 프레임이 df
경우
두 번째 줄에는 벡터화 된 기능의 데이터 프레임을 만드십니까? 그렇다면, 그것은 나를 위해 작동하지 않습니다. 'DataFrame 생성자 제대로 호출되지 내가 사용 :! 'PandasError이 : 나는 다음과 같은 오류가 발생합니다'features_df = pd.DataFrame (입술)'입술 CountVectorizer의 결과 는'fit_transform' 방법 –