2014-03-01 2 views
0

나는 Naive Bayes 텍스트 분류를하기 위해 Rapidminer를 사용하고 있습니다. 2 개의 열이있는 Excel 시트에 내 교육 과정이 설정됩니다. 첫 번째 열은 LABEL이고 두 번째 열은 TEXT입니다.데이터가 Excelsheet에 저장된 Rapidminer를 사용한 텍스트 분류

"Excel 읽기"연산자를 사용하여 Excel 시트를 읽었습니다 ("Set Role"연산자를 사용하여 LABEL 열이 레이블 역할을하고 TEXT 열이 텍스트임을 가정). 그런 다음 "Data to Documents"연산자와 "Process Documents"연산자 (토큰, 스톱 워드, 스템, 대소 문자 등)를 사용하여 데이터를 처리했습니다. 그러나 "Naive Bayes"연산자로 데이터를 이식하려고 시도 할 때 오류 메시지가 표시되어 데이터에 레이블이 지정되지 않고 "역할 설정"연산자를 사용하도록 요청했습니다. 그래서 "프로세스 문서"연산자 뒤에 다른 "역할 설정"을 추가하고 "속성 이름"에 "텍스트"만 추가하면 LABEL이 사라집니다. 나는 무엇이 잘못되었는지 전혀 모른다.

답변

0

당신은 당신이 역할 regular와 역할 Label (아마도 형 Polynominal과) 다른 속성을 가진 하나 개의 속성을보고 text를 입력해야하는 Process Documents from Data 연산자 앞에 중단 점을 설정합니다. 이것이 정상이면 작동 할 것입니다.

add meta information 확인란이 Process Documents from Data 운영자에 설정되어 있는지 확인하십시오.

여전히 작동하지 않으면 프로세스 XML 게시가 다음 단계입니다.

+0

알 수 있습니다. "데이터에서 프로세스 문서"를 사용해야하지만 대신 "프로세스 문서"를 사용했습니다 ... 많은 감사드립니다. –