2013-05-31 2 views
4

파일 세트가 있고 각 파일에는 고유 한 식별자가 들어 있습니다. 나는 프로그래밍 방식으로 Weka를 사용하고 훈련 용 arff 파일을 만듭니다. arff 파일의 각 인스턴스는 각 파일에서 추출한 속성 집합에 해당하므로 파일 당 하나의 인스턴스에 해당합니다. 어떻게하면 각 파일의 식별자를 arff 파일의 해당 인스턴스와 연결할 수 있습니까? 대단히 감사드립니다.Weka의 ID 속성

+0

java weka.core.Instances append file1.arff file2.arff 

건배 - 당신은 단지 식별자를 보유하고 새로운 기능을 추가하는 시도 :

당신은 명령 줄을 통해 다음과 같은 코드를 사용할 수 있습니까? – kutschkem

+0

더 명확하게 코드 스 니펫을 추가 할 수 있습니까? – Chris

답변

4

추가 속성 인 as described here을 만들어 식별자를 각 인스턴스에 연결할 수 있습니다.

따라서, 귀하의 경우 문자열 속성을 생성하고이 속성을 각 인스턴스에 추가하십시오. 분류자를 훈련하고 테스트 할 때 식별자를 제거하기를 원할 것입니다.이 식별자는 Remove Type Filter을 사용하여 쉽게 수행 할 수 있습니다. 기본적으로 String 유형을 제거합니다. 필터 제거가 작동하여 속성 색인을 지정합니다.

명령 줄에서 Weka를 실행하는 경우 -p 옵션을 사용하여 예측 및 특성을 출력 할 수 있습니다 (필터링 된 특성의 경우에도 마찬가지 임). 첫 번째 링크 하단을 참조하십시오.

1

오해하지 않는 한 2 개 이상의 arff 파일을 함께 연결하려고합니다.

file1.arfffile2.aff이라는 두 개의 arff 파일이 있다고 가정 해 봅시다. 나는 완전히 질문을 이해하지