나는 데이터 과학에 관심이 있고 나는 knime에 아주 새롭다. Excel의 데이터 그룹화에 대한 질문이 있습니다. 두 개의 열이있는 xlsx 파일이 있습니다. xlsx 파일에는 2000 명에 대한 정보가 있습니다. 이 정보 제목은 A 열에 있으며 infos는 B 열에 있습니다. 데이터에서 한 사람의 정보가 완료되면 다른 사람의 데이터 순서가 시작됩니다. A 열에는 약 10 개의 고유 한 제목이 있습니다. 사람들은이 제목 중 일부를 가지고 있습니다. 아마도 일부 사람들은 모두 가지고 있습니다. 내가하고 싶은 일은 A 열의 고유 한 제목으로 열의 데이터를 변환하고 B 열의 데이터를 행에 쓰는 것입니다. 그러나 어떻게? 다음, 당신은 각 행이 속한 그룹을 식별하는 데이터에 열을 추가 할 필요가 knime에서 고유 한 값으로 행을 그룹화하는 방법은 무엇입니까?
1
A
답변
1
을 : : 내 데이터의 모양과 두 번째 사진은 내가하고 싶은 것을 얼마나
첫 번째 사진입니다 피벗 노드를 사용하여 원하는 방식으로 변환 할 수 있습니다.
가장 쉬운 방법은 위의 셀 값을 반환하는 수식을 사용하는 Excel에서 A 열의 셀이 "name"과 같은 경우 1을 더하는 것입니다. 각 변경에 대해 1 씩 증가하는 숫자를 부여합니다 이름.
Excel 원본을 변경할 수없는 경우 KNIME에서 수행하는 가장 좋은 방법은 Gábor의 제안에 따라 Java, R 또는 Python 스 니펫을 사용하는 것입니다.당신이 정말로 순수한 KNIME에서하고 싶지 그러나, 여기 느리고 정교한 워크 플로 :
: 테이블을 리턴
- 엑셀 리더 열이있는
Col0
및Col1
- 일대 다에는
Col0
이 포함되지만Col1
은 제외됩니다.이 givCol0
가name
(다른 가능한 값의 각도 열,하지만 우리는이를 사용하지 않습니다)입니다 - 하는 테이블 구조을 만들 때마다
Group 0
- 열이 appender라는 이름의 1 개 정수 열은 우리에게 하나를 포함하는
name
열을 만듭니다 말이지 비 동일 행의 키 및 테이블의 길이에 대해 구성되고, 값 누락 - 는 고정 값 0
- 이전 값을 취 순환 루프 내부
,
- 수학 식 수식
$Group 0$+$${Iname}$$
와 열Group 0
대체Group 0
을 추가하고 테이블의 현재 반복의 첫 번째 행에서name
의 값을 추가합니다 (테이블 행을 통해 변수) - 행 분할 자은 '숫자로 행 포함'으로 구성되어 행 2 - 끝을 위쪽 포트로, 행 1을 하단 포트로 출력합니다. 바이
Col1
에마지막 피벗 노드
Group 0
의 그룹으로 구성되고, 피봇Col0
에 골재 :
는 Group 0
칼럼은 이제 각각의 이름에 증분 값을 포함 First
방법, 부여 :
당신이 필요에 따라 필터링, 재정렬 등을 할 수 있습니다.
일대일을 제외하고 간단히 수학 수식을 구성하여 Col0
의 변수가 '이름'과 같을 때마다 1을 더하도록 설정할 수는 있지만 처음부터 작동하도록 할 수는 없습니다 그 것처럼.
name
이 항상 테이블의 각 사람에 대한 첫 번째 행인 경우에만 작동하지만, 그렇지 않은 경우 명확하게 데이터를 해석 할 수있는 방법이 표시되지 않습니다.
누군가가 더 빠르고 간결한 KNIME 구현을 가지고 있다면 나는 그것을 보게 될 것이다!
관련 문제
- 1. htmldatatable에 행을 그룹화하는 방법은 무엇입니까?
- 2. 매트릭스에서 행을 그룹화하는 방법은 무엇입니까?
- 3. MySQL에서 고유 한 행을 선택하는 방법은 무엇입니까?
- 4. 레일에서 고유 한 행을 반환하는 방법은 무엇입니까?
- 5. 고유 한 값으로 그룹화
- 6. 고유 한 값으로 고유 한 색 표시
- 7. knime에서 사용자 정의 노드를 만드는 방법은 무엇입니까?
- 8. 하나의 열 값으로 행을 필터링하는 방법은 무엇입니까?
- 9. 고유 한 하위 행을 기반으로 상위 행을 찾는 방법은 무엇입니까?
- 10. 부분적으로 고유 한/고유 한 행을 반환합니다.
- 11. 여러 필드를 기반으로 행을 그룹화하는 방법은 무엇입니까?
- 12. 유형에 따라 mysql에서 행을 그룹화하는 방법은 무엇입니까?
- 13. 두 값으로 그룹화하는 감속기
- 14. KNIME에서 조건을 요구/주장하는 방법은 무엇입니까?
- 15. 별개의 값을 얻은 다음 그 값으로 그룹화하는 방법은 무엇입니까?
- 16. 그룹 고유 한 값으로 그룹
- 17. 고유 한 값으로 SQL - 그룹
- 18. MYSQL의 모든 행을 고유 값으로 업데이트
- 19. 여러 줄을 그룹화하는 방법은 무엇입니까?
- 20. 고유 한 행을 계산 한 후 고유 한 값을 계산합니까?
- 21. mysql에서 INSERT를 통해 많은 고유 한 행을 삽입하는 방법은 무엇입니까?
- 22. 큰 파일에서 고유 한 행을 찾는 방법은 무엇입니까?
- 23. 고유 한 행을 데이터 세트로 반복하거나 복제하는 방법은 무엇입니까?
- 24. PFQuery.queryWithClassName에서 반환 된 고유 한 행을 가져 오는 방법은 무엇입니까?
- 25. 여러 열의 고유 한 조합마다 하나의 행을 선택하는 방법은 무엇입니까?
- 26. grep을 사용하여 파일에서 고유 한 코드 행을 출력하는 방법은 무엇입니까?
- 27. tdxDBgrid에서 행을 그룹화하는 방법
- 28. 정말 고유 한 행을 필터링하십시오.
- 29. '게임'목록에서 고유 한 행을 얻으십시오.
- 30. Perl에서 고유 한 행을 인쇄합니다.
HiTS에는 [Pivot] (https://raw.githubusercontent.com/aborg0/hits/master/com.mind_era.knime.util/html/nodes/Pivot.html) 노드가 있는데, 예제를 확인하십시오. 그룹의 길이가 다르므로 그룹 루프 시작, 전치, 그룹 루프 종료 솔루션을 쉽게 수행 할 수 없습니다. 어쩌면 파이썬, R 또는 뭔가 다른 도움을 줄 수 있습니다. –