2016-10-20 2 views
0

펜타 호에서 .vcf.gz 파일을 읽어야합니다. "내용"탭의 "텍스트 파일 입력"에서 "압축"을 "GZ"로 읽을 수 있습니다.Pentaho가 머리말을 건너 뛰고 출력 할 파일 이름을 추가하십시오.

- 우선 헤더를 건너 뛸 필요가 있습니다 (기본적으로 #부터 시작하는 모든 행).

- 둘째, 모든 행에 파일 이름을 삽입 할 새 열을 삽입해야합니다.

예.

내 파일은 다음과 같습니다

#header 
#header 
#header 
# chr pos ref alt 
    chr1 3 A A 

내가 원하는 것은 :

chr1 3 A A id_001 (Taken readeing file name) 

내가 어떻게 이것을 달성 할 수 있습니까?

답변

1

콘텐츠 탭을 찾았 으면 머리글 확인란이 표시되어야합니다. 건너 뛸 줄 수를 지정할 수 있습니다. 파일 이름에 관해서는

enter image description here

는 "추가 출력 필드"탭을 당신이 필요합니다.

enter image description here

다음은 출력의 미리보기입니다 :

enter image description here

당신은 파일 이름에서 파일 확장자를 제거해야하는 경우, 그렇게 할 수있는 몇 가지 방법이 있습니다.

+0

음, 내가 잘못하고있는 것이 있습니다. 필요한 파일을 얻으려면 파일 경로를 설정했습니다. 필자가 제시 한대로 헤더 옵션이 변경되었습니다. 마지막 열을 추가했지만 마지막 열만 표시합니다. "탭"필드에서 뭔가를 바꿔야합니까? – xCloudx8

+0

아, 네가 몇 가지 필드가 필요합니다. 거기에 아무 것도 없습니까? – CGritton

+0

좋아, 필드 문제가 해결되었습니다. 파일 이름의 문제를 어떻게 관리 할 수 ​​있습니까? ? 내 이름은 다음과 같습니다. 001.genome.vcf.gz 첫 번째 이후에 모든 것을 삭제하고 싶으므로 001만을 사용하고 있습니다. 다른 옵션이 있습니까? – xCloudx8

관련 문제