0
펜타 호에서 .vcf.gz 파일을 읽어야합니다. "내용"탭의 "텍스트 파일 입력"에서 "압축"을 "GZ"로 읽을 수 있습니다.Pentaho가 머리말을 건너 뛰고 출력 할 파일 이름을 추가하십시오.
- 우선 헤더를 건너 뛸 필요가 있습니다 (기본적으로 #부터 시작하는 모든 행).
- 둘째, 모든 행에 파일 이름을 삽입 할 새 열을 삽입해야합니다.
예.
내 파일은 다음과 같습니다
#header
#header
#header
# chr pos ref alt
chr1 3 A A
내가 원하는 것은 :
chr1 3 A A id_001 (Taken readeing file name)
내가 어떻게 이것을 달성 할 수 있습니까?
음, 내가 잘못하고있는 것이 있습니다. 필요한 파일을 얻으려면 파일 경로를 설정했습니다. 필자가 제시 한대로 헤더 옵션이 변경되었습니다. 마지막 열을 추가했지만 마지막 열만 표시합니다. "탭"필드에서 뭔가를 바꿔야합니까? – xCloudx8
아, 네가 몇 가지 필드가 필요합니다. 거기에 아무 것도 없습니까? – CGritton
좋아, 필드 문제가 해결되었습니다. 파일 이름의 문제를 어떻게 관리 할 수 있습니까? ? 내 이름은 다음과 같습니다. 001.genome.vcf.gz 첫 번째 이후에 모든 것을 삭제하고 싶으므로 001만을 사용하고 있습니다. 다른 옵션이 있습니까? – xCloudx8