첫 번째로, 나는 이것이 파서 프로그래밍에 단지 접선 적으로 관련되어 있다는 것을 깨닫기 때문에 사과합니다.파서 테스트를위한 대형 탭 계층 데이터 세트는 어디에서 찾을 수 있습니까?
시간을으로 보내면 다음과 같은 내용을 포함하지만 수백 (잘하면 수천) 개의 하위 항목이 포함 된 텍스트 파일을 찾습니다. 완전한 생물학적 분류 파일이 완벽 할 것입니다. 내 파서 간단한 탭 파일을 구문 분석으로 다음의 대규모 버전은 좋은 것 :
TL, DR - 나는 다음과 같은 설정 대규모 단일 파일 계층 데이터가 필요합니다
Kindoms
Monera
Protista
Fungi
Plants
Animals
Porifera
Sponges
Coelenterates
Hydra
Coral
Jellyfish
Platyhelminthes
Flatworms
Flukes
Nematodes
Roundworms
Tapeworms
Chordates
Urochordataes
Cephalochordates
Vertebrates
Fish
Amphibians
Reptiles
Birds
Mammals
을
내가 찾을 수 있었던 최선의 방법은 tree-of-life 이미지 (위에서 샘플 데이터 세트를 복사 한 것)입니다. 실제 데이터 톤이 1 개인 파일은 입니다.입니다. 그것은 생물학적 분류 데이터 세트 일 필요는 없지만, 실제 세계에서 무언가를 반영하기위한 데이터가 정말 좋을 것입니다. (내 파서는 메뉴를 제공합니다. 테스트의 나머지 부분이 실제로 어떤 것을 의미하는 데이터 세트를 사용하면 좋을 것입니다!) 파일이 탭으로 표시되지 않지만 데이터가 탭 형식으로 상당히 쉽게 regex'ed 되었더라도 ... 그게 좋을거야.
아이디어가 있으십니까? 감사!