2012-03-06 2 views
2

HTML 파일에서 정보를 추출하는 C# 모듈이 있습니다. 하지만 내 입력은 MHT 파일입니다. MHT 파일의 HTML 부분 만 추출하려면 어떻게해야합니까?C# MHT 파일에서 HTML을 추출하십시오.

+2

MHTML 파일은 _Mime HTML_ 파일입니다. 마임 파서/디코더가 필요합니다. [관련 질문] (http://stackoverflow.com/questions/3876406/basic-c-sharp-mime-decoding) –

+0

올바른 방향으로 나를 가리켜 주셔서 감사합니다! –

답변

1

여러 도구를 사용해 보았을 때 MHT의 내용을 추출 할 수 있다고 전했으나 거의 모든 것이 실패했습니다 (MHT 파일의 공급자가 일부 형식을 올바르게 인코딩하지 못하는 것으로 나타났습니다). 나는 결국 MHT의 압축을 풀고 html 부분 만 추출 할 수있는 Total Commander를 발견했다. 해킹 이었지만 일이 끝났습니다.

MHT를 만드는 데는 많은 도구가 있고 압축을 푸는 데는 도구가없는 것 같습니다.

관련 문제