2009-05-15 3 views
3

mht 파일이 있는데, mht의 모든 텍스트를 가져오고 싶습니다. 나는 정규 표현식을 사용하는 법을 배웠지 만 영어 이외의 다른 언어를 사용하기 때문에 A7 = A98 = D6과 같은 내용이 텍스트 자체에 포함되어있다 ...mht에서 텍스트 추출

브라우저에서 본 파일의 모든 텍스트를 선택한 다음 복사하여 메모장에 붙여 넣으십시오. 이것이 내가 필요한 것입니다.

감사합니다.

답변

1

Internet Explorer에서 파일을 열고 일반 텍스트 (UTF-8)로 저장하십시오. :) 자동화 된 솔루션이 필요한 경우 플랫폼 또는 프로그래밍 언어 용 txt 변환기에 대한 mht를 찾으십시오.

사실, 당신은뿐만 아니라 PowerShell에서이 작업을 자동화 할 수 있습니다 : 나는 C#을 사용하고 있습니다

$ie = New-Object -ComObject "InternetExplorer.Application" 
$ie.Navigate2("file:///C:/MyFile.mht") 
$text = $ie.Document.documentElement.innerText 
+0

, TXT 계산기에 MHT가? PowerShell을 C# 응용 프로그램과 함께 사용하려면 어떻게해야합니까? –

+0

그런 경우 적절한 .NET 라이브러리가 필요합니다. 더 많은 답변을 얻으려면 "C#"및 ".net"으로 질문에 태그를 지정해야합니다. –

+0

C# 응용 프로그램에서 Powershell을 호출 할 수도 있습니다. 이것은 빠르게 타오르는 일이 아니지만 효과가 있습니다. 예를 들어 여기를 참고하십시오 : http://www.codeproject.com/KB/cs/HowToRunPowerShell.aspx –