나는 word document (2003)을 가지고 있습니다. PowerShell을 사용하여 문서의 내용을 구문 분석합니다. 문서의 맨 위에는 몇 줄의 텍스트가 있고, 열 수와 텍스트가 다른 12 개의 테이블이 있습니다.테이블 등으로 단어 문서 (* .doc) 콘텐츠를 읽으십시오.
- 읽기 문서 (등 필요한 객체를 만들)
- 텍스트
- 의 각 라인 테이블의 일부가 아닌 경우에는 가져 오기 :
나는 아래 같은 무언가로 문서를 읽을 수 있기를 기대 , 텍스트 및 쓰기 출력 등의 과정을 다른
- 하면 테이블의 일부 (주문에 의해)
- 가져 오기 테이블 번호와 COL에 따라 출력을 구문 분석
아래는 내가 쓰기 시작 한 파워 쉘 스크립트입니다 umns
$objWord = New-Object -Com Word.Application
$objWord.Visible = $false
$objDocument = $objWord.Documents.Open($filename)
$paras = $objDocument.Paragraphs
foreach ($para in $paras)
{
Write-Output $para.Range.Text
}
이 단락은 내가 원하는 것입니다 있는지 확실하지 않다. 내 목적에 더 적합한 것이 있습니까? 지금 내가 얻는 것은 문서의 전체 내용입니다. 내가 얻은 것을 어떻게 제어 할 수 있습니까? 선을 얻고 싶으면 마치 표의 일부인지 아닌지를 결정하고 어떤 숫자 표를 기준으로 조치를 취할 수있게하십시오.
Word 문서는 라인으로 구성되지 않습니다. 한 발 뒤로 물러나서 해결책으로 인식하는 것이 아니라 해결하려는 문제를 설명하십시오. –
예 - 응답 해 주셔서 감사합니다 ... 그래서이 텍스트에는 약 5 ~ 6 개의 텍스트가 포함되어 있습니다. 각 테이블은 2에서 6까지 다양한 수의 컬럼을가집니다. 각 테이블의 첫 x 째 행은 헤더를 설명합니다. 나는 (Powershell을 사용하여) 문서를 읽고, Oracle 데이터베이스에 대해 개별적으로 실행할 수있는 테이블 및 출력 SQL 문을 분석합니다. 이제 이러한 문서가 많으며 구조가 서로 비슷합니다. 그러나 각 테이블에 행이 더 많거나 적을 수 있습니다. – Anoop