저는 새로운 C# 프로그래머입니다. 나는 그들이이 형식에있는 경우 PDF 파일 (책)에서 헤더를 추출하는 간단한 C# 응용 프로그램 만들려고 노력 해요 :여러 줄의 머리글에 대한 정규식 C#
1.1 전기/전자 산업
1.2 간략한 역사를
: 측정string pattern = @"(\d+)(\.)(\d+) ([A-Z]+).([A-Z]+).([A-Z]+).([A-Z]+).([A-Z]+)"; Regex.match(strText,pattern);
1.3 단위는
나는 코드를 사용하고 있습니다
단일 행 헤더에서는 제대로 작동하지만 두 행/다중 행 헤더에서는 작동하지 않습니다. 아무도 도와 줄 수 있습니까?
목차 같은 것이 있습니까? 책의 전체 텍스트를 단일 문자열로 간주하고 정규 표현식을 한 번 실행하면 정규 표현식을 사용할 수 없습니다. 많은 가양 성을 포착하고 일부는 누락 될 가능성이 큽니다. – SledgeHammer
그 정규식은 당신이 생각하는대로하지 않습니다. 예를 들어'XYZ1.2 A BRIEF HISTORY' 행과 일치 할 것이고 '2.4 SUMMARY' 행과 일치하지 않을 것입니다. 나는 당신이 정규 표현식에 대한 튜토리얼을 찾을 것을 권한다. – AdrianHHH
그래, 나는이 책의 전체 내용을 말하고있다. 그것이 형식이 잘되어 있기 때문에 그것을 선택합니다.작동하는 것처럼 보이지만, 그래도 해결할 수있는 사소한 문제가 있습니다. @SledgeHammer – rabinmallick