2013-07-09 2 views
-1

.NET에서 정규 표현식에 대해 MSDN에서 읽었지만 올바른 패턴이 무엇인지 파악하는 데 어려움이 있습니다. HTML 파일에서 'width = "200"height = "200"/>을 추출해야합니다. 나는 그것과 함께 따옴표를 필요로한다. 내가 사용해야 할 올바른 패턴은 무엇입니까?.NET RegEx 따옴표로 HTML 특성을 추출하는 패턴

+1

[광기를 막으십시오.] (http://stackoverflow.com/a/1732454/21727). – mbeckish

답변

1

특정 HTML 페이지가 주어지면 해당 페이지의 속성을 가져올 수있는 정규 표현식을 만들 수 있습니다. 그러나 특정 페이지가 하나만있는 경우 속성 값을 하드 코딩 할 수 있습니다. 그러나 아마 어떤 페이지에서라도 속성 값을 가져올 수 있기를 원할 것입니다. 정규 표현식으로는 그렇게 할 수 없습니다. 정말로, 당신은 그렇게 할 수 없으며 그렇게하려고하면 당신을 실패의 무한 루프로 인도 할 것입니다.

HTML Agility Pack; 그것은 당신이 물어 본 것과 정확히 일치하도록 설계되었습니다. 형식이 잘못된 실제 HTML을 사용하는 경우에도 마찬가지입니다.

+0

HTML 파일은 항상 동일하며 항상 동일한 속성을가집니다. 파일에서 'width = "200"height = "200"'과 일치시킬 필요가 있습니다. HTML Agility Pack을 살펴 보았습니다. 머리를 주셔서 감사합니다! – user2510712

+2

항상 동일하면 응용 프로그램에서 하드 코드 '200'을 지정하십시오. 작동하지 않으면 regexes가 작동하지 않으므로 민첩성 팩을 사용해야합니다. –

+0

감사합니다. 나는이 다른 접근해야 ... – user2510712