2011-05-10 3 views

답변

4

HTMLAgility pack을 보면이 유형의 작업이 매우 쉽고 정규식이 아닙니다.

+1

더 빠른 솔루션이 있습니까? 현재'indexOf'를 사용합니다. – Xaqron

+0

@Xaqron 정규식 또는 파서가 가장 빠른 두 가지 옵션입니다. XHTML을 사용하는 경우 LINQ-to-XML –

1

당신이 당신의 C# 응용 프로그램 내에서 HTML을 구문 분석해야 할 경우 당신이 XML로 이것을 구문 분석 할 수 아마도 최고야 값을 따려면 여기 http://htmlagilitypack.codeplex.com/

0

에서 HTMLAgilityPack을 사용하는 것이 좋습니다. 표준 XML 또는 LINQ를 선택할 수 있습니다.

일부 예로는 here 또는 here입니다.

+2

을 사용해 볼 수 있습니다. 그러나 대부분의 경우 HTML은 유효한 XML 문서가 아니므로 실패합니다. – DanielB

0

왜 정규 표현식을 사용하지 않습니까? 이 MSDN Regular Expression Documentation, 거기에 Extracting a Single Match or the First Match 섹션을 찾을 수 있습니다.

+0

정규 표현식은 CPU를 사용하고 구현하기가 쉽지 않습니다. – Xaqron

+1

"정규식은 CPU를 먹습니다"- 그래서이 시간을 100,000 번 실행 하시겠습니까? 성능이 중요한 요소입니까? –

+0

.NET에서 Regex를 구현하는 것은 매우 쉽습니다. 클래스가 있습니다. 올바른 패턴 표현을 작성하는 것이 더 까다 롭지 만이를 도와주는 도구 (및 stackoverflow)가 있습니다. 성능 부분에 관해서는 @Lee Gunn이 올바른 질문을 던졌습니다. – PedroC88