Java에서 html 테이블에서 정보를 가져 오는 프로그램에 몇 가지 문제가 있습니다. 나는 다음과 같은 정규식을 사용하는 모든 열에서 정보를 가져올 수 : 이것은 나를 위해 아주 좋은 작동Java에서 정규 표현식을 결합
<td>([^<]*)</td>
. 이것은 또한 작동하고
<a[^>]*>(.*?)</a>
아주 아주 좋은 : 는 Linknames를 가져 오는 동안 나는이 사용합니다.
<td>([^<]*)</td>|<a[^>]*>(.*?)</a>
내가이 같은 일 것이라고 생각
:. 는하지만 가끔은 내가 그러므로 나는 이러한 정규 표현식을 결합하고 싶었다 링크가에있는 열에서 정보를 필요로
을 그것은 모든를 얻을 수 물건이 링크를 경우 그것은 단지 LINKNAME에게 또한 얻을
<td>
사이</td>
입니다 것은
하지만 작동하지 않습니다. 저는 RegEx에서 최고가 아니기 때문에이 두 단계를 결합하는 데 도움이 필요합니다.
대단히 감사합니다.
"Java의 html 테이블에서 정보를 가져 오는 프로그램에 몇 가지 문제가 있습니다." regex로 html을 파싱하지 마십시오 – Falmarri
_이 것은 작동하지 않습니다. 사용중인 코드와 문제를 명확하게 보여주는 짧은 재현 가능한 예제를 보내주십시오. – Keppil
많은 사람들이 HTML을 정규식으로 구문 분석하는 것을 선호하지 않는다는 것을 알고 있습니다. 그러나 그것은 항상 나를 위해 일하고있었습니다. 그리고 그것을 결합 할 수있는 가능성이 있음을 압니다. – TacoVox