Datapower - HTML을 구문 분석하려면

기본 애플리케이션에서 UI 레이어를 제공하는 상황에서 포틀릿으로 렌더링해야합니다. 그러나 원래 포틀렛에서 렌더링 된 UI의 모든 부분을 표시하고 싶지는 않습니다.Datapower - HTML을 구문 분석하려면

제안 된 솔루션 : XML을 분석하는 데 Datapower를 사용하여 HTML을 구문 분석 할 수 있는지 궁금합니다. HTML이 항상 잘 형성되지는 않을 수도 있습니다. 그러나 기본 애플리케이션에 HTML 페이지가 거의 없다면 계약을 시행 할 수 있습니다 ..

또한 DP를 사용하여 HTML에서 데이터를 구문 분석하고 추출하는 경우 결과 (XML 및 XML)는 HTML5를 제작하는 데 사용되었습니다.

그래서 질문 : Datapower를 사용하여 HTML 페이지를 구문 분석하여 XML을 추출하는 것이 좋습니다? 전제 조건 : 응용 프로그램 당 HTML 페이지 수는 데이터가 다를 수 있지만 많은 페이지가 다를 수 있습니다.

출처

2012-07-13 emeralddove

-1

구문 분석 및 HTML 페이지는 일부 처리를 원할 때 발생합니다. 이 경우, 기본적으로 datapower는 올바른 형식의 XML 또는 HTML 문서 내부에 하이퍼 링크를 허용하지 않으므로 [보안 위험으로 간주됩니다] 그러나 XML 관리자의 적절한 설정으로이를 극복 할 수 있기 때문에 문제가 발생할 수 있습니다.

HTML 페이지 구문 분석에 관한 한 Datapower being과 ESB layer는 메시지 형식 변환을 제공 할 것으로 기대되며 실제로 그렇게합니다. 따라서 메시지 형식 변환을 수행하는 것이 좋습니다. 실제로 HTML을 XML 문서로 구문 분석하려고 할 때 위에서 언급 한 문제에 직면하게됩니다.

구문 분석을 수행하면 [이론적으로] 원하는 모든 메시지 형식 모델을 생성 할 수 있으므로 XSLT를 사용하여 원하는 것을 얻을 수 있습니다.

Ajitabh

출처

2013-12-06 13:06:51

난 당신이 데이터 파워를 사용하여 HTML을 구문 분석 할 수 없습니다 생각한다. DataPower는 올바른 형식의 XML을 구문 분석 할 수 있지만 HTML은 명시 적으로 xHTML로 디자인되어 있지 않으면 잘 형성되지 못하는 태그로 가득 차 있습니다.

많은 웹 페이지는 <br> 또는 <ul><li>Item1<li>Item2<li>Item3</ul>과 같은 태그로 가득 차 있습니다. 모두 구문 분석에 실패하게됩니다.

제안 된 접근법을 실제로 따르고 싶다면 WAS와 같이 더 유연한 플랫폼에서 뭔가를해야 할 것입니다. 여기서 어디서나 당신을 위해 모든 것을 처리하는 파서를 만들거나 재사용 할 수 있습니다.

생각해 보면 웹 브라우저가하는 일입니다. 잘못된 형식의 XML 태그 (예 : HTML)를 유효한 DOM 구조로 변환하는 모든 복잡한 규칙이 있습니다. HTML보다는 DOM 수준에서 조작하는 것이 더 좋을 것 같아서 기존의 잘 테스트 된 파싱 솔루션을 활용하고 데이터 구조에 집중할 수 있습니다. 자바 스크립트를 사용하여이 클라이언트 측을 수행하거나 Rhino 또는 PhantomJS와 같은 서버 측 JavaScript 옵션을 살펴볼 수 있습니다.

모든 것이 어려운 일일 수 있습니다. 기본 응용 프로그램에 IT가 페이지를 렌더링하는 데 사용하는 API 또는 웹 서비스가 있는지 여부를 확인하여 기존 프리젠 테이션 계층을 사용하지 않고 데이터를 가져올 수 있습니까?

건배, 크리스

출처

2014-03-31 02:04:48 ChrisC

Datapower - HTML을 구문 분석하려면

답변

관련 문제