2012-01-15 5 views
0

PHP 배열로 변환하려고하는 다른 웹 사이트에서 생성 한 html 테이블이 있습니다.PHP 배열에 속성을 가진 HTML 테이블

simplexml을 사용하여 변환 할 수 없습니다. 생성 된 테이블의 코드가 유효하지 않으며 많은 오류가 발생하며 테이블 요소의 일부 특성을 유지하고 다른 요소를 제거해야하기 때문입니다.

이 작업을 수행하는 가장 효율적인 방법은 무엇입니까? 아니면 이것을 달성하는 데 도움이 될 수있는 PHP 클래스를 아십니까?

현재 : 내가하려는 것은 학교 일정을 php 배열로 변환하여 나중에 사용할 수 있습니다. 여기

내가 검색 데이터의 예이다 : http://paste2.org/p/1869193

, BTW PHP 스트립 태그를 사용하여, 이미 같은 스팬 및 폰트와 같은 불필요한 태그를 제거한다.

+1

시도해보십시오. http://stackoverflow.com/questions/292926/robust-mature-html-parser-for-php HTML이 유효하지 않기 때문에 작동합니다. – Maher4Ever

+0

감사합니다!, 그것은 내 HTML을 청소하므로이 작업을 할 수 있습니다. –

+0

위대한, 나는 다른 사람에게 도움이 될 수있는 답변을 게시 할 것입니다. – Maher4Ever

답변

1
또한 사용할 수 있습니다

PHP의 (그것이 일부 설치 수에 디폴트로) 설치 한 경우 단정 한 - 그것은 HTML을 정리하지만, 또한 당신이 DOM 통과 할 수 있습니다뿐만 아니라 :

http://www.php.net/manual/en/book.tidy.php

+0

불행히도, 깔끔한 옵션이 없습니다 ... –

0

당신은 찾을 수 있습니다 SO에 대한 다음 질문의 답변에있는 HTML 파서 목록 : Robust and Mature HTML Parser for PHP

+0

고마워, 도움이되지만 문제를 해결하지 못합니다 = P –

+0

파싱하기 전에 HTML을 수정하는 파서를 빌드하는 것이 가능하지는 않습니다. 가장 좋은 방법은 파서에 먹이를주기 전에 HTML을 수정하는 것입니다. – Maher4Ever

관련 문제