beautifulsoup

    2

    2답변

    필자는 BeautifulSoup에서 정확하게 구분 된 텍스트를 가져 와서 필요한 경우 태그를 공백으로 변환하려고합니다. 문제는 줄 바꿈이 축소되어 <br/>과 같은 태그가 공백으로 렌더링되지 않는다는 것입니다. <div class="companyInfo"> <p class="identInfo"> <acronym title="Standar

    0

    1답변

    나는 BeautifulSoup로 XML 파일을 구문 분석하려고한다. 그물에 모든 자습서에서는, xml의 내용은 xml = "<doc><tag1>Contents 1<tag2>Contents 2<tag1>Contents 3" soup = BeautifulStoneSoup(xml) 같이 주어진다 그러나 xml 파일의 경로 만주고 싶다. 기계화에서는 get_

    0

    2답변

    나는 아름 다운 스프와 일부 html 폼을 구문 분석 오전. 기본적으로 약 60 개의 입력 필드가 대부분 라디오 버튼과 체크 박스입니다. 지금까지 다음 코드와 함께 작동 : from BeautifulSoup import BeautifulSoup x = open('myfile.html','r').read() out = open('outfile.csv','

    1

    2답변

    나는 일부 웹 사이트를 긁어 모으기 위해 curlyrently BeautifulSoup을 사용하고 있지만 일부 특정 문자에 문제가 있습니다. UnicodeDammit 내부의 코드는 Microsoft가 발명 한 것임을 나타냅니다. 문제를 볼 수있는 from BeautifulSoup import BeautifulSoup soup = BeautifulSoup(

    3

    1답변

    나는 상당히 의심스러운 질문이 있습니다. http://www.europarl.europa.eu/sides/getDoc.do?type=REPORT&mode=XML&reference=A7-2010-2&language=EN : 나는 (당신이 아래로 모든 방법을 스크롤하는 경우는 "절차"라고 표시된 상자에 하나입니다) 마지막 테이블의 정보를 수집하려는 페이지의 다

    0

    1답변

    제목에서 알 수 있듯이 Python의 BS 모듈을 사용하여 Amazon API에서 액세스하는 XML 페이지를 구문 분석합니다 (서명 된 URL을 작성하고 liburl2로로드 한 다음 BS로 구문 분석). 그것은 두 페이지을 4 초 정도 걸리지 만 겠습니까 PHP가 빠를 빠른 방법이 있어야한다? 뭐가 속도가 느려지는데, 학사 분석이나 liburl로드?

    1

    1답변

    BeautifulSoup에서 unicode 함수를 사용할 때 유니 코드로 변환되는 인코딩은 무엇입니까? soup.originalEncoding이 자동으로 사용됩니까? from BeautifulSoup import BeautifulSoup doc = "<html><h1>Heading</h1><p>Text" soup = BeautifulSoup(doc)

    2

    2답변

    웹 사이트에서 데이터를 읽으려고합니다. 내가 필요한 값을 볼 수 있지만 값은 urllib2를 사용하여 다운로드 한 html 코드에 나타나지 않습니다. 값은 일부 js 파일에 의해 생성되고 해당 ID의 innerhtml로 웹 페이지에 포함됩니다. 추신 : 어떻게 추출 할 수 있습니까? 원시 소스 코드는 브라우저와 달리 js를 렌더링 할 수 없습니다!

    0

    1답변

    일부 html 구문 분석을 위해 BeautifulSoup을 사용하고 있습니다. <tr> <th>Your provider:</th> <td> <img src="/isp_logos/la-la-la.ico" alt=""/> <a href="/isp/SomeProvider"> Provider name </a>   <a href="http:/

    1

    1답변

    는 파이썬은 순간 테이블 TD <td class="result" valign="top" colspan="3"> 아름다운 수프 태그는, 다음은 작동하지 않습니다 for header in soup('table', 'td .result'): 얻기 오류 : HTMLParser.HTMLParseError: malformed start tag