extraction

    6

    4답변

    perl 함수 map을 사용하여 다음 작업을 수행하는 방법을 찾고 있습니다. 해시가 주어 졌으므로 쌍 (키, 값)이며, 값은 지정된 매개 변수와 같거나 일치합니다. 예를 들어, value = failed 인 경우 (키, 값) 쌍을 추출하고 싶지만 표현식 (즉, A 또는 REGEX로 시작하는 문자열) 일 수도 있습니다. 그래서 결과 값으로 값과 일치하는 키의

    1

    1답변

    PDF에서 제목 추출 (메타 데이터 사용)에 관해 많은 질문이있는 것 같습니다. 그러나 대부분의 제목은 메타 데이터에 존재하지 않는 것처럼 보입니다. http://pybrary.net/pyPdf/pythondoc-pyPdf.pdf.html을 사용할 때 이것을 발견했습니다. 어쨌든 실제로 PDF에서 텍스트 제목을 검색 할 수 있습니까? 텍스트 파일로 내보내려

    2

    6답변

    span 요소 다음에 번호 부분 만 추출하려면 어떻게합니까? <ul class="info"> <li class="name"><span class="textLabel">Name: </span>further (22)</li> <li>more stuff</li> <li>more stuff</li> </ul> 나는 .contents()를 사용하여 <li

    0

    1답변

    데이터베이스에 저장하기 위해 AutoCAD 모델을 쿼리하여 구조와 연결 (예 : 전원, 데이터)을 추출해야합니다. 경험과 연구를 통해 네이티브 AutoCAD .dwg를 처리하는 것은 형식의 독점적 특성으로 인해 문제가 있음을 알고 있습니다. 나는 AutoCAD가 .NET API을 가지고 있다는 것을 알았지 만, 본질적으로 그 모델의 내용을 선험적으로 알지

    1

    3답변

    HTML 페이지 분석과 관련하여 질문이 있습니다. 예를 들어 필요로하는 테이블에 정보가 들어있는 www.example.com/page.html 페이지가 있으며 www.example.com/page2.html에는 텍스트 형식의 몇 가지 다른 정보가 있습니다. 현재, 패턴을 삽입해야하는 정규식 (preg_match_all)을 사용하고 있습니다. 이 작업을 수행

    5

    2답변

    태그 외부에서 텍스트를 추출하고 싶습니다. 예를 들어 다른 태그 (p 또는 참조)에 텍스트가없는 경우에만 "This is an example"이라는 텍스트를 얻고 싶습니다. 몇 가지 방법을 시도했지만 작동하지 않습니다. Any1이 도와 줄 수 있습니까? 큰 감사를 드린다.

    0

    1답변

    나중에 분석 및 추출을 위해 C++ 프로그램 레코드 데이터가있는 라이브러리, 도구 또는 프레임 워크에 대해 알아 보려합니다. 나는 내가하고자하는 것에 대한 생각을하기 위해 내가 상상 한 것을 묘사하지만, 당신의 제안은 정확하게 그것을 요구할 필요는 없다. 내 프로그램에 기록 할 다른 레코드 유형을 지정하고 싶습니다. 예를 들어 장치에서 가져온 각 메시지 유

    1

    1답변

    내가 NO 확장자를 가진 일부 파일 (약 500 파일)을 가지고있다. 하지만 그 내용을 보았습니다. 이상한 태그와 물건이 있습니다. 는 좀 html 태그가 < 같은 HREF = "HTTP가, 또한 (71.129.195.163) ... 2 호선의 예를 들어 항상 같은 IP 주소가 .. 그것에서 모든 IP addreesses을 추출해야 : //www.xyz.c

    0

    1답변

    저는 pdf 전자 책에서 주제 모델링을하고 있으며 단락별로 텍스트 단락을 추출해야합니다. 이것을 위해 나는 PDF에서 텍스트를 효율적으로 추출하는 apache pdfBox를 사용하고 있습니다. PDFParser parser; PDFTextStripper pdfStrip = null; parsedText = pdfStrip.getText (pdDoc); 단락

    1

    1답변

    내 회사 온라인 상점의 제품 웹 페이지를 부분적으로 자동화하기 위해 짧고 비 균일 한 제품 설명에서 데이터를 추출하려고합니다. 불행히도, 설명은 일정하지 않습니다. 이 사이트 덕택에 정규식에 대해 충분히 배웠습니다. 제품 측정 방법에서는 실패한 테스트가 있습니다. w. This product is 68 cm by 22 cm by 73 cm -- Length