wikipedia

    6

    2답변

    위키피디아 데이터 덤프 (bz2 형식으로 압축)에 대한 연구를하기 위해 Hadoop Map Reduce를 사용하고 있습니다. 이 덤프는 너무 크기 때문에 (5T), xml 데이터를 HDFS로 압축 해제 할 수 없으며 hadoop이 제공하는 StreamXmlRecordReader를 사용합니다. Hadoop은 bz2 파일의 압축을 지원하지만 페이지를 임의로 분

    11

    3답변

    "title"속성을 사용하여 팝업을 만드는 것은 매우 쉽습니다. SVG. 그러나 CSS로 어떻게 동일한 효과를 얻을 수 있습니까? 이것은 위키 미디어를 위해 제작 한 일러스트레이션을위한 것으로, 스타일 속성을 실제 주제별로 그룹화하여 포함 된 스타일 시트 내에서 위키 백과의 다른 대부분의 수정 작업을 수행하기 위해 노력하고 있습니다. 대부분의 위키 피 디아

    3

    1답변

    위키 피 디아 카테고리를 내 보낸 후 포함 템플릿을 확인한 후 MediWiki 설치로 가져 왔지만 모든 페이지가 엉망이되었습니다. 필요한 모든 템플릿을 얻는 방법 페이지가 제대로 표시됩니까?

    2

    1답변

    "major + histocompatibility + complex + class + II + antigen"텍스트 쿼리의 경우 web 및 api 인터페이스를 사용하여 다른 결과를 얻습니다. API를 사용하여 웹 인터페이스와 동일한 결과를 얻는 방법이 있습니까? 웹 인터페이스 검색어 : API를 http://en.wikipedia.org/w/api.php?

    0

    1답변

    위키 피 디의 모호성 제거 페이지를 사용하여 일부 모호성 제거를하려고합니다. 나는 http://en.wikipedia.org/w/api.php?action=query&prop=links&format=json&titles=stack%20overflow_(disambiguation) 난 괜찮아 링크를 얻을 쿼리를 사용하여 동음이의 문서에서 링크의 목록을 얻

    2

    1답변

    이 사이트에 다른 질문을 읽고 - wikipedia api: get parsed introduction only 내가 내가 다시 위키 피 디아 문서의 첫 번째 섹션을 얻는 단계로 가지고있다 - 여기에 주어진 예 응답을 사용하여 . 그러나 첫 번째 섹션에는 그림과 텍스트가 포함됩니다. 내가 원하는 건 텍스트 뿐이야. 여기 내 컬 응답 $ Array ( [p

    2

    2답변

    아무도는 these의 파서가 위키 백과에서 사용됩니다. 그들 중 누구도 위키 코드를 올바르게 처리하지 못합니다. 누구나 위키 백과가 사용하는 파서를 아는 사람이 있습니까?

    0

    1답변

    실제 API를 사용하여 위키 백과 문서의 콘텐츠를 가져오고 싶습니다. 자, action=render과 action=raw에 대해 잘 알고 있지만 일반 텍스트에서 가능한 대부분의 베어 본 버전을 원합니다. 형식 지정, 링크 없음, 서식 파일 없음, 인용 없음 및 TOC 없음 예를 들면 다음 SO 페이지에서 발췌 한 내용을보실 수 있습니다 : <p><b>Sta

    1

    1답변

    누구나 파이썬 (및 django) 용 wikitools를 사용하여 위키 피 디아 페이지를 얻은 경험이 있습니까? 나는 기사를 얻으려고 노력하고있다. 그러나 나는 약간의 첫번째 선을 얻는다. 그리고 그것은 그것이다. 나는 전체 기사를 가져와야하고 나는 그것을 파악하는 것처럼 보일 수 없다. 문서도별로 도움이되지 않습니다. 내 코드 : wikiobj = wik

    1

    1답변

    파이썬과 MySQL을 사용하여 mediawiki 데이터베이스를 쿼리하여 기사의 현재 상태 (즉, 기사가 FA, GA, GAN 등)를 가져올 수 있지만 그렇게 할 수 없었습니다. 현재 상태가 텍스트 테이블의 old_text 필드에 저장되어 있다는 것을 알고 있습니다. 내가 좋아하는 뭔가를 시도했다 : loc = select (locate('currentsta