3

나는 Freebase 덤프에서 모든 명명 된 엔티티와 유형을 추출하려고합니다.Freebase에있는 모든 엔티티의 이름과 유형을 어떻게 추출 할 수 있습니까?

나는 보았다 How to extract Freebase Data Dump for a particular topic 그러나 Freebase 덤프에서 실제 이름이 지정된 엔티티를 얻지 못했습니다.

I'am이 같은 정보 뭔가를 얻으려고 노력, 이름 : 바락 오바마 유형 : 사람 이름 : 뉴욕 유형 : 도시 등

하는 Freebase가 이미 데이터베이스에있는 모든 이들 엔티티를 가진 되나 나는 Freebase API 또는 Google API를 발견하지 못했고 모든 엔티티와 그 유형을 나열했습니다.

도와주세요.

감사합니다.

답변

3

데이터 덤프 형식은 here입니다. 당신이 참조하는 대답을 쓴 이후로 약간 바뀌었지만 기본 원칙은 여전히 ​​동일합니다.

MQLreadSearch API는 Freebase 주제를 특정 유형 (예 :/people/person 유형)으로 필터링하는 데 사용할 수 있습니다. 주제에는 여러 유형이있을 수 있지만 원하는 경우 고전 NER 유형이 있다면 가장 먼저 수행해야 할 작업은 수천만 개의 주제 중 Freebase에 약 300 만 명의 사람들이 있기 때문에 원하는 유형별로 필터링하는 것입니다. .

Freebase에는 NER 작업에서 유용 할 수있는 이름 이외의 많은 정보가 포함되어 있기 때문에 한 걸음 물러서서 추출하려는 다른 속성에 대해 생각해보십시오.

+2

답장을 보내 주셔서 감사합니다. Topic to category mapping을 찾고 있었고 마침내 WikiDump를 사용하여 매핑을 얻을 수있었습니다. 여기서 각 위키피디아 제목에 대한 카테고리/카테고리를 얻을 수 있습니다. 참조 : http://wiki.dbpedia.org/Downloads39 –

+1

해당 페이지의 어느 DBpedia 파일을 사용했는지 모르겠지만 Freebase 덤프에서 동일한 정보를 사용할 수 있습니다. DBpedia와 Freebase은 서로 다른 강점과 약점을 가지고 있으므로 두 가지를 모두 살펴볼 가치가 있습니다. –

+1

필자는 wikipedia 데이터 집합을 사용하여 쿼리 분류를 구현했습니다. 처음에는 더 많은 데이터 집합을 가지고 있으므로 freebase에서 범주 그래프를 가져올 계획이었습니다. 마침내 우리는 위키 카테고리 그래프와 함께 가기로 결정했습니다. dbpedia에서는 http://wiki.dbpedia.org/Downloads39#articles-categories 및 http://wiki.dbpedia.org/Downloads39#categories-skos 파일을 사용했습니다. –

관련 문제