2014-11-15 1 views
0

batch_import 유틸리티를 사용하여 두 속성으로 .. 각각 neo4j에서 50 만 개의 노드를 가져옵니다.속성 이름이 고유 할 때 neo4j 일괄 가져 오기 크롤링

각 노드는 URL을 나타내며 속성 중 하나는 URL의 해시입니다.

로딩 속도가 매우 느립니다. 확실히 3 시간 이상 걸립니다.

generate.sh를 사용하여 비슷한 그래프를로드하려고 시도했지만 몇 초 만에로드됩니다.

내 질문에 : 어떤 식 으로든 가져 오기에 영향을주는 속성으로 URL 해시가 있습니까?

+0

프로필을 가져 와서 CSVReader.parseline() 내부에서 반복되는 것처럼 보입니다. – lambogambo

답변

1

는 해결 ... 나는 "url 및 CSVParser 당신이 그것을 해결

1

다행 :-) ... 그 ... 에 붙어 그것을 이스케이프 사물이 18 초에서 만든 얻을있어했다. 우리 csvstat으로 돌아 다니며 길잃은 따옴표가있는 문제 유형을 확인하려고 시도했습니다.

관련 문제