2009-06-28 6 views
0

Brent's answer은 질문을 빨리 분석 할 수 있도록 SO 질문의 데이터베이스를 만들었다 고 제안합니다.Python으로 SO 질문의 MySQL 데이터베이스를 만들 수 없습니다.

브렌트와 비슷한 쿼리를 사용하여 MySQL을 연습 할 수 있도록 MySQL에서 비슷한 데이터베이스를 만드는 데 관심이 있습니다.

데이터베이스에 최소한 다음 필드가 포함되어야합니다 (API의 API가 sectet 인 것 같아서 여기에 추측합니다). 브렌트와 비슷한 분석을 할 수있는 관련 변수 만 나열하려고합니다.

  • 질문
  • Question_id (개인 키)
  • Question_time

  • 댓글

  • Comment_id (개인 키)
  • COMMENT_TIME

  • USER_ID (PRI 브렌트의 데이터베이스가 분명히 숨겨져 있기 때문에 우리는 분명히 필요가 되어진 키)

  • USER_NAME

파이썬의 아름다운 비누하여 데이터를 다 쳤어요.

파이썬의 아름다운 비누로 같은 MySQL 데이터베이스를 만들 수있는 방법

? **

+0

왜 데이터베이스를 만드나요? 검색 할 수 있도록 데이터베이스를 만들고 있습니까? SO가 검색을 제공하기 때문에 조금 어리석은 것처럼 보입니다. –

+0

@ S.Lott : MySQL을 연습하기 위해 데이터베이스를 만들고 있습니다. 나는 MySQL로 데이터 분석을하고자한다. –

답변

1

XML 데이터 덤프 @RichieHindle 언급과 함께 작업하는 것이 가능할 것이라고 확신하지만, @ nobody_의 sqlite 버전에 대해 더 행복했습니다. 특히 sqlite 버전에서 README 파일에 색인을 추가 한 후에는 더욱 그렇습니다.

완전한 인덱스 화 된 sqlite 버전이 있고 Python 태그가 지정된 하위 집합을 MySQL 데이터베이스로로드하려는 경우 두 개의 DB API 인스턴스를 사용하여 sqlite에서 읽는 간단하면서도 깔끔한 연습으로 볼 수 있습니다. (개인적으로 인덱스 생성이 완료되면 sqlite 성능이 완전히 만족 스럽다는 것을 개인적으로 발견 했으므로 서브 세트 추출도하지 않고 다른 DB 엔진으로 옮겨서도 안된다) - 아니 수프 비누가 필요하다. 어쨌든 lxml과 all에도 불구하고 XML에서 직접로드하는 것보다 훨씬 간단하고 빠릅니다.

물론 하위 집합로드를 수행하고 모든 코딩 작업에서 문제가 발생하면 스키마 및 코드 샘플, 오류 메시지 등이 있으면 요청하십시오. 그러면 SOers가 시도 할 것입니다. 답변, 평소대로 -)

+0

@ 답변 주셔서 감사합니다. --- 나는이 작은 문제들을 해결하고 해결책을 SO에 게시하기 위해 최선을 다할 것입니다. –

관련 문제