저는 Python과 Git을 사용하여 프로젝트 작업을하고 있습니다. 내 스크립트는 git log -p
명령의 결과를 입력 한 파일에서 정보를 가져옵니다. 그래서 내가 좋아하는 일을 계속하고 싶어 :
- 아이디 (단순 문자열 라인) 커밋
- 작성자 이름 (간단한 문자열 라인)
- - 날짜 (I이와 종류 내 DB 싶어) 아이디 (간단한 문자열 라인)
병합
- 주석 (텍스트 블록)
- 다른 DIFF 블록 (텍스트 블록)데이터베이스에 대한 조언이 필요합니다.
은 내가 DB를 사용하고 싶어하지만, 내가 선택해야하는 하나 몰라. 내 스크립트는 350 만 줄의 파일을 처리하고 있습니다. DB에서 많은 작업을 수행해야하며 특히 정렬 작업이 필요합니다. 그래서 좀 빨리해야합니다. 내 DB에는 아마도 많은 라인이있을 것입니다!
나는 MongoDB
과 pymongo
을 사용하려고 시도했지만 좋은 선택이 아닌 것 같습니다.
조언이 있으십니까? 이 링크는
P.S. (나는 충분히 명확하지 않다 경우, 알려주세요) 나 http://en.wikipedia.org/wiki/Comparison_of_relational_database_management_systems
에 대해 좀 어려웠다 그것은 파이썬 3.x와 함께 사용하기 쉽습니다! 당신의 도움이
네 말이 맞아, 나는 분명하지 않다. 음, 우선 SQL이나 NOSQL을 사용해야하는지 모르겠습니다. 나는 mongoDB를 시도했지만 좋은 선택인지 궁금 해서요. 게다가 인덱스에 몇 가지 문제가 있습니다. sqlite를 살펴 보겠습니다. 귀하의 답변을 주셔서 감사합니다 – F0UF
@ F0UF 귀하의 질문은 엄청나게 막연합니다. 귀하의 질문이 혼란 스럽다는 불만보다 많지 않은 경우에는 도움이되는 답변을받지 못할 것입니다. 어쨌든 대부분의 문제는 데이터베이스를 사용하여 해결할 수 있습니다. 자신이 편한 편을 선택하고 문제가 발생하면 재평가하십시오. – Marcin
확인. 죄송합니다. 질문이 모호하면 경험이 없습니다. 어쨌든 당신의 도움에 감사드립니다. – F0UF