2011-05-10 3 views
1

페이스 북 그래프 API에서 데이터를 가져 와서 분석하여 한 사람이 다른 사람과 얼마나 가까운지 알 수 있습니다. 내가 RESTful 웹 서비스를 통해 내 다른 응용 프로그램에서 사용할 수 있도록 그래프 API에서 정보를 저장하는 SqlAlchemy (지금은 SQLite 데이터베이스에 연결되어 있습니다)와 함께 Pylons 프레임 워크를 사용하려고합니다. 나는 데이터를 분석하는 최선의 방법이 무엇인지 궁금하다.Python, Pylons 및 Sqlalchemy : Facebook 그래프 API 분석

예를 들어 그래프 API (사용자, 게시물, 상태 등)의 노드 및 가장자리와 유사한 개체를 만들어 분석해야만 해당 분석의 여파 만 데이터베이스, 아마도 UID 각 노드의 연결과 다른 노드에 대한 연결? 아니면 사용자와 친한 친구 만 데이터베이스를 저장해야합니까? 아니면 단계별로 가서 데이터베이스의 ORM 매퍼를 통해 각 개체를 저장하고 데이터베이스를 채운 후에 분석을 수행해야합니까?

이와 같은 상황에서 데이터베이스를 설계 할 때는 어떤 문제가 있습니까? 객체는 모델과 어떻게 관련이 있어야합니까? 데이터를 가져 와서 저장하는 전체 과정에서 분석은 어디에서 수행되어야합니까?

답변

1

가능한 한 많이 저장하고 가능한 모든 것을 버리십시오. 나중에 트래버스/분석 할 수 있도록 노드 간의 관계를 유지하십시오. 이를 통해 원하는만큼 데이터 세트를 분석하고 반복해서 시도 할 수 있습니다. SQLAlchemy를 사용하고자한다면 간단한 자기 참조 관계를 사용할 수 있습니다 : http://www.sqlalchemy.org/docs/05/mappers.html#adjacency-list-relationships. 그렇게하면 객체 간의 연결을 쉽게 유지하고 쉽게 이동할 수 있습니다. 또한 MongoDB 사용에 대해 생각해야합니다. 이런 종류의 일에 꽤 유용합니다. Facebook에서 얻은 JSON 응답을 MongoDB로 덤프 할 수 있습니다. 그것은 또한 훌륭한 파이썬 클라이언트를 가지고 있습니다. MongoDB에서 나무를 저장하는 MongoDB 문서는 다음과 같습니다 : http://www.mongodb.org/display/DOCS/Trees+in+MongoDB. 거기에 의미가있는 몇 가지 접근법이 있습니다.

관련 문제