2010-07-03 5 views
4

또는 R에서 SQL로 수행하는 방법 목록 (또는 그 반대)?SQL 명령과 R ​​명령을 비교하는 테이블이 있습니까?

감사합니다,

+0

무엇처럼? 어떤 종류의 작업을하려고합니까? – nico

+0

안녕 니코, ​​모든 작업을 언급합니다. SQL 사용자를위한 R과 같은 것이 있는지 확인하려고합니다 (SAS 사용자를 위해 R 책이있는 것처럼). 그래서 R에 대한 지식을 활용하여 SQL/ –

답변

2

당신은 여호수아 제국의 presentation on R and SQL 볼 수 있었다 (11 페이지 참조).

+0

감사합니다 쉐인 - 정확히 내가 무엇을 찾고 있었습니까. 이것이 제가 찾을 수있는 가장 큰 테이블이라고 생각합니까? –

+0

잘 모르겠습니다 ... 제가 알고있는 유일한 것입니다. – Shane

3

sqldfpackage 아마도 여기에 도움이 될 수 있을까요?

셰인이 위에서 언급 한 프리젠 테이션을 수반 한 Joshua의 talk도 있습니다.

+0

감사합니다. Radek - 그 패키지는 실제로 저에게 질문에 대한 아이디어를주었습니다. 아무도 그런 짓을하지 않는 방법에 흥미 롭습니다. 어쩌면 이것은 R 커뮤니티 프로젝트의 일종이어야합니다. (즉, SQL 작업을 많이하고 R에서 모든 작업을 컴파일 할 것입니다. http://rosettacode.org/ wiki/카테고리 : Database_operations). –

+0

저에게 있어서는 행복 할 것입니다. SQL로 데이터를 관리하는 것이 훨씬 편하다고 느낍니다. 재미있는 로제타 링크에 감사드립니다. – radek

1

RMysQL 패키지도 살펴볼 가치가 있습니다.

R에서 가져 오기 전에 텍스트로 덤프 할 수없는 매우 큰 데이터 세트로 작업합니다.이 패키지를 사용하면 R 내에서 표준 데이터 쿼리를 사용하여 데이터의 하위 집합을 가져올 수 있습니다.

+0

감사합니다. 나는 약 2 년 전에 그걸 가지고 놀았습니다.연결 시간이 매우 길다는 것을 기억합니다. 아직도 문제가 남아 있습니까? –

+0

원시 쿼리 나 다른 언어의 래퍼에 비해 RMySQL 작업이 매우 느립니다. – neilfws

+0

나는 그것을 비교적 빨리 발견한다. 나는 그것이 반복적으로해야하는 것이 아니라는 것을 강조해야하지만. 워크 플로 (http://stackoverflow.com/questions/1429907/workflow-for-statistical-analysis-and-report-writing/1434424#1434424)를 사용하면 쿼리가 한 번만 발생하고 .rdata 파일에 기록됩니다. 후속 실행에서는 .rdata 파일을 읽고 쿼리를 반복해서 실행하지 않습니다. 데이터베이스가 변경되면 1 단계와 2 단계를 다시 실행합니다. – Maiasaura

2

sqldf 패키지의 도움말 (sqldf) 페이지 맨 아래에있는 예제 섹션에는 상당수의 SQL 명령과 해당 R 명령이 있습니다.

1

저는 최근에 RMySQL을 사용하여 작업을 시작했으며 패키지를 정말 좋아합니다. 난 그냥 R 자체에서 기본적인 SQL 쿼리를 실행합니다. 대부분의 데이터 재배치는 몇 개의 독립적 인 SQL 스크립트, 기본적으로 일부 저장 프로 시저에서 수행됩니다.

필자는 R이 좋은 통합 기능을 갖춘 통계 패키지이지만 관계형 데이터를 그런 식으로 처리하지는 않는다고 생각합니다. 저는 마이크로 데이터로 많은 작업을하고 이러한 마이크로 데이터로부터 비 관계형 데이터 셋을 설정해야합니다 (그리고 회귀 분석과 ggplot2 (!) 플로팅에 R 사용). R에 연결하기 전에 SQL 자체에서 데이터 집계를 수행합니다.

또한 뷰를 사용하는 것이 좋습니다 (충분히 빠르면). R은 list tables 문을 사용하여 일반 테이블처럼 액세스합니다.

거기에 RPostgreSQL 외에도, postgreSQL에 시험해보고 싶다면. 한번 시도했지만 RMySQL로 바꿨습니다. RPostgreSQL이 내 Mac에 설치하기가 너무 어려웠 기 때문에, 업데이트 후에 설정이 사라졌습니다. RMySQL은 훨씬 쉬웠습니다. 당시에는 패키지를 자체적으로 컴파일해야했기 때문에 다른 OS를 실행하면 바이너리 (또는 현재 Mac OS가 있습니다)가 생길 수 있습니다.

RMySQL을 사용하는 경우에도 RPostgreSQL에 관한 몇 가지 문헌이 있으며, 특히 TSeries (TM) 데이터 (예 : TSPostgreSQL)에 사용할 계획이라면 도움이 될 수 있습니다.

관련 문제