2010-04-13 3 views
3

커다란 속성을 표시하는 큰 data.frame이 있습니다. Stackoverflow에 대한 질문을하고 싶습니다. 데이터와 프레임을 붙여 넣을 수있는 형식으로 data.frame을 작성하면 다른 사람이 쉽게 실행할 수 있고 다시 사용할 수 있습니다. data.frame 개체를 다시 만듭니다. 이 작업을 수행하는 쉬운 방법이 있습니까? 또한, 정말로 길다면 여기에 직접 붙여 넣는 대신 붙여 넣기 상자를 사용해야합니까?R : data.frame을 어떻게 써서 다른 사람이 읽을 수 있도록 붙여 넣을 수 있습니까?

답변

4

질문에 직접 대답하려면 가장 쉬운 방법은 summary() 또는 head()을 사용하여 데이터 프레임에 대한 정보를 표시하는 것입니다. 실제 데이터를 SO 질문에 붙여 넣지 말고 공동체가 재생할 데이터에 공개 링크를 제공하는 것이 좋습니다. 보지 못했다면 box.net 서비스는 온라인 협업을위한 여유 공간을 많이 제공합니다.

마지막으로, 데이터가 플롯 될 때 이상한 행동을 보이는 경우, 플롯을 수행하는 데 사용중인 코드를 제공하지 않아야하며 일부 예제는 자체적으로 플롯합니다.

0

dump은 데이터 프레임이 너무 크지 않을 때 잘 작동합니다.

+0

을하지만 영업 이익은 당신이 훌륭한 질문입니다 생각한다면, 당신이 그것을 찬성 투표한다 –

1

이것은 훌륭한 질문입니다.

다음은 내 질문입니다.이 질문에 수반되는 데이터를 제공하는 더 나은 질문을하는 것이 좋습니다. 나는 아마 아래의 제안들 모두를 위반했을 것이다. 그러나 적어도 미래에 참조 할 것이 있으며 아마 다른 사람들에게도 유용 할 것이다.

먼저, 내가 의 미래는 그들이 문제의 일반적인 클래스를 해결할 수 있도록 질문을 누군가가 충분히 추상화 답변

  • 을 선호 것으로 의심되는 현재의 문제에 대한 속한다; 및 에

    충분히 실용적인 지침 (보통이 실제 R 코드를 의미)와
  • 실제로 단지 우리 앞에 을의 문제를 해결한다.

가 다시 : 귀하의 질문에 추상화 (보통) 또한 더 유용한 답변을 의미하지만, 대답, 추상화의 결과가 실제로 허용 답변을 얻을 수 있습니다 가능성을 증가 - 그것은 지역 사회에 그 확률이 ​​낮다 전에 정확한 데이터 세트를 보았습니다. 여기 누군가가 패턴을 인식 할 가능성이 훨씬 더 큽니다. 그러나 패턴은 너무 많은 데이터에 의해 가려 질 수 있습니다.

두 번째 두 번째로 적절하게 설명하는 데 필요한 데이터의 양은 실제로 중요하지 않습니다. 중요한 것은 R 환경으로 데이터를 가져 오는 사람들이 질문에 답하는 데 걸리는 시간입니다. 기본 R 배포본에 제공된 50,000 행의 데이터 세트가 있습니다. 몇 번의 키 입력으로 R에 데이터를 가져올 수 있기 때문에 중요하지 않습니다. 무엇보다, 만약 당신이 그 데이터 세트 중 하나를 참조 할 수 있다면 질문 창 내에서 잘라내어 붙일 필요가 없습니다. 대조적으로, 나는 사람들이 SO 페이지에서 몇 줄의 데이터까지 긁어내어 강제로 내 질문을 올바르게 이해할 수있게하는 것을 피하려고 노력한다. (더크를 제외하고 그는 그의 머리에서 계산을한다.)

제 3의은 절대적으로 필요한 경우가 아니라면 질문 (모든 열)에있는 데이터 세트의 전체 너비를 잘라내어 붙여 넣습니다. 이 데이터는 간결한 문제 설명을 대체하는 것이 아닙니다. 나는 OP가 1 ~ 2 분을 소비하고 실제 데이터 세트를 다듬어 실제로 질문을 설명하는 데 필요한 것 이상의 데이터를 제공하지 않기를 바란다.

제 4의의 경우 데이터가 수식 또는 알고리즘에 의해 '제공'될 수 있다면 그냥 제공하십시오. 예를 들어 임의의 보행과 관련된 질문 인 경우 데이터가 필요 없으며 "임의 보행"이라고 말하면 거의 모든 사람들이 짧은 코드 행에서 데이터를 생성 할 수 있습니다.

+0

* 대형 * data.frame ... 말했다 :

마지막으로,이 질문에 대한 답변을 확인합니다. 그냥 말하기 : – frankc

2

먼저 드류 (Drew)의 아이디어는 매우 훌륭합니다.

또한 데이터를 줄이고 이상한 부분을 분리하면 dput()을 사용하십시오. 다른 사람들이 그것을로드 할 수 있도록하는 가장 직접적인 방법입니다. 데이터를 합리적인 수준으로 줄여야합니다.

그렇지 않으면 http를 통해 액세스 할 수있는 위치에 csv 파일로 게시하고 사람들은 read.csv를 사용하여 직접 읽을 수 있습니다. 매우 큰 데이터 세트로 사람들에게 도움을 요청하는 것은 불합리하지만. How do I load example datasets in R?

+0

날짜, 요인 등이 동일하고 OP가 자신의 시스템에 가지고있는 것을 대표하도록하기 위해 어딘가에 CSV를 rdata 파일로 호스팅하는 것이 좋습니다. – A5C1D2H2I1M1N2O1R2T1

관련 문제