2012-12-28 5 views
0

누군가가 나를 도울 수 있거나 적어도 나에게 좋은 조언을 주길 바랍니다. 과학 논문 (저자/연도/저널별로 분류)을 저장할 대형 데이터 프레임이 있습니다. 대부분의 과학 논문은 나에게 더 많은 레코드를 제공하므로 레코드가 속한 종이를 식별하는 고유 한 값 (n이라는 이름)을 반환하는 함수 (지금까지 성공하지 못함)를 작성하려고합니다.조건에 따라 변수에 값을 할당하는 방법

+3

스테파노, 안녕하세요. 재현 할 수있는 예제를 제공해 주시고 출력물이 어떻게 보이는지 설명하고 보여주십시오. 지금까지 시도한 것을 보여줘야합니다. 이 작업을 수행하는 방법에 대한 좋은 예가 많이 있습니다. http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example –

답변

1

고유 한 값을 계산하려면 digest 패키지의 digest 함수를 사용할 수 있습니다. 예를 들어 ,

library(digest) 
digest(c("Granger", "1987", "Econometrica")) 

는 게시에 대한 고유의 MD5 문자열을 반환합니다. digest은 벡터 가능하지 않습니다. 즉 데이터 프레임의 각 행에 대한 ID를 계산하려면 sapply 또는 이와 비슷한 값을 사용해야합니다.

+0

또는 덜 견고하게 ' ID 문자열을 얻기 위해 authors/date/journal을 붙여 넣으십시오. –

+1

여러분은'interact (상호 작용 (작성자, 연도, 저널, drop = TRUE)))와 함께 열의 조합에 대해 고유 ID를 만들 때'interaction'을 사용할 수도 있습니다.' –

+0

여러분 안녕하십니까. 나는 Matthew가 제안한 해결책을 시도하고 매우 잘 작동한다! 나는 나의 예에서 충분히 분명하다고 생각했으나 다음 번엔 필요한 모든 세부 사항을 제공 할 것이다. 모든 팁을 고맙게 생각한다! – stefano

관련 문제