2013-05-29 5 views
0

단일 폴더에 여러 개의 파일이 있고 매번 스크립트에서 파일 이름을 변경하지 않고 R을 사용하여 각 파일에서 동일한 작업을 수행하고 싶습니다. 특히, 개별적으로 중복 된 항목을 식별하는 데 필요한 26 개의 .csv 파일이 있습니다. 이 작업을 수행하는 가장 좋은 방법에 대한 조언을 주시면 감사하겠습니다.여러 파일에서 동일한 작업 수행

답변

5

은 내가 lapplylist.files을 사용하십시오. 또한 파일 이름을 가진 결과 목록의 이름을 지정할 수 있습니다

res <- lapply(list.files(path=FILES_DIRECTORY, 
           pattern='*.csv', ## I look for csv files, 
           full.names=T), ## to get full names path+filename 
        function(file){ ff <- read.csv(file) 
            ff[duplicated(ff),] 
        }) 

: 예를 들어 , 나는 이런 식으로 뭔가 좋은 시작이라고 생각합니다.

names(res) <- gsub('[.]csv','', 
         list.files(path=FILES_DIRECTORY,pattern='*.csv')) 
+0

나는 당신이''USE.NAMES = TRUE '대신 lapply''의와 sapply'를 사용하는 경우 별도의 명령에 목록의 이름을 피하기 수 있으리라 생각합니다. –

+0

@MatthewPlourde 네, 꽤 좋은 이름을 얻지 못하더라도'sapply'를 사용할 수 있습니다 (전체 경로 이름을 얻을 수 있습니다). 개인적으로, 나는'sapply'를 거의 사용하지 않고 'lapply'를 선호합니다. – agstudy

+1

멋진, 나는 그것을 시험해보기 위해 기다릴 수 없다. 도움을 주셔서 감사합니다. – KES

관련 문제