2016-10-29 2 views
2

Linux에서 awk 또는 sed과 비슷한 R 텍스트 스트림을 처리 할 수 ​​있습니까? 아이디어는 전체 파일을 메모리로 읽어 들이지 않고 한 줄씩 읽고, 처리 한 다음 파일에 쓰는 것입니다.텍스트 스트림 처리 중 R

이러한 접근 방식에 대한 예나 링크는 매우 높이 평가됩니다. 감사.

+0

'readLine' 함수는 열린 연결을 위해 지정된 줄 수를 읽을 수 있습니다. –

답변

0

실제로 있습니다! R의 기본 패키지에 포함 된 readLines()을 사용할 수 있습니다. 텍스트 파일을 가져 오거나, 문자열을 게시하거나, 웹 페이지에 연결을 열 수 있습니다. 여기에서 확인하십시오 : readLines in Cran

+0

나는 readLines()를 알고있다. 그러나 나는 단지 표시된 수만큼의 라인을 메모리로 읽어 들일 것이라고 생각했다. readLines()를 사용하여 텍스트 파일을 읽는 예제를 제공하고, 모든 라인을 텍스트 처리하며, 전체 파일을 메모리에 먼저 읽지 않고 결과를 출력 할 수 있습니까? – rmf

+0

'readLines()'를 사용하여 작성한 함수를 설정하여 텍스트를 가져 오는 방법과 도착하는대로 행을 처리하는 방법을 처리 할 수 ​​있습니다. 파일에 대한 연결을 열고 한 줄씩 읽도록 루프를 설정하고 REGEX 또는 다른 r 메서드를 사용하여 텍스트를 조작 한 다음 파일을 저장할 수 있습니다. 그것은 awk이 할 수있는 것을 성취 할 수 있지만 같은 문법은 할 수 없습니다. 코드를 작성할 필요가 있습니다. – sconfluentus