2010-06-05 10 views

답변

3

표준 전자 우편 (여러 개의 메시지를 포함)을 mbox 파일이나 각 메일이 디렉토리에있는 파일 인 maildir 설정 중 하나입니다.

어느 쪽이든 그것은 ASCII 텍스트입니다. 이것이 MUA (메일 사용자 에이전트 - 메일 리더)가 MTA (메일 전송 에이전트 - exim, qmail, postfix 등과 같은 메일 서버 소프트웨어)와 직각을 이루는 방식입니다. MTA는 POP3 또는 IMAP와 같은 네트워크 프로토콜을 사용하여 메일 파일을 클라이언트에 제공 할 수 있습니다.이 경우 클라이언트 (Gmail 또는 Thunderbird 일 수 있음)는 더 이상 기본 파일을 볼 수 없습니다. 따라서 여러분이 사용하는 백엔드에서 메일을 내보내는 방법을 배우고 읽을 필요가 있습니다.

이것은 지금까지 R이나 프로그래밍과는 아무런 관련이 없습니다. 이제는 (원격) 메일 서버에 연결하기 위해 POP3 또는 IMAP 기능으로 R을 확장해야한다고 생각하지 않는다면 말입니다.

2

Gmail과 Thunderbird가 같지 않습니다 ... Thunderbird에서 Gmail 계정을 사용하도록 설정하여 각 이메일을 ASCII 파일로 내보낼 수 있으므로 각 파일을 가져 와서 R로 개체로 가져 오는 R 배치 스크립트를 작성하고, 그러므로 ... 당신은 요점을 얻습니다. =)

보통 나는 "보행자 접근"을 피하려고 노력하고 있습니다 ...하지만 R을 "범용"프로그래밍 언어로 사용하는 경향이 있다는 인상을 받고 있습니다 ... Python 또는 JAVA 다른 한편으로는 꽤 효율적일 수 있으므로 데이터를 원하는 형식으로 "가져 와서"R로 처리하는 스크립트를 작성 (또는 누군가에게 요청하십시오) 할 수 있습니다. R은 많이 성숙했으며, 통계 분석을위한 도구 일뿐만 아니라 널리 알려진 프로그래밍 언어를 사용하여 데이터를 수행하는 것이 좋습니다.

그래서 ... 소매를 감아 파이썬 (자바, C ... 다이빙을 원한다면 무엇이든)으로 뛰어 들어라!

P. 이것은 단어 구름과 함께 이전 게시물과 관련이 있다고 생각합니다 ...

2

이제 이메일 데이터를 추출하는 R 패키지가 있습니다. 이 패키지는 여전히 테스트 단계에 있지만 누구나 GitHub에서 설치할 수 있습니다. 패키지 이름은 edeR입니다. 현재 IMAP이 활성화 된 Gmail에서 이메일 데이터를 추출 할 수 있습니다.

+0

감사합니다. 나는 그의 패키지에 대해 r-statistics.com에 게스트 포스트를 쓰도록 초청 한 저자에게 연락했다. 나는 그것을 통해 올 것입니다. 건배, T –

1

먼저 설치해야합니다. library(edeR)을 먼저 설치하십시오. Windows 8에 Java 64를 수동으로 설치해야 할 수도 있고 Gmail에서 IMAP 액세스를 활성화해야 할 수도 있습니다.

dat3 <-extractKeyword(username="[email protected]", 
        password="YouRPaSS", 
        kw="adsense", 
        nmail=5) 

키워드 'adsense'가 포함 된 5 개의 이메일을 다운로드합니다.

관련 문제