2012-10-28 3 views
4

나는 R의 텍스트 파일에서 아랍어 텍스트를 읽는 프로그램을 쓰고 난 파일을 읽을 때마다 나는 다음과 같은 오류가 얻을 :R 입력 파일 아랍어?

Warning messages: 
1: In read.table("C:\\Users\\Mustafa\\Desktop\\arabic.txt", sep = "\n", : 
invalid input found on input connection 'C:\Users\Mustafa\Desktop\arabic.txt' 
2: In read.table("C:\\Users\\Mustafa\\Desktop\\arabic.txt", sep = "\n", : 
incomplete final line found by readTableHeader on 'C:\Users\Mustafa\Desktop\arabic.txt' 


File<-read.table("C:\\Users\\Mustafa\\Desktop\\arabic.txt",sep=" \n",col.names="ar",fileEncoding="UTF-8") 

나는 오류가 아무 생각, 난이 사용하고있는 환경이 없습니다를 windows에서, 맥 OS에서 그것은 파일을 작동하지만, 나는 그것을 윈도우에서 실행해야합니다! 어떤 도움을 주셔서 감사합니다.

감사합니다.

+4

데이터에 UTF-8이 아닌 문자가 있음을 의미합니다. 지정된 행을로드하여 위치를 좁힐 수 있는지 확인하십시오. 또는 때때로 Excel에서 열어 CSV로 변환하면 문제가 사라질 수 있습니다. ','및''문자는 내가 다른 언어로 일할 때 일반적으로 범인이라고 생각하는 것입니다. –

+0

당신의 접근 방법을 한 줄씩 추가하려고합니다. 시스템 로케일을 설정하려고 시도했습니다. 아랍어 문자를 읽을 수 있도록 고쳐졌습니다. 또한 Excel의 접근 방식을 시도해 볼 것입니다. 많은 감사합니다. – user1781405

+2

MacOS에서는 작동하지만 Windows에서는 작동하지 않을 가능성이 있습니다. 줄 끝 문자는 "좋아하는"것이 아닙니다. -의 오래된 문제입니다. 워드 패드에서 파일을 열고 SaveAs (텍스트 전용)를 실행하면 문제가 사라질 수 있습니다. –

답변

1

이 오류 메시지는 파일이 EOL (줄 끝 문자)로 끝나지 않는다는 것을 의미합니다. 예 : \n 또는 \r\n.

이것은 파일이 완료되지 않았을 수도있는 warning 일종의 정렬입니다. MAC에서는 무시되지만 Windows에서는 오류로 간주됩니다.

해결책은 간단합니다. 파일 끝에 새 줄을 추가하고 저장 한 다음 다시 시도하십시오.

0

아래 코드는 저에게 효과적입니다.

Sys.setlocale("LC_ALL","Arabic")