2010-07-26 1 views
1

COM 인터페이스를 통해 C#에서 R로 데이터를 전달 중입니다. 데이터가 R에 도착하면 '매트릭스'에 보관됩니다. 필자가 사용하는 함수 중 일부는 데이터가 대신 'DataFrame'내에 있어야합니다. 나는 데이터의 표는 내가 그러나 DataFrame로 변환을하면, 내 숫자 데이터의 모든 요인 가정, R은 잘 도달매트릭스에서 R로 데이터 프레임 변환 문제 (R은 모든 숫자 유형이 요소라고 생각 함)

newDataFrame <- as.data.frame(oldMatrix) 

를 사용하여 데이터 구조를 변환!

그래서 그것은 온 : {34, 46, 90, 54, 69, 54} {1, 2, 3, 4, 5, 4}

내 데이터 테이블 않지만 그 요인이로하므로 나는 모든 것을 강제적으로 숫자로 할 수는 없다. 이 주위에 어떤 방법이 있습니까? 참고 : 데이터를 CSV로 파일 시스템에 내보내고 R로 수동으로 읽을 수는 없습니다. 메모 측면

는 I가 사용하고있는 기능 즉 DataFrame이이 DataFram 데이터의 각 항목에 대한 주파수의 히스토그램을 생성하고 모든 그들을 배치

hist.data.frame(dataFrame) 

사용 'Hmisc'패키지 필요 그리드 패턴 (아주 멋진)!

감사합니다. -Dave

답변

1

이전에이 문제가있었습니다. 데이터를 읽을 때 stringsAsFactors = F로 설정해야합니다.

이제는 숫자 처리 방법에 대해 걱정할 필요없이 개별 변수/열을 factor (예 : as.numeric() 등)로 변환 할 수 있습니다.

+0

이것은 효과가 있습니다. 하지만 프로그래밍 방식으로 숫자 대 벡터 열을 처리 할 수있는 방법이 있습니까, 나는 엄청난 양의 데이터를 다루고 있으며, 손으로 그와 같은 것을 분석하는 것은 비현실적입니다. 아마도 – Dave

+0

. 숫자 변수와 요인 변수를 구별하는 간단한 방법이 있습니까? – chimeracoder

+0

변수에 문자가 포함되어 있으면 요인이 될 것입니다. 그렇지 않으면 숫자로 처리해야합니다. R이 숫자 변수를 문자열로 감지하여 요인처럼 취급해서는 안되기 때문에 문제가 발생합니다. – Dave

5

난 당신이 잘못 진단 문제가 있다고 생각 - 매트릭스의 모든 열이 같은 유형이어야합니다, 그래서 문제가, 데이터 프레임이 아닌 변환을 발생하는 곳이 될 가능성이 높습니다.

관련 문제