보다 내가 할 수 플롯이 데이터에 부여 생성하기 전에 먼저 조작 할 필요가 간단한 .CSV 형식의 데이터가 있습니다. 그러나 파이썬에서 .csv 형식 데이터를 조작하는 방법을 알고 있습니다. R에 같은 로직을 적용하고 싶지만 어떻게해야할지 모르겠다. 다음은 .CSV 데이터 조작 오히려 파이썬
은 .CSV 파일의 예를 들어 자료입니다 만, 우리는이 문제를 논의하기 위해 내가 코드를 생성 한 R.에로드합니다.df <- data.frame(Name = c("AC", "AC", "PT", "PT", "OR", "OR"),
useless_column = c("","","A",3,4," "),
measurement = c("H", "", "K", "M", "", "H"),
amount = c(12, 54, 20, 87, 75, 22),
useless_column = c("","","A",3,4," "))
파이썬에서, 나는 일반적으로이 작업을 수행합니다
import csv
import os
import glob
import sys
fileList = glob.glob("R:xxxxxxxxxxxxxxxxxxxxx\*.csv")
for inputFile in fileList:
outputFilename = inputFile + "output.csv"
csvInput = csv.reader(open(inputFile,'r'),delimiter=",")
outputFile = open(outputFilename,'w')
outputFile.write("Name,measurement,amount\n")
csvInput.next()
for line in csvInput:
if line[2] == "H":
meas = "100"
elif line[2] == "K":
meas = "1000"
elif line[2] == "M":
meas = "1000000"
else:
meas = "1"
amount = int(meas) * line[3]
outputFile.write(",".join(line[0],line[2],amount+"\n"]))
outputFile.close()
파이썬에서, 나는 csv 파일에서 각 라인의 식별 루프 사용 후 CSV를로드 할 수 있습니다. 그런 다음 분석을 계속하기 전에 출력 파일을 맞춤 설정하십시오. 위에서 내 출력은 다음과 같으며 코드는 R 형식입니다.
df <- data.frame(Name = c("AC", "AC", "PT", "PT", "OR", "OR"),
measurment = c("H", "", "K", "M", "", "H"),
amount = c(1200, 54, 20000, 87000000, 75, 2200))
R에서이 작업을 수행하고 싶습니다. 내가 올바른 방향으로 나를 안내 할 수있는 R 및 plese 사람의 작은 코드를 가지고 : R의
x <- read.csv("xxxx.csv", header=T,sep=",")
xC = ncol(x)
xR = nrow(x)
op = data.frame(matrix(data = x, nrow= xR, ncol=3,byrow=T))
for (x in :xC)
{
for (r in 1:xR)
{
xxxxxxxx
}