2016-09-27 1 views
0

Azure Jupyter/iPython Notebook에서 사용자 정의 데이터 세트를 다운로드해야합니다. 궁극적 인 목표는 R 패키지를 설치하는 것입니다. 이 작업을 수행하려면 패키지 (데이터 세트)를 코드로 다운로드해야합니다. 나는이 포스트의 코멘트 섹션에서 Andrie de Vries가 설명한 단계를 따랐다 : Jupyter Notebooks with R in Azure ML Studio. ZIP 파일로 패키지를 업로드Azure ML Jupyter/iPython Notebook에서 사용자 정의 데이터 세트 다운로드 R

문제없이,하지만 내 노트북의 코드를 실행할 때 오류가 발생합니다 :

library("AzureML") 
ws <- workspace() 
ds <- datasets(ws) 
ds$Name 

data <- download.datasets(ws, "plotly_3.6.0.tar.gz.zip") 
head(data) 

:

Error in curl(x$DownloadLocation, handle = h, open = conn): Failure when receiving data from the peer Traceback:

  1. download.datasets(ws, "plotly_3.6.0.tar.gz.zip")
  2. lapply(1:nrow(datasets), function(j) get_dataset(datasets[j, . ], ...))
  3. FUN(1L[[1L]], ...)
  4. get_dataset(datasets[j, ], ...)
  5. curl(x$DownloadLocation, handle = h, open = conn)

그래서 내가에 내 코드를 단순화 여기서 "plotly_3.6.0.tar.gz.zip"은 데이터 유형이 "Zip"인 내 데이터 세트의 이름입니다. 불행하게도 이것은 동일한 오류를 발생시킵니다. 데이터 유형 문제를 배제하기 위해 데이터 유형 "Dataset"인 다른 광산 데이터 세트를 다운로드하려고했습니다. 또한 같은 오류.

이제 AzureML Studio의 샘플 데이터 세트 중 하나로 다운로드 할 데이터 세트를 변경합니다. "text.preprocessing.zip는"

data <- download.datasets(ws, "text.preprocessing.zip") 

은 "비행 데이터를 지연합니다"샘플 데이터 세트 모두 문제없이 다운로드 할 수있는 데이터 형식 GenericCSV

data <- download.datasets(ws, "Flight Delays Data") 

이다 데이터 형의 우편 번호입니다.

왜 내 자신의 저장된 데이터 세트를 다운로드 할 수 없습니까?

download.datasets 함수의 문서에서 도움이되는 것이 없습니다. rdocumentation.org 또는 cran.r-project.org (page 17-18)에 있지 않습니다.

답변

0

내가 가진 오류가 (후 초기) 푸른 ML 스튜디오의 버그 때문이었다 보인다.

Daniel Prager의 답장을 통해서만 코드가 변경되지 않고 예상대로 작동한다는 것을 알았습니다. idauth 매개 변수를 추가 할 필요가 없습니다.

0

이 시도 :

library(AzureML) 
ws <- workspace(
id = "your AzureML ID", 
auth = "your AzureML Key" 
) 
name <- "Name of your saved data" 
ws <- workspace()