1

내가google-data-proc에서 "numpy라는 모듈이 없습니다 ..."오류, google-data-proc에서 numpy를 업그레이드하는 방법?

import numpy as np 
ImportError: ('No module named numpy', <function _parse_datatype_json_string at 0x7fc294e25230>....... 

구글 클라우드 - 데이터 - PROC에 내 노트북을 실행하지만 같은 파이썬 2.7

로컬로 실행할 때 오류가 발생하지 않을 때 나는에 해당 버전을 발견,이 오류가 계속 내 지역은

01은 ** '1.8.2'오래된 numpy.version.version '1.11.1'

하지만 구글 - 데이터 시저에 ** 다른 답변에서 언급 한 바와 같이 23,516,

ImportError: No module named numpy - Google Cloud Dataproc when using Jupyter Notebook 나는이

핍 명령이 핍을 시도

구글 - 데이터 시저에 대한 권한이없는 난 아직 1.8.2 버전을

import sys 

sys.path.append('/usr/lib/python2.7/dist-packages') 

os.system("sudo apt-get install python-pandas -y") 
os.system("sudo apt-get install python-numpy -y") 
os.system("sudo apt-get install python-scipy -y") 
os.system("sudo apt-get install python-sklearn -y") 

import pandas 
import numpy 
import scipy 
import sklearn 

를 업그레이드하려고 sudo를 사용하면 작동하지 않습니다.

IOError: [Errno 13] Permission denied: '/usr/local/bin/miniconda/lib/python2.7/site- 
packages/easy-install.pth' 
[email protected]:~$ sudo pip install numpy 
sudo: pip: command not found 

답변

2

편집 : 우리는 지금 added a metadata optionJUPYTER_CONDA_PACKAGES 자동으로 Jupyter를 설치하는 동안 conda를 통해 패키지를 사전 설치했습니다. 이제 examples,하여 패키지를 설치하려면 선호하는 방법 덮여으로 함께이 메타 데이터 값을 사용하여이없는

gcloud dataproc clusters create my-cluster \ 
    --initialization-actions gs://dataproc-initialization-actions/jupyter/jupyter.sh \ 
    --metadata JUPYTER_CONDA_PACKAGES=numpy:pandas:scikit-learn:scipy 

, 후세에 더 많은 내부 자세한 내용은 아래의 역사적 답 :

그냥 실행할 수 있습니다 마스터 노드 있도록 Dataproc에서의 jupyter 초기화 작업은 또한, conda를 설치합니다

sudo su 
conda install numpy 

을가 사용되는 방식에 따라 할 수있다 작업자 노드에서 필요합니다. 기본 jupyter.sh 스크립트를 사용자 정의하여 conda install numpy 행을 /dataproc-initialization-actions/conda/bootstrap-conda.sh 행 다음에 추가하고 사용자 정의 init 조치를 GCS에 다시 업로드하여 gs://dataproc-initialization-actions/jupyter/jupyter.sh 대신 배포를 자동으로 설치하도록 지정할 수 있습니다. 뭔가 같이 :

Select Conda Packages menu dropdown from Kernel menu

Browse Conda packages

Install Conda packages

: 마지막으로

gsutil cp gs://dataproc-initialization-actions/jupyter/jupyter.sh . 
echo "conda install numpy >> jupyter.sh" 
gsutil cp jupyter.sh gs://my-bucket/jupyter_with_numpy.sh 
gcloud dataproc clusters crreate my-cluster \ 
    --initialization-actions gs://my-bucket/jupyter_with_numpy.sh 

, 당신은 또한 CONDA 패키지를 찾아 설치 Jupyter UI에 내장 된 패키지 관리자를 사용할 수 있습니다

+0

이미 시도했는데,이 오류가 발생합니다. my-user-name @ my-cluster-name-m : ~ $ sudo conda install numpy sudo : conda : 명령을 찾을 수 없습니다. ' – Watt

+1

재미 있습니다. bash 로그인 프로파일과 관련이있는 것 같습니다. 'sudo su'를 처음 실행하고'condpy install numpy'를 실행하면 어떨까요? –

+0

하지만'sudo'없이 실행하면 결국 실행되지만 결국'CondaIOError : IO error :/usr/local/bin/miniconda에 쓰기 권한이 없습니다. '라고 쓰여집니다. – Watt

관련 문제