2017-01-03 6 views
2

이 같은 핍 사용 Dask 설치 :기본 핍 설치 "ImportError를을 : 없음 모듈 이름이 툴들은"주지 않는다

pip install dask 

을 나는 import dask.dataframe as dd을 수행하려고 할 때 다음과 같은 오류 메시지가 얻을 :

>>> import dask.dataframe as dd 
Traceback (most recent call last): 
    File "<stdin>", line 1, in <module> 
    File "/path/to/venv/lib/python2.7/site-packages/dask/__init__.py", line 5, in <module> 
    from .async import get_sync as get 
    File "/path/to/venv/lib/python2.7/site-packages/dask/async.py", line 120, in <module> 
    from toolz import identity 
ImportError: No module named toolz 
No module named toolz 

나는 the documentation 상태

pip install dask : Install only dask, which depends only on the standard library. This is appropriate if you only want the task schedulers.

그래서 난 '것으로 나타났습니다 왜 이것이 작동하지 않았는 지 혼란 스러웠습니다.

답변

7

Dask 0.13.0 이하에서는 toolz 'identity에 대한 요구 사항이 dask/async.py입니다. 열기 이 종속성을 제거하려면 GitHub issue #1849과 관련된 닫힌 끌어 오기 요청이 있습니다. 그동안 어떤 이유에서든 dask의 이전 버전을 사용하고 있다면 pip install toolz을 사용하여이 문제를 해결할 수 있습니다.

그러나 이것은 (완전히) import dask.dataframe as dd의 문제를 해결하지는 못합니다. 당신은 여전히 ​​ 오류 얻을 것 때문에 :

>>> import dask.dataframe as dd 
Traceback (most recent call last): 
    File "<stdin>", line 1, in <module> 
    File "/data/staff_agbio/PhyloWeb/data/dask-test/venv/local/lib/python2.7/site-packages/dask/dataframe/__init__.py", line 3, in <module> 
    from .core import (DataFrame, Series, Index, _Frame, map_partitions, 
    File "/data/staff_agbio/PhyloWeb/data/dask-test/venv/local/lib/python2.7/site-packages/dask/dataframe/core.py", line 12, in <module> 
    import pandas as pd 
ImportError: No module named pandas 

을하거나 팬더 이미 설치 한 경우, 당신은 ImportError: No module named cloudpickle을 얻을 것입니다. 그래서. (reference를) DASK의 병렬화 dataframes을 (팬더의 상단에 내장), 당신은 몇 가지 "엑스트라"를 설치하는 PIP 말할 필요 사용하기 위해서는

Dask installation documentation에서 언급 한 바와 같이, :

pip install dask[dataframe] 

아니면 할 수 트릭의 전체 가방을 얻으려면 pip install dask[complete]을 수행하십시오.

이에 대한 정당화는 또한 DASK 문서에서 언급 한

:

We do this so that users of the lightweight core dask scheduler aren’t required to download the more exotic dependencies of the collections (numpy, pandas, etc.)

관련 문제