2014-02-14 2 views
9

'&'문자가 포함 된 문자열을 기반으로 행 선택으로 확장되는 것으로 밝혀진 HDFStore로 그룹화 문제가 발생했습니다. 이것은 내가 documentation에서 뭔가를 놓치고 또는이 버그의 경우있어 경우 팬더 및 HDF5, '&'문자가 포함 된 문자열

>>> store.select('test', 'a="test & test"') 
 
Int64Index([], dtype='int64') Empty DataFrame 

>>> from pandas import HDFStore, DataFrame 
>>> df = DataFrame({'a': ['a', 'a', 'c', 'b', 'test & test', 'c' , 'b', 'e'], 
        'b': [1, 2, 3, 4, 5, 6, 7, 8]}) 
>>> store = HDFStore('test.h5') 
>>> store.append('test', df, format='table', data_columns=True) 
>>> df[df.a == 'test & test'] 
 
    a    b 
4 test & test 5 
지금 내가 궁금하네요 문제를 설명해야한다.

+3

버그 .... 여기 참조 : https://github.com/pydata/pandas/issues/6351; 나는 고치기가 어렵다고 생각하지 않는다. 우리는 기본적으로 특정 표현을 보간하는 미리 파서를 가지고있다. 그 안에 따옴표를 넣지 않아도됩니다. – Jeff

+0

감사합니다. –

+1

이것은 합병 된 것입니다 ...... 그래서 pls 마스터와 함께 시도해주세요! – Jeff

답변

-2

내 생각에 h5py는 팬더보다 HDF5 파일에 대한 훨씬 강력한 파이썬 모듈입니다. 댓글 같이 http://www.h5py.org/

+2

질문은 판다를 사용하는 방법에 관한 것입니다. 이 대답은 현재 당면한 문제와 아무 관련이 없습니다. – tharen

1

, 이것은 이제 (0.14 팬더 때문에) 고정 :

In [11]: df[df.a == 'test & test'] 
Out[11]: 
      a b 
4 test & test 5 

In [12]: store.select('test', 'a="test & test"') 
Out[12]: 
      a b 
4 test & test 5 
관련 문제