R Factor variable에 가장 근접한 것은 Python pandas입니까?Python Pandas에서 요인 변수와 가장 비슷한 코드
21
A
답변
18
이 질문은 1 년 전의 것으로 보입니다. 그러나 아직 열어두고 있기 때문에 여기에 업데이트가 있습니다. 팬더는 categorical
DTYPE를 도입하며 자세한 내용은이 링크를 참조하시기 바랍니다 R.에서 factors
매우 유사 작동 :에서 "인자"변수를 생성하는 방법을 보여주는 위의 링크에서 조각을 재현
http://pandas-docs.github.io/pandas-docs-travis/categorical.html
을 팬더.
In [1]: s = Series(["a","b","c","a"], dtype="category")
In [2]: s
Out[2]:
0 a
1 b
2 c
3 a
dtype: category
Categories (3, object): [a < b < c]
6
모델링 등을 할 계획이라면 patsy library의 요인에 대한 좋은 점이 많습니다. 나는 나 자신과 힘들어하는 것을 인정할 것이다. 나는 these slides 도움이되었다. 더 좋은 예를들 수 있기를 바랍니다. 그러나 이것은 내가 얻은 것입니다.
-1
C# array containing category data
V # array containing numerical data
H = np.unique(C)
mydict = {}
for h in H:
mydict[h] = V[C==h]
boxplot(mydict.values(), labels=mydict.keys())
관련 문제
- 1. Python Pandas에서 부울 연산
- 2. Python Pandas에서 문자열을 NaN으로 변환
- 3. Python - Pandas에서 Sparse 출력 형식
- 4. STATA : 오류 요인 변수와 시계열 운영자는 허용되지
- 5. python/pandas에서 가장 가까운 값을 검색하는 방법은 무엇입니까?
- 6. 우분투의 환경 변수와 비슷한 것
- 7. Python/Pandas에서 행별로 백분율 가져 오기
- 8. Python Pandas에서 데이터 스트림을 전환하는 방법
- 9. Python Pandas에서 예기치 않은 표준 오차가 발생했습니다.
- 10. 요인 분석에서 표준화되지 않은 요인 점수 얻기
- 11. Python/Pandas에서 세기 - 달을 DateTimeIndex로 변환하려면 어떻게해야합니까?
- 12. python/pandas에서 왼쪽 내부 조인하는 법?
- 13. 기준에 따라 Python Pandas에서 다른 값을 할당
- 14. 비슷한 절을 PHP에서 변수와 함께 사용하기
- 15. 파이썬에서 PHP의 $$ 변수와 비슷한 구문이 있습니다
- 16. 요인
- 17. 요인
- 18. 요인
- 19. 일부 계급에서 가장 큰 요인 수 n이
- 20. 특정 요인 뒤에 계수 요인
- 21. 비슷한 코드 입력
- 22. 비슷한 자바 스크립트 코드?
- 23. 다른 요인 또는 수준에 코드 적용
- 24. 이 요인
- 25. sklearn을 사용한 요인 적재
- 26. Pandas에서 데이터를 더 효율적으로 청소
- 27. 신호와 비슷한 Python 예외 잡기
- 28. Python datetime과 비슷한 Java Calendar
- 29. python-DJANGO와 (과) 비슷한 PHP?
- 30. ID가 가장 높은 AND 필드가 변수와 같습니다.
보기 [이 (https://groups.google.com/forum/#!msg/pydata/figElKrdwcI/dISL07Id7dUJ). 그것은'pandas.Factor'를 factor 컬럼으로 추가 한 것으로 보입니다. 그러나 이것이 정확히 동일하지 않다고 생각합니다. 특히 누락 된 데이터가있는 경우. – agstudy
http://stackoverflow.com/questions/7813132/convert-array-of-string-category-to-array-of-int-from-a-pandas-dataframe – Raufio