categorical-data

    1

    1답변

    h2o가 열을 enum 유형으로 전송하여 자동으로 카테고리 데이터를 만들도록 허용 할 때 카테고리 기능이 어떻게 인코딩되는지 볼 수있는 방법이 있습니까? 나는 각 기본 모델의 기본 교육 데이터가 다른 홀드 아웃 스태킹을 구현 중입니다. 두 세트에서 동일한 방식으로 인코딩되어 있는지 확인하고자하는 공통된 기능이 있습니다. 이 기능에는 이름 (str)이 포함됩

    0

    2답변

    임의의 포리스트와 관련하여 질문이 있습니다. 사용자와 아이템의 상호 작용에 대한 데이터가 있다고 가정 해보십시오. 항목 수는 약 10,000 개입니다. 임의의 포리스트에 대한 내 출력은 사용자가 (추천 시스템과 같은) 상호 작용할 가능성이있는 항목이어야합니다. 모든 사용자에게 과거에 상호 작용 한 항목을 설명하는 기능을 사용하고자합니다. 그러나 범주 형 제

    1

    1답변

    Apache Groovy는 범주 형 변수를 지원합니까? 저는 R에 익숙하며 인수 분해 된 벡터를 평준화했습니다. 아파치 그루비가 비슷한 기능을 가지고 있는지 알고 싶습니다.

    0

    1답변

    저는 나이 증명, 교육 수준, 관계 관리자 코드와 같은 범주 형 변수를 사용하여 보험 사기 데이터 세트를 작성하고 있습니다. 데이터 세트의 이상을 탐지하기 위해 빈도 수를 기준으로 수치의 범주로 변환하고 수준의 비율을 계산했습니다. 올바른 방법입니까? 그렇지 않다면 특이점을 발견하는 동안 범주 형 변수를 다루는 방법을 제안하십시오.

    1

    1답변

    데이터에 연속적인 특성과 함께 몇 가지 범주 적 기능이 있습니다. 카테고리 피처를 다른 피조물과 함께 라벨에 상관 관계를 찾기 위해 핫 코드 인코딩하는 것이 좋거나 절대적으로 나쁜 생각입니까?

    -2

    1답변

    sklearn의 범주 형 변수에 onehotencoding을 사용하는 동안 의사 결정 트리에 맞게 다른 숫자 변수와 함께 생성하는 희소 행렬을 사용하는 방법은 무엇입니까? OneHotEncoding을 사용하여 범주 형 변수를 희소 행렬로 변환하는 경우이 희소 행렬을 원래 데이터 집합의 숫자 변수와 어떻게 조합합니까?

    1

    1답변

    read_csv() 프로세스 중에 범주 값을 읽는 방법이 있는지 궁금합니다. df라는이 메모리를 많이 사용하고 나는 그것을 줄일 방법을 찾고 있어요이 시점에서 df.zone = df.zone.astype('category') : 는 일반적으로 당신은 같은과 사실 후 변환 할 수 있습니다. parking_meters = pd.read_csv('parkin

    0

    1답변

    저는 R이 처음이므로 제 문제는 간단합니다. 나는 모든 국가에 관한 데이터를 보여주는 산점도를 만들고, 인구에 따라 거품 크기를 조정하고 지역별로 색상을 지정하려고합니다. 나는 채색을 제외한 모든 것을 성취했습니다. 다음은 내 코드입니다 :이 attach(gapminder2) colors(distinct = FALSE) radius<-sqrt(gapmi

    1

    1답변

    156000 행 37 열의 큰 데이터 세트가 있습니다. 열은 보험 속성을 나타냅니다. 우리는 세 가지 유형으로 속성을 나눌 수 있습니다 : 숫자, 범주 및 영숫자. 이 속성은 신경망의 입력 값이지만 NNT는 숫자 데이터 만 허용합니다. 나는 범주 적 및 영숫자 값을 인코딩해야합니다. 몇 가지 다른 값을 포함하는 범주 속성의 경우 한 열적 방법을 사용합니다.

    0

    1답변

    공칭, 숫자 속성 (내 데이터는 kddcup99 임)을 포함하는 조합 데이터에 knn을 사용하고 싶습니다. 예를 들어, hvdm distance measure를 사용하면이 지역에서 나를 안내 할 수 있습니까? 조언 해 주셔서 감사합니다.