id
으로 나눈 스파크를 사용하여 df
열의 문자열 발생을 어떻게 계산합니까?스칼라 스파크 - 데이터 프레임 열의 특정 문자열 카운트
열에서 값 "test"
찾기 SQL에서는 df
의 "name"
은 다음과 같습니다
def getCount(df: DataFrame): DataFrame = {
val dfCnt = df.agg(
.withColumn("cnt_test",
count(col("name")==lit('test'))
)
이인가 :
SELECT
SUM(CASE WHEN name = 'test' THEN 1 else 0 END) over window AS cnt_test
FROM
mytable
WINDOW window AS (PARTITION BY id)
내가 좋아하는 map(v => match { case "test" -> 1.. })
물건을 사용하려고했습니다 비싼 수술? 특정 문자열의 발생을 확인한 다음 작업을 수행하는 가장 좋은 방법은 무엇입니까 (sum, max, min, etc)
?
감사
는 대답은 도움이됩니까? 예인 경우 동의하십시오. –