Apache Spark 2.0.2를 사용하면 약 2300 만 개의 행과 약 300 개의 열을 포함하는 쪽모이 한 테이블이 있습니다. 큰 숫자의 오류 agregattion
select sum(total_price) from my_table;
+-----------------+
| total_price |
+-----------------+
| 9.3923769592E8|
+-----------------+
그래서이 숫자 9.3923769592
E 8 잘못 : 나는 실행하면 나는 두 번으로 저장 TOTAL_PRICE
라는 열이. 내가 실행하면 하지만 :
select year, sum(total_price) from my_table;
+-------+------------------------+
| year| total_price|
+-------+------------------------+
| 2017| 44510982.10004025 |
| 2016| 293320440.63992333 |
| 2015| 311512575.890131 |
| 2014| 289885757.2799143 |
| 2013| 5192.319 |
| 2012| 2747.7000000000007|
+-------+------------------------+
내 가정은 첫 번째 쿼리에서 더블 데이터 유형이 오버 플로우 또는 같은 것을 가지고 있다는 것입니다.
도트 다음에 많은 소수점이있는 결과가 왜 #. # ##로 저장되는 이유는 무엇입니까?
어떻게하면 첫 번째 쿼리의 오류를 해결할 수 있습니까?