저는 TCG (Trading Card Game) 가격 책정 프로그램을 만들고 있습니다. 그 업무는 여러 공급 업체의 데이터를 수집하고 해당 데이터를 사용하여 해당 카드의 시장 가격을 결정하는 것입니다. 예를 들어, 이론적 인 카드 X를 생각해 봅시다.가격 데이터에서 특이 치를 제거하는 방법은 무엇입니까?
X에는 판매하는 공급 업체에 따라 다양한 값이 있습니다. 이 값이 달러 참조
[1.00, 1.10, 1.05, 0.95, 2.00, 0.10]
($) 값 : 여기서 그 값의 어레이이다.
이 시장에서 저의 고객으로서 저의 가격 데이터는 이고, 보통은입니다. 가격 데이터는 한 가격으로 끌리는 경향이 있습니다. 많은 업체들이 가끔 이상한 가격으로 경쟁 가격으로 카드 가격을 책정합니다.
위의 가정하에 위의 데이터 세트에서 특이점을 제거하는 방법은 무엇입니까? 언뜻보기에는 $ 2.00와 $ 0.10이 아웃 라이어로 보입니다. 그러나 가격은 시장에서 변동합니다. 카드의 가치가 급등하고 역으로 탱크에 들어간다는 것은 드문 일이 아닙니다.
평균으로부터 표준 편차의 임계 값을 사용하는 것과 같은 몇 가지 방법을 연구했습니다 (예 : 가격이 평균값보다 2 표준 편차 이상이거나 이상 값이라고 생각하는 경우) 또는 중앙 절대 편차를 사용하는 등의 방법을 연구했지만, 어떤 알고리즘이 내가 작업하고있는 맥락에서 심지어 의미가 있는지를 확신 할 수 없다.