저는 양쪽 끝에서 자르고 싶은 이항 비대칭 분포를가집니다. 그 중 특정 부분은 각 종의 적절한면에서 대칭 경계를 계산하고 싶다는 것입니다. 이 그림은 단순화를 위해 종간 분리의 극단적 인 경우를 보여줍니다. 적색 상처는 눈 양쪽에 사용되는 1,550 청색 선으로 선택되며이 때 바이 모달 데이터의 대칭 특정 커트 설정
잠재적으로 트림하는 기능을 통해 전달 될 수있는 임의의 값을 나타낸다. 내 목표는 파란색 선 사이의 모든 부분 집합입니다.hist(p3_cut$x,50)
abline(v=c(6200,7600),col='red')
abline(v=c(6200-1500,7600+1500),col='blue')
내 생각에 여기 문제는 기본적으로 각 곡선의 '가장자리'를 찾습니다. 나는 평균값 사이의 반 거리를 사용할 수 없으며, 0 (또는 매우 낮은 값)에서 상대적으로 높은 주파수로 주파수 변화를 인식하는 것이 필요합니다.
할 수 있습니다'binned_x <와 변수의 비닝 버전을 얻을 - 컷 (p3_cut의 $의 X, 50) ', 그리고 (차이'로 연속 쓰레기통 사이의 카운트의 차이를 얻을 테이블 (binned_x))'. 그런 다음 차등 벡터의 최대/최소값을 찾아 주파수의 가장 큰 변화를 찾을 수 있습니다. –
나는 접근법을 좋아하지만 bin = 50이 알려졌다. 알려진 '완벽한'binning없이 그것을 해결하는 방법은 무엇입니까? 또한, 최대 변화가 제로 주파수와 첫 번째 절단 대신 첫 번째 절단과 두 번째 절단 사이에 있다면 어떻게해야합니까 ?? –
@PhilippeMarchand 예를 들어 bin = 50을 변경하면 최대 (diff (table (binned_x))) = 103이되고 bin = 10을 사용하면 같은 결과가 나에게 243이됩니다. 또한 그래프에서 볼 수 있듯이 두 번째 커브의 변경은 첫 번째 빈과 두 번째 빈 사이에서 최대가 될 것이며 0과 첫 번째 빈 사이가 아님 –