2011-09-07 4 views
7

나는 선택된 데이터 세트를 가지며 각 데이터에는 다른 속성이있는 프로젝트에서 작업하고 있습니다. 속성을 사용하여 선택한 시나리오와 가장 일치하는 데이터를 선택하려면 피트니스 기능을 사용해야합니다.휘트니스 기능을 수행하는 방법

그러나 실제로 내 자신의 피트니스 기능을 시작하는 방법을 설명하는 사이트는 없습니다. 내가 가진 전부는 유전 알고리즘의 일부이며 이것은 내가 가진 것입니다. 여기에 몇 가지 포인터를 줄 수 있습니까?

답변

2

실제로 필요한 것은 피트니스 기능입니다.

휘트니스 함수는 유전 알고리즘 (Genetic Algorithm)에 사용 된 것과 같습니다. 현재 인구에서 문제에 대해 제안 된 모든 솔루션의 품질을 평가하기 위해 알고리즘을 반복 할 때마다 사용됩니다. 적합도 함수는 모집단의 단일 솔루션이 얼마나 좋은지 평가합니다. 어떤 x 값에 대해 유전 알고리즘을 사용하여 y 최소값을 찾으려고한다면, 단위에 대한 적합 함수는 단순히 음의 y 값일 수 있습니다 (적합도 함수가 더 높은 값이 작을수록).

기본적으로 말하고자하는 것은 피트니스 기능이 그 속성을 많이 다루지 않고 결과를 평가하는 것입니다.

속성이 포함 된 데이터의 가장 대표적인 샘플을 선택하려면 분류 또는 클러스터링 방법을 조사해야할까요? 선택된 시나리오가 어떤 식으로 표현 될지에 대한 많은 정보를 제공하지 않았지만 데이터를 클러스터링 할 수 있습니다 (k- 평균 클러스터링 알고리즘을 시도하고 분류 오류가 크게 줄어들지 않을 때까지 클러스터 수를 늘리십시오). 시나리오 요구 사항을 충족하면 대표 데이터 클러스터를 선택하는 것보다?

데이터 표현과 관련하여 쿼리가 어떻게 표현되는지에 대한 세부 정보를 제공 한 경우 다른 사람과 다른 (또는 더 나은) 대답을 얻었을 수 있습니다.

유전자 알고리즘이나 AI/기계 학습 분야의 다른 부분을 배우는 것이 목표라면, phs가 제안한 것을 정확히 수행하고 책, 오디오 강의를 찾아 클래스에 등록해야합니다 또는 비슷한 것.

12

이것은 GAS의 어려운 부분이며 (실제로는 데이터 및 데이터 표현) 실제 경험을 통해서만 학습 할 수 있습니다.

분명히 말해서 함수는 결과가 얼마나 좋은지 측정해야합니다. 특히 다양한 데이터에 대해 매끄러 워야합니다. 데이터가 무엇이든 상관없이 피트니스 기능이 올바른 방법으로 개선되어야합니다.

예를 들어, 답변이 맞지 않으면 피트니스 기능이 좋지 않습니다. 시작시 올바른 답변에 가까워지는 데 도움이되지 않기 때문에 적합하지 않습니다.

성과가 좋을 때 증가하지만 최상의 솔루션을 식별하지 못하는 적합성 기능은 인구가 특정 시점까지 향상되어 중단 될 수 있기 때문에 그리 좋지 않습니다.

그래서 앉아서 데이터의 몇 가지 예를 작성하고 사용할 수있는 기능이 무엇인지 생각해야합니다. 나쁜 데이터에 낮은 값을, 좋은 데이터에 높은 값을주는 것을 원합니다. 그리고 그것들은이 둘 사이에서 잘 조정됩니다.

처음에는 생각해 볼 수있는 미친 생각을 시도한 다음 멋진 수학적 형식에 넣을 수있는 방법을 확인하십시오. 브레인 스토밍을 계속 시도하고 반복하십시오 ...첫 번째 선택이 그리 좋지 않다는 것을 알게 될 것입니다. 일단 GA를 실행하면 더 자세한 내용을보고 개선 할 수 있습니다.

+0

이렇게하면 피트니스 기능이 얼마나 좋은지 피트니스 기능을 결정할 수 있다고 생각합니다. – weltschmerz

관련 문제