두 가지 방법으로 문자열 목록의 순위를 달리하고 목록의 "올바른"순위 (즉, 금 표준)로 간주 할 수있는 항목이 있습니다. 즉순위 사이의 거리
:
ranked_list_of_strings_1 = method_1(list_of_strings)
ranked_list_of_strings_2 = method_2(list_of_strings)
correctly_ranked_list_of_strings # Some permutation of list_of_strings
어떻게 어떤 방법이 method_1
및 method_2
이 블랙 박스는 점을 고려 더 확인할 수 있습니까? 이것을 측정 할 수있는 방법이 있습니까? SciPy
또는 scikit-learn
또는 이와 유사한 라이브러리가 있습니까?
내 구체적인 경우에는 데이터 프레임이 있고 각 메서드는 점수를 출력합니다. 중요한 것은 방법과 실제 점수의 점수 차이가 아니라 순위가 (모든 점수에서 점수가 높을수록 점수가 높다는 뜻)입니다.
strings scores_method_1 scores_method_2 true_scores
5714 aeSeOg 0.54 0.1 0.8
5741 NQXACs 0.15 0.3 0.4
5768 zsFZQi 0.57 0.7 0.2