N 개의 알려진 목록이 있다고 가정 해 보겠습니다. 각 목록에는 반복 될 수있는 항목이 있습니다 (세트는 아님) 예 :데이터 목록에서 가장 가능성있는 항목을 예측하기위한 알고리즘
{A, B, C}, {B, B, B, C, C}
나는 몇 가지 알고리즘 (? 일부 기계 학습 어쩌면 하나를) 다음과 같은 질문에 답해야합니다 : 예를 들어, 항목의 새로운 & 알 수없는 일부 목록을 감안할 때
는, {A는, B}, 확률은 무엇을 그 이전 목록에서 내가 아는 바를 기반으로 목록에 C가 나타납니다. 가능하다면, 좀 더 세분화 된 확률을 원합니다 : 일부 부분 목록 L이 주어지면 C가 목록에 한 번 나타날 가능성, 두 번 나타날 확률 등 ... 순서는 중요하지 않습니다. {A, B}에 두 번 나타나는 C의 확률은 {B, A}에 두 번 나타나야합니다.
이렇게 할 수있는 알고리즘은 무엇입니까?
목록의 길이에 따라 다릅니다. 나머지는 Markov. – wildplasser
https://en.wikipedia.org/wiki/Good%E2%80%93Turing_frequency_estimation이 유용 할 수 있습니다. – mcdowella