0

나는 인간의 음성으로 된 오디오 파일을 가지고 있습니다. 오디오 길이는 약 1 분입니다. 오디오에서 사용 된 단어 나 구의 타임 스탬프를 찾고 싶습니다.오디오에서 단어의 타임 스탬프 찾기

작업을 수행 할 수있는 기존 라이브러리가 있습니까?

답변

1

이 문제에 접근하는 데는 음성 인식과 기계 학습이라는 두 가지 방법이 있습니다. 어떤 상황이 더 적합한지는 당신의 상황에 달려 있습니다.

음성 인식을 사용하면 설정된 음성 텍스트 인식기를 통해 오디오를 실행하고 결과 문자열의 시작 부분으로부터의 거리를 기반으로 단어의 타임 스탬프를 평가할 수 있습니다. 기계 학습을 통해 학습 데이터에서 단어 또는 구문으로 생성 된 오디오 모델을 만든 다음 테스트 오디오를 적절한 길이로 슬라이스하고 모델에 대해 각각 실행하여 찾고있는 단어의 가능성을 평가합니다.

기계 학습 접근법은 타임 스탬프와 관련하여 더 정확할 수 있지만 처음에는 모델을 수립하기 위해 많은 교육 데이터가 필요합니다.