2017-04-04 2 views
1

고객 관리 데이터에 대한 음성 감정 분석 작업 중입니다. 고객 관리 담당자가 질문을하고 고객이 검토를 수행 한 오디오 파일이 있습니다.파이썬에서 오디오 파일을 분할하는 방법

나는이 오디오를 분리하고 고객이 행복한, 슬프거나 중립적인지 여부에 관계없이 감정적 인 분석을하기 위해 고객으로부터 리뷰 파트 만 가져와야합니다.

오디오 파일을 분할하여 고객의 오디오 만받는 방법을 알려주세요. 오디오는 형식 "는 .aac"에

지금까지 내가 무엇을했는지 있습니다 :

from os import path 
AUDIO_FILE = path.join(path.dirname(path.realpath('C:\\Users\\anagha\\Documents\\Python Scripts')),"Python Scripts\\audioa.aac") 

halfway_point = len(AUDIO_FILE)/2 
+0

크기 또는 무음 기반으로 분할하려는 경우 당신은 http://stackoverflow.com/questions/37725416/pydub-combine-split-on-silence-with-minimum-length-file-size 을 볼 수있다. 그러나 나는 당신이 어떻게 할 것인지를 먼저 결정할 필요가 있다고 생각한다. 고객과 클라이언트 오디오를 구별합니다. 아마도 음성 인식 도구가 도움이 될 것입니다. –

+0

감사합니다. 고객과 클라이언트 오디오를 구분하는 방법에 대한 제안이 있으십니까? – Anagha

답변

2

여기 pydub

from pydub import AudioSegment 
sound = AudioSegment.from_file(AUDIO_FILE) 

halfway_point = len(sound) // 2 
first_half = sound[:halfway_point] 

# create a new file "first_half.mp3": 
first_half.export("/path/to/first_half.mp3", format="mp3") 
+0

감사합니다. 그러나 출력물을 얻고 출력물이 잘리는 지 보려면 어떻게해야합니까? 또는 출력을 내보내려면 어떻게합니까? – Anagha

+0

@Anagha는 수출 라인을 통해 답변을 업데이트했습니다. – Jiaaro

0
함께 할하는 방법은 pydub 태그를 사용하기 때문에

나도 원래 질문에 답하기에는 너무 늦었다 고 생각하지만이 질문에 걸려 넘어지면 유용한 절차를 찾을 수 있습니다.

-> 데이터를 diarize하는 도구를 사용하십시오. 나는 LIUM (http://www-lium.univ-lemans.fr/diarization/doku.php)

을 사용했다

-> SO (Parsing LIUM Speaker Diarization Output)

을 게시 아름답게 간단한에 따라 출력을 해석 한 후 마지막으로 오디오 파일을 접합하기 위해 위에서 얻은 타이밍을 사용! 음성을 텍스트로 변환하는 것은 완전히 다른 도전이며 거대한 양의 데이터를 사용하는 깊은 접근 방식이나 API 제공 업체 (예 : Google)에 의존해야합니다

관련 문제