0
어떻게 작동하는지와 비슷한 Watson 서버의 마이크를 사용하여 실시간으로 텍스트를 가져올 수있는 작은 파이썬 프로그램을 만들려고합니다. here. 파이썬에 대한 Watson을 사용하여 텍스트에 연속 실시간 음성
이
내가 생각 해낸 한 코드입니다하지만 녹음을 마친 후이 텍스트를 가져옵니다 내가 나서서 WebSocket을을 사용하여 왓슨 서버에 연결하는 데 처음부터 프로그램을 만들어import pyaudio
import json
from watson_developer_cloud import SpeechToTextV1
CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 2
RATE = 44100
RECORD_SECONDS = 10
p = pyaudio.PyAudio()
stream = p.open(format=FORMAT,
channels=CHANNELS,
rate=RATE,
input=True,
frames_per_buffer=CHUNK)
print("* recording")
frames = []
for i in range(0, int(RATE/CHUNK * RECORD_SECONDS)):
data = stream.read(CHUNK)
frames.append(data)
print("* done recording")
stream.stop_stream()
stream.close()
p.terminate()
data_feed = b''.join(frames)
speech_to_text = SpeechToTextV1(
username='secret',
password='secret too',
x_watson_learning_opt_out=False
)
result = speech_to_text.recognize(data_feed,
content_type="audio/l16;rate=44100;channels=2",
word_confidence=True,
max_alternatives=4,
word_alternatives_threshold=0.5,
model="en-US_BroadbandModel",
continuous=True)
j = json.dumps(result, indent=2)
print(j)
해결하려는 특정 문제가 있습니까? 코드를 단계별로 시도해 보셨습니까? – alex
안녕하세요 @alex, 현재 Python 용 SDK는 마이크를 통해 직접 오디오를받는 대신 오디오 파일을 사용하는 것으로 제한됩니다. 저는 현재 마이크를 사용하면서 실시간 텍스트를 얻을 수있는 프로젝트를 진행 중입니다. – DBeck
나는 이것을하기 위해 웹 소켓을 사용하고 있으며 나는 내일까지 어떤 것을 가지고있을 것이라고 생각한다. – DBeck