2012-01-19 2 views
1

PHP를 사용하여 음성 인식 + 처리 도구를 구축하고 있습니다. 문제를 해결하는 방법이 너무도 확실하지 않습니다.정규식으로 문장을 잘라내시겠습니까?

기본적으로 사용자가 hi라고 말하면 약 30 개의 서로 다른 인사말 목록에서 무작위 인사말을 사용하여 회신 한 다음 나머지 대화를 비슷한 음으로 처리합니다.

더 복잡한 문장에서 사용자는 '올빼미시 놀이 반딧불 놀이'또는 '올빼미 시집 반딧불 소리 듣기', '올빼미시 놀이 반딧불 소리 듣기' '이해할 수 있듯이, 그것은 음악을 연주하라는 요청입니다.

문제는 문장에 너무 많은 변수가있는 경우, 듣기, 재생 및 노래 이름 존재 여부를 어떻게 테스트합니까? 기본적으로 나는 그 모든 쓸모없는 단어의 문장을 벗겨야 만하고 '듣기/반딧불 올빼미시 놀이하기'를 해석해야한다고 가정합니다.

'듣기'와 함께 할 계획은 클라이언트에 따라 YouTube 검색 API를 실행하거나 새 탭에서 열거 나 YouTube 검색 URL을 반환하는 '수신 대기'기능을 실행하는 것입니다.

누구든지 PHP preg_match를 사용하여 문장을 제거하는 방법을 알고 있습니까? 아니면 다른 방법일까요? 나는 지난 몇 시간 동안 노력 해왔다.

어떤 매우 감사 건배하고, 모든 응답 :

+3

http://en.wikipedia.org/wiki/Turing_test)? 좋은 결과 내길 바랄 게... – DaveRandom

답변

2

언어 구문 분석은 매우 복잡, 그리고 정규 표현식을 위해 뭔가 :하지만 시작, 당신은 명사로 "키"단어를 식별 할 수 있어야합니다 , 동사, 형용사 등을 분석하여 의미를 결정합니다. brill parser과 같은 도구는 첫 번째 부분을 도울 것입니다.

음성 분석기의 일부를 상당히 포괄적 인 목록이있다

그래서 기본적으로 당신이 [튜링 테스트]를 통과하는 PHP 스크립트를 (작성하는 방법을 요구하고 here

관련 문제