필자는 출력 파일에 출력 파일을 제공하는 Voice-to-Text 응용 프로그램을 사용하고 있습니다. 필사본 텍스트는 (s)
(문장 시작 부분)과 같은 몇 개의 태그를 포함합니다 .. 끝) .. (VOCAL_NOISE)
(인식 할 수없는 단어) ..하지만 텍스트도 (VOCAL_N)
, (VOCAL_NOISED)
, (VOCAL_SOUND)
, (UNKNOWN)
같은 원하지 않는 태그가 포함되어 있습니다 .. 나는 텍스트를 처리하기 위해 SED를 사용하고 있습니다 ..하지만 대체 할 수있는 적절한 정규 표현식을 쓸 수 없습니다 (s)
, (/s)
및 (VOCAL_NOISE)
태그를 제외한 다른 태그는 ~NS
입니다. 누군가가 도와 주시면 감사하겠습니다.Regex Negation : 특정 문자열 이외의 패턴 일치
예제 텍스트 :
(s) Hi Stacey , this is Stanley (/s) (s) I would (VOCAL_N) appreciate if you could call (UNKNOWN) and let him know I want an appointment (VOCAL_NOISE) with him (/s)
출력해야한다 : 당신은 다음과 같은 작업을 수행 할 수 쉘 (bash는) 사용
:%s/\((\w\+)\)\&\(\((s)\|(VOCAL_NOISE)\)\@!\)/\~NS/g
:
(s) Hi Stacey , this is Stanley (/s) (s) I would ~NS appreciate if you could call ~NS and let him know I want an appointment (VOCAL_NOISE) with him (/s)
: 것은 내가 예측할 수 없다 ..입니다 원치 않는 것 태그가 발생합니다 .. 나는 오직 원하는 태그 viz (s)의 확실한 오전, (/ s)와 (VOCAL_NOISE) .. 소위 화이트리스트 .. 그래서, ~ NS로 원치 않는 태그를 대체하면서 원하는 태그를 유지해야합니다. –