2012-08-08 3 views
-1

정규 표현식을 사용하여 단어를 음절로 변환하려고합니다. 변환 할 정규식은 무엇입니까? 나는 인도네시아어로 찾았습니다 :단어에서 음절에 대한 정규 표현식 문법 규칙은

[^aeiou]?[aeiou]((ng|[^aeiou])(?![aeiou]))? 
+1

정규 표현식을 사용하여 이것을 습득 할 수 있을지 의심 스럽습니다. 이것은 매우 어려운 문제입니다! 이 게시물을 참조하십시오 : http://stackoverflow.com/questions/405161/detecting-syllables-in-a-word –

답변

0

영어는 매우 불규칙합니다. 영문 철자를 철자로 구분할 수 없습니다. 확실히 어떤 정규식도 당신이 원하는 것을 수행하는 것에 가깝지 않을 것입니다.

(이 경우 적당한 균열이있는 경우 단어를 음절로 토큰 화하는 방법에 대한 규칙 집합과 예외 목록 및 특수 사례 목록이 있어야합니다.) 확실히 정규 언어로는 불가능하고, 본격적인 프로그램으로하기가 매우 어려울 것입니다.)

+0

음절을 카운트 할 때마다 음절을 분리하기 위해 음절 카운터 프로그램을 사용하는 방법에 대해 알아볼 수 있습니다. 시작하기 전에 인덱스와 최종 인덱스를 계산하여 배열 값을 검색하여 별도의 배열에 저장하고 표시 할 수 있습니다. – Natto

+0

@Natto - ** ** ** 음절 카운터 프로그램 사용은 어떻습니까? 이러한 프로그램/라이브러리를 사용할 수 있다면 꼭 사용하십시오. –