2011-12-20 3 views
1

나는 주어진 텍스트가 똑똑하게 문장으로자를 때 어떤 것도 도움이 될 수있는 알고리즘을 찾고있다. 지금은 내가 지정한 문장 당 단어 수와 함께 작동하는 알고리즘을 가지고 있습니다. 나는 처음 '까지 작동하도록 그것을 바꿀 수 있었다.' 그리고 그런 것들을 좋아하지만 내가 필요로하는 것은 다소 논리적으로 할 수있는 알고리즘이다. ('is'와 '와', 그리고 아마도 '.'이외의 구두점을 찾을 수있는 문장을 남기지 않을 것이다).텍스트 스마트 절단 알고리즘?

아이디어가 있으십니까? PHP5를 사용하고 있습니다.

+1

필요한 것을 조금 더 정확하게 표현해 주시겠습니까? 어쩌면 예 –

+0

아니, 자신이 뭔가를 쓸 수 어쩌면 첫 번째 후 끝 같은, 또는. 또는! 또는? 300 번째 문자 다음에 350 번째 문자가 끝날 때까지 첫 번째 공백 문자를 찾지 못한다면? – Hannes

+0

나는 알고리즘을 직접 작성할 수 있지만, 대부분의 사람들이 사용하는 알고리즘을 찾을 수있는 것처럼 좋지는 않습니다. – Vadiklk

답변

1

사용 preg_split이 코드 :

$sentences = preg_split("/[,.:;]+/", "Now you can split in sentences, try this. Isn't it good?"); 

그것은 문장의 배열에 문장을 분할, 당신은 ",. :;"당신은 내가 사용하는 위의 예에서 (사용하고자하는 문자 선택해야). 정규 표현식을 사용하므로 매우 유용합니다.)

+0

문제는 ','및 '.'을 제거한다는 것입니다. 그리고 나는이 문장들을 원래의 텍스트를 형성하기 위해 함께 되돌려 놓고 싶습니다. – Vadiklk

+0

음 ... 더 어렵습니다 ... 뭔가 검색하려고합니다. –