2013-06-18 2 views
-1

저는 텍스트 내에서 패턴을 검색해야하는 언어학 프로젝트에 참여하고 있습니다. 다음 패턴을 검색해야합니다 : „ blah blah blah **target word** blah blah". 즉, 따옴표 사이에 다른 단어가 여러 개있을 수있는 경우 (독일어) 따옴표 안에 포함 된 특정 단어의 인스턴스입니다.루비 일반 expressios 가고 올바른 방법이 있습니까?

제가 사용하는 소프트웨어는 Ruby로 작성되었으며 정규 표현식을 사용하여 일치시킵니다. 나는 그들이 그 일에 적합한 도구인지를 알아야합니다. 이것이 루비 정규식이 포착 할 수있는 패턴입니까? 당신이 실제로 정규 표현식이 필요하거나 tokenization

당신은 프로그래밍 경험이없는 경우 나는 후자로 가고 싶어은, 정규 표현식 마스터에 매우 어려운처럼

+1

ruby ​​regex flavor는 몇 가지 추가 트위스트가 있지만 http://www.regular-expressions.info –

+0

에서 정규식을 사용하여 수행 할 수있는 작업에 대한 훌륭한 개요를 찾을 수 있습니다. 우수한 자원. –

+0

닫기 기호는 활자체 따옴표 (' "')가 아니라 직선 따옴표 (''')입니다. – Stefan

답변

1

심플. target_word에 문자열이 있으면 다음과 같이됩니다.

/\„.*?#{target_word}.*?\"/m 

독일 인용 부호를 특별히 고려해야 할 수도 있습니다.

+0

감사합니다. 이것은 좋은 출발입니다. (독일어 인용문은 예상대로 문제를 일으키고 있습니다.) 나는 그것이 가능하다는 것을 알기 때문에 나머지를 알아 내려고 노력할 것입니다. –

0

는 소리가 난다.

+0

정규식은 소프트웨어에서 허용됩니다. 사용법은 내가 여기서 끝난 방법입니다. –

관련 문제