는 여러 개의 공간 즉,로 구분되는 문자열을 분할하기 위해 노력하고있어 예상대로정규 표현식을 사용하여 문자열을 여러 공백으로 나눕니다.
string1 = "abcd efgh a. abcd b efgh"
print re.findall(r"[\w.]+")
는, 결과는 다음과 같습니다
['abcd', 'efgh', 'a.', 'abcd', 'b', 'efgh']
그러나, 나는이 '그룹에 싶습니다. ' 같은 그룹에 'abcd'를, 같은 그룹에 'b'와 'efgh'를 입력하십시오. 그래서 내가 원하는 결과는 다음과 같습니다.
['abcd', 'efgh', 'a. abcd', 'b efgh']
내 접근 방식은 두 가지 유형의 표현식을 만드는 것입니다. 첫 번째는 공백없이 'abcd'및 'efgh'정규 표현식을 처리합니다. 두 번째는 단일 공간을 가진 것들을 다루는 것입니다. 즉 'a'. + 'abcd'.
그렇다면 [w \] [\ 승] + 는 제 1 타입을 처리 할 수 있으며, R '+ R [\ 승] + 가 제 2 유형을 처리 할 수있다. 하지만 '|'를 사용하여 같은 식으로 결합하는 법을 모르겠습니다.
언제나처럼 다른 방법도 환영합니다. 그리고 시간 내 주셔서 감사합니다!
'\ s \ s +'로 나누기 – gukoff