정규 표현식을 사용하여 문자열 변수의 일부를 추출해야합니다. 내 데이터는 다음과 같습니다. 은 영문자를 나타냅니다. x 및 Z은 숫자를 나타냅니다. 나는 전에 Z 문자를 추출 할 "-"Stata 정규 표현식
var1
"aaa xxx xxx ZZZ-ZZZ-a"
"aaa xx xxx ZZZ-ZZ"
내 코드가
이 코드는 필요한 것보다 더 추출)이
gen p_id = regexs(1) if regexm(var1, "([0-9][0-9][0-9])[-]*[0-9][0-9][-]*[ a-zA-Z]*$"
것 같습니다. 예를 들어,이 코드는 다음과 같은 관측치에서 숫자 부분을 추출합니다. 구체적으로는 나는 표정으로 주위를 연주하지만, 필요한 답변을 얻을 수 없습니다
var1
"aaa ZZZZZ aaa"
ZZZ 추출합니다.