나는 다음과 같은 데이터의 열을 포함하는 스크랩 한 데이터 세트가 있습니다Alteryx에서 html 태그의 번호를 추출하는 방법은 무엇입니까?
<td>1,968</td>
<td>185</td>
<td>1,285<sup id="cite_ref-4" class="reference"><a href="#cite_note-4">[4]</a></sup></td>
내가 데이터를 처리 할 수 Alteryx을 사용하고 있습니다 및 나는 html 태그 <td>
와 </td>
사이의 번호를 추출하는 정규식을 사용하고 싶습니다. 그래서 위의 경우 1968, 185, 1285로 돌아 가야합니다. 다음 정규식을 시도했지만 어느 것도 작동하지 않았습니다. using this tester. 정규식의 버전은 Alteryx의 R이어야하지만 확실하지는 않습니다.
>([0-9]+)<
>[0-9]+<
누군가가이를 밝힐 수 있습니까? 감사!
'라이브러리 (rvest); '
왜냐하면 http://stackoverflow.com/a/1732454/4497050 – alistaire
R에는 패키지와 추가 인수에 따라 다른 정규 표현식이 있습니다. "정규식의 버전은 R이어야합니다"라고 말하면 여기에는 아무 것도 명확하게 표시되지 않습니다. [Docs say] (https://help.alteryx.com/9.5/RegEx.htm) 부스트입니다. R은 부스트를 지원하지 않습니다. R 태그를 제거했습니다. –