제 질문은 this one의 연속입니다. 기본적으로,과 같이 단어의 테이블이 내 목적을 위해프로그래밍 방식으로 regexes를 배우는 방법?
HAT18178_890909.098070313.1
HAT18178_890909.098070313.2
HAT18178_890909.143412462.1
HAT18178_890909.143412462.2
, 나는 이름의이 세트 터미널 .1
또는 .2
필요하지 않습니다. 그것은 3 자 수 - 나는 마지막 두 문자는 무시할 수있을 것입니다 곳에 이름의 내 다음 세트는 유사한 구조를 가질 것이라는 점을 보장 할 수 없습니다, 그러나
r = re.compile('(.*\.\d+)\.\d+')
: 내가 수동으로 (파이썬 구문을 사용하여) 다음과 같은 정규 표현식을 쓸 수 있습니다 (예 : .12
) 세퍼레이터도 바뀔 수 있습니다 (즉, .
에서 _
).
명시 적으로 정규식을 배우거나 불필요한 문자를 확인하는 적절한 방법은 무엇입니까?
"정규식 배우기"는 무엇을 의미합니까? 정규식 구문을 배우십시오. "이 정규식 사용법은 무엇을 의미합니까?" 정규 표현식은 언어이며 규칙을 배웁니다. 그러나 규칙을 안다고해서 갑자기 "나는 너를 여름날과 비교할 것인가?"와 같은 정규 표현식을 없앨 수는 없다. –
'.1'이 필요 없다는 것을 어떻게 알 수 있습니까? 당신이 그것을 알아 내기 위해 사용했던 기준이 당신의 학습 알고리즘과 관련 될 것입니다. – Kevin
@MarcB : 이전 질문에서 OP는 일종의 기계 학습을 원합니다. – Kevin