2013-10-24 2 views
0

줄 바꿈이나 캐리지 리턴이없는 큰 파일이 있습니다. 이 파일은 HTML에서 가져온 것이므로 줄 바꿈 문자 (/ n)로 변환하려는 것을 제외한 모든 태그를 제거했습니다. AWK 또는 SED를 사용하여이를 수행하는 빠르고 쉬운 방법은 무엇입니까? AWKSED도 옵션이라고 생각합니다.awk 또는 sed를 사용하여 HTML 태그를 개행 문자로 바꿉니다.

sed 's/<[^>]*>/\n/g' file 

이 의미 :이 같은

+0

정말 'AWKSED'라는 이름이 아니라고 말해주세요 !!!! 샘플 입력 및 예상 출력을 게시하십시오. –

답변

0

뭔가 작업을해야 >하지 않은 문자의 불특정 다수의 다음 <로 시작하는 모든 텍스트를 대체, 그것은 개행 문자로, >로 끝납니다.

+0

그래서 대괄호 안에/tr을 넣으면 그 태그의 모든 항목이 줄 바꿈으로 바뀌어야합니까? –

+0

예'g' 명령 때문에 줄 바꿈이있는 모든 항목을 업데이트하고'[^>]는 욕심이없는 일치를 수행합니다. – user000001

+0

변경 사항에 약간 혼란 스럽습니다. 태그가/tr이면 솔루션에서/tr로 대체 할 대상은 무엇입니까? ^> 또는 *? –

관련 문제