2014-09-30 4 views
1

웹 페이지에서 발견 된 모든 토큰을 나열하려고합니다. I 출력을 인쇄 내가html.NewTokenizer.Token()의 예상치 못한 HTML 토큰

Now token is <body> 
Now token is 

Now token is <header> 

같은 것을 얻을 내가 두 번째 토큰이 무엇인지 이해하지 못하는 이유는 여분의 빈 줄을 인쇄 할 때 핵심은 기능

func find_links(httpBody io.Reader) []string { 

    links := make([]string, 0) 
    page := html.NewTokenizer(httpBody) 
    for { 
     tokenType := page.Next() 
     if tokenType == html.ErrorToken { 
      return links 
     } 
     token := page.Token() 
     fmt.Println("Now token is ", token) 
    } 
} 

입니다. 이 때문에 누락 된 HTTP 패키지

+0

캐리지 리턴을 토큰과 일치시키는 것처럼 보입니다. (참고 : 이동에 대한 지식이 전혀 없으므로 해결할 수 없습니다.) –

답변

1

두 번째 토큰의 놀이터에서 실행할 수없는 경우에도 작동 예를 here

전체 코드는 줄 바꿈을 포함하는 TextToken이다.

은 토큰의 유형을 볼 수

fmt.Printf("Now token is %T %v\n", token, token) 

에 인쇄를 변경

.

+0

이것은 두 번째 줄을 설명합니다. 하지만 나는 아직도 빈 줄이 왜 있는지 이해하지 못한다. – meto

관련 문제