을 테스트하지만, 동시에 :루비 1.9 문자 변환 오류가 여전히 정규식
이 다양한 웹 사이트에서 긁어 데이터를 테스트하기 위해 내 레일 시도 내 최고의 기회입니다. 이상한 사실은 내가 수동으로 URL의 소스를 복사하여 붙여 넣으면 모든 것이 올바르게 진행된다는 것입니다.
어떻게해야합니까?
# encoding: utf-8
require 'rubygems'
require 'iconv'
require 'nokogiri'
require 'open-uri'
require 'uri'
url = 'http://www.website.com/url/test'
sio = open(url)
@cur_encoding = sio.charset
doc = Nokogiri::HTML(sio, nil, @cur_encoding)
txtdoc = doc.to_s
# 1) String manipulation test
p doc.search('h1')[0].text # "Nove36 "
p doc.search('h1')[0].text.strip! # nil <- ERROR
# 2) Regex test
# txtdoc = "test test 44.00 € test test" # <- THIS WORKS
regex = "[0-9.]+ €"
p /#{regex}/i =~ txtdoC# integer expected
내가 실현이 아마 내 OS 우분투 플러스 내 텍스트 편집기는 아마 깨진 인코딩을 통해 좋은 인코딩 변환을하고있다 : 즉 괜찮지 만 라이브 실행하는 동안 어떻게 내 응용 프로그램에이 문제를 해결할 수 있습니까?
그것은 작동합니다! 고마워요 : D –