처음에는 잠시 시간을내어 SO 커뮤니티에 감사 드리고 싶습니다. 과거에도 계정을 만들 필요없이 여러 번 나에게 도움을주었습니다.R - 양식 웹 긁어 모으기
내 현재 문제는 R을 사용하여 웹 스크래핑과 관련됩니다. 내 장점이 아닙니다.
나는 시도 것을 http://www.cbs.dtu.dk/services/SignalP/
스크랩 싶습니다 :
library(rvest)
url <- "http://www.cbs.dtu.dk/services/SignalP/"
seq <- "MTSKTCLVFFFSSLILTNFALAQDRAPHGLAYETPVAFSPSAFDFFHTQPENPDPTFNPCSESGCSPLPVAAKVQGASAKAQESDIVSISTGTRSGIEEHGVVGIIFGLAFAVMM"
session <- rvest::html_session(url)
form <- rvest::html_form(session)[[2]]
form <- rvest::set_values(form, `SEQPASTE` = seq)
form_res_cbs <- rvest::submit_form(session, form)
#rvest prints out:
Submitting with 'trunc'
rvest::html_text(rvest::html_nodes(form_res_cbs, "head"))
#ouput:
"Configuration error"
rvest::html_text(rvest::html_nodes(form_res_cbs, "body"))
#ouput:
"Exception:WebfaceConfigErrorPackage:Webface::service : 358Message:Unhandled #parameter 'NULL' in form "
을 내가 처리되지 않은 매개 변수는 무엇인지 확실입니다. 제출 버튼에 문제가 있습니까? 나는 강제로 할 수 없습니다 :
form_res_cbs <- rvest::submit_form(session, form, submit = "submit")
#rvest prints out
Error: Unknown submission name 'submit'.
Possible values: trunc
은 submit $ name이 NULL 인 문제입니까? Submit form with no submit button in rvest
행운과 :
form[["fields"]][[23]]
는 여기 제안 가짜가 제출 '버튼을 정의했습니다.
내가 또는 RCurl/HTTR을, 내가 RSelenium
감사합니다. hrbrmstr! 나는 당신의 대답이 내 근근이 시도에 도움이되었다고 덧붙이고 싶습니다. 모두 제일 좋다! – missuse
webform으로 파일을 업로드하는 방법을 설명해주십시오. 게시 요청의 본문에'SEQSUB' = httr :: upload_file ("temp_1.txt")을 시도했습니다. 그러나 오류가 나타납니다. enc2utf8 (as.character (url)) 오류 : 인수가 문자 벡터가 아닙니다. 여기에 파일이 있습니다 : https://www.dropbox.com/s/kzdi7za3mcbyw7t/temp_1.txt?dl=0 – missuse
위의 문제가 해결되었습니다 : encode = "multipart"로 충분했습니다. – missuse