저는 R을 사용하고 있으며 초보자입니다. 두 개의 큰 목록 (각각 30K 개 요소)이 있습니다. 하나는 descriptions
이고 각 요소는 (아마도) 토큰 화 된 문자열입니다. 다른 하나는 probes
이고 각 요소는 숫자입니다. probes
을 무언가에 descriptions
에 매핑하는 사전을 만들어야합니다. 여기에 내가 이것에 대해 갈거야 방법은 다음과 같습니다조건이 포함 된 for 루프에 대한 R-Thonic 대체
probe2gene = {}
for p,d in zip(probes, descriptions):
try:
probe2gene[p] = descriptions.split('//')[1]
except IndexError:
pass
내 질문 : 잘 작동하지만 대략 동등한 파이썬보다 훨씬 느린, 느린
probe2gene <- list()
for (i in 1:length(probes)){
strings<-strsplit(descriptions[i]), '//')
if (length(strings[[1]]) > 1){
probe2gene[probes[i]] = strings[[1]][2]
}
}
는 "R은-thonic"이 내가하려는 일을하는 방법? R manual entry on for loops은 이러한 루프가 드문 것으로 나타났습니다. 더 나은 해결책이 있습니까?
편집 :
"NM_009826 // Rb1cc1 // RB1-inducible coiled-coil 1 // 1 A2 // 12421 /// AB070619 // Rb1cc1 // RB1-inducible coiled-coil 1 // 1 A2 // 12421 /// ENSMUST00000027040 // Rb1cc1 // RB1-inducible coiled-coil 1 // 1 A2 // 12421"
나쁜 "설명 : 전형적인 좋은"설명 "과 같이 보입니다은 아주 쉽게 다른 될 수 있지만이
"-----"
처럼 보이는하지-very- 도움이되는 문자열 각 프로브는 단순히 숫자입니다. probe
과 description
벡터는 길이가 같고 완전히 일치합니다. 즉 probe[i]
은 description[i]
으로 매핑됩니다.
"R-thonic":) Ric이 아니어야합니까? – Skilldrick
작은 데이터 샘플이 유용 할 것입니다. – Shane
그것은 확실히 "piratical"입니다. – Harlan