텍스트 데이터로 작업 중이므로 기존 열을 기반으로 새 열을 채우고 싶습니다.분할을 사용하여 Pandas 데이터 프레임에서 열을 채 웁니다.
예 : 열 sourceEncodedID
은 a.b.c
과 같은 값을 가질 수 있으며 두 번째 부분이있는 경우 b
문자열의 두 번째 부분 만 추출하고 싶습니다. 여기에 몇 가지 예제 값은 다음과 같습니다
for i in range(0,20350):
if len(str(artifacts.sourceEncodedID[i]).split('.')) > 1:
artifacts['branch'][i] = str(artifacts.sourceEncodedID[i]).split('.')[1]
else:
artifacts['branch'][i] = str(artifacts.sourceEncodedID[i])
로 분 정도 걸릴 :
sourceEncodedID Branch
a.b.c b
c.r.d r
a a
p p
는이를 달성하기 위해, 나는 다음과 같은 코드로 올라와있다 실행을 끝내기 전에 브라우저를 응답이 없게 끝내기 전에 (나는 ipython notebook
을 사용하고 있습니다). 나는 이것이 2 초 내에 돌아갈 것이라고 생각했을 것이다.
내가 잡을 수없는이 코드에는 분명히 어리석은 것이 있습니까? 어떻게 수정해야합니까?
정말 고마워요, 작업을했다. 제 코드에 나와 분명하지 않은 어리 석음을 지적 해 주시겠습니까? – Patthebug
@Patthebug, 내 답변을 업데이트했습니다 - 확인하십시오 – MaxU
설명을 추가해 주셔서 감사합니다, 고맙습니다! 팬더의 벡터화 된 기능을 알고 기본으로 돌아가는 것은 약간의 좌절감을 안겨주는 것 같습니다. 나는 벡터화 된 솔루션이 더 깔끔하지만 당신이 그것들을 알아야한다는 데 동의한다. 한 번에 하나의 기능 !! – Patthebug