Kaggle 솔루션의 일부 코드를 이해할 수 없습니다. 여기 배열의 numpy 조건 이해
는 데이터의 예는 다음과 같습니다 이PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S
2,1,1,"Cumings, Mrs. John Bradley (Florence Briggs Thayer)",female,38,1,0,PC 17599,71.2833,C85,C
3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,STON/O2. 3101282,7.925,,S
목표는 여성과 배열을 추출하는 것입니다, 그들은 이런 식으로 작업을 수행합니다
# data contains all the passengers
women_only_stats = data[0::,4] == "female"
females_data = data[women]
print(data[women][0]) # Will print the first women of the dataset of only women.
내가 이해 women_data_only
것 식 data[0::,4] == "female"
의 평가의 결과 인 True
및 False
의 배열이 아니면 안됩니다.
내가 이해하지 못하는 것은 데이터 [여성]이 여성 만의 배열 인 이유입니다.
numpy
은 어떻게 평가합니까? 그것이 어떻게 작동하는지
[부울 또는 "마스크"색인 배열] (http://docs.scipy.org/doc/numpy/user/basics.indexing.html#boolean-or-mask-index-arrays) –
"부울 색인 생성"으로 검색 –
매우 유용합니다. 감사합니다! – Mornor