Scikit Learn
을 사용하여 Python으로 몇 가지 기본 감정 분류기를 만들었습니다. 이제 교차 검증 기술을 사용하여 평가하려고합니다. training_data
이라고하는 100,000 개의 긍정적이고 부정적인 짹짹이 포함 된 데이터 세트가 있습니다.목록의 두 섹션을 가져 오는 것
테스트를 위해 전체 집합에서 20,000 블록을 가져올 때마다 나머지 180,000 개를 교육에 사용해야합니다. 내가 가진 문제는 블록이 어느쪽에 있지 않을 때 어떻게 그 블록의 양쪽 데이터를 얻는 것입니까?
나는
training_data.data[:20000] + training_data.data[40000:]
같은 일을 시도했지만 그것은 말한다
그러나 나는과 함께 방송 할 수없는 그냥 목록.dataset.data
이었다는 것을 인상했다피연산자는 다른 모양
["@karoliiinem i'm personally following the next 300 people that will follow --& gt; @omgfantasy rt once you're done so i'd know ?\n", '@kristensaywha i know s tupid people\n', 'i might be going shopping tomorrow at the beach) i hope so\n' , '@_sophieallam cannae wait for a 5 hour train journey \n', 'wifey needs a hug \n', "i'm scared to drive to daytona with this car \n", "@xxiluvdahviexx i'm so sorry\n", "@chooselogoism that sucks i can't see w/o my glasses at all\n", 'x f actor \n']
나는 당신이 잡을 수있는 목록에 작업의 어떤 종류를 찾고 있어요 같아요
여기 요청으로는 training_data.data의 출력 예 [1시 10분]입니다 지정된 슬라이스를 제외한 모든 데이터?
당신이 밖으로 인쇄를 포함하도록 게시물을 수정할 수'training_data.data [0시 10분]'(예를 들어) 그래서 우리는 볼 수 있습니다 유형? 또는'training_data.data'를 출력하고 처음 몇 줄을 게시하십시오. – CoryKramer
예제 출력이 나에게 명확하지 않습니다. 그것은 10 개의 객체를 포함하지 않는 것 같습니다. – eickenberg
아, 실제로 마크 업에 없습니다. – eickenberg