크기/부피/물리 (메트릭, 기가 바이트/테라 바이트)가 요소 수와 레이블 수와 관련이없는 무한 저장으로 가정하면 통계적 패턴은 이미 30 개의 하위 집합으로 나타납니다. 그러나 1000 개 미만의 하위 집합은 테스트하기에는 너무 적으며 적어도 10000 개의 고유 한 하위 집합/"요소", "항목"/ 개체는 "큰 데이터 집합"입니다. 아니면 더 커? 감사합니다."큰"데이터 세트는 몇 개입니까?
0
A
답변
3
나는 당신의 질문을 이해할 수 있을지 모르겠다. 그러나 당신은 어떤 정도의 정확성을 보장하기 위해 샘플링해야 할 데이터 요소의 수를 묻는 것처럼 들린다. (30은 마술이다. 자주 연주하기 위해 들어오는 중심 극한 정리의 수).
이 경우 필요한 표본 크기는 신뢰도 및 신뢰도 간격에 따라 다릅니다. 95 % 신뢰 수준과 5 % 신뢰 구간을 원할 경우 (즉, 샘플에서 결정한 비율이 전체 데이터 세트의 비율의 5 % 이내라는 것을 95 % 확신하고 싶다면) 샘플 크기는 385 개 이하입니다. 신뢰 수준이 높을수록 생성하려는 신뢰 구간이 작을수록 필요한 표본 크기가 커집니다.
숫자를 실행하려는 경우 mathematics of determining sample size 및 편리한 sample size calculator에 대한 유용한 토론입니다.
관련 문제
- 1. 밖에있는 GPU는 몇 개입니까?
- 2. 실행중인 CLR 인스턴스는 몇 개입니까?
- 3. JSON. 허용되는 요소는 몇 개입니까?
- 4. 아직 야생에있는 Microsoft JVM은 몇 개입니까?
- 5. 도메인에 대해 쿠키 수는 몇 개입니까?
- 6. iPhone 시뮬레이터에서 지원하는 국제 언어는 몇 개입니까?
- 7. JS가 활성화 된 봇 수는 몇 개입니까?
- 8. n 비트 정수의 1은 몇 개입니까?
- 9. 전자 상거래를 지원할 데이터베이스는 몇 개입니까?
- 10. NHibernate 세션 : 몇 개입니까? 언제 만들까요? 언제 닫을까요?
- 11. iphone을 지원하는 동시 (동시) 네트워크 연결은 몇 개입니까?
- 12. 클래스의 객체 (단일/다중 상속을 사용)의 vptr은 몇 개입니까?
- 13. iphone/objective-c dev에 너무 많은 스레드가 몇 개입니까?
- 14. PHP에서 정의 할 수있는 최대 상수는 몇 개입니까?
- 15. 각 정렬 알고리즘에서 스와핑 및 컴마네이션은 몇 개입니까?
- 16. AppDomain 당 허용되는 app.config 파일 수는 몇 개입니까?
- 17. 내 앱의 경우 최적의 스레드 수는 몇 개입니까?
- 18. 배열의 요소 중 null이 아닌 것은 몇 개입니까? I는이 같은
- 19. 세트는 다음과 같이
- 20. CSS3 배경이 여러 개입니까?
- 21. 둥근 모서리가 두 개입니까?
- 22. C# Authcookie 세트는 어디에 있습니까?
- 23. 양식의 입력 값이 여러 개입니까?
- 24. has_one 외래 키가 두 개입니까?
- 25. 크기 k x k의 행렬에 대한 Strassen 알고리즘의 부동 소수 연산 수는 몇 개입니까?
- 26. 좋아요/보내기 버튼과 SDK에 필요한 애플리케이션 ID는 몇 개입니까? 나는 각각 하나씩 필요합니까?
- 27. 을 ViewData 세트는 여기에 마스터 페이지 MVC3
- 28. 장고 두에서 결과 목록을 정렬 검색어 세트는
- 29. Ruby에서 선호하는 RDF 도구 세트는 무엇입니까?
- 30. 캐릭터 세트는 우리 모두가 알고있는 방법
데이터 세트가 포함되어있는 데이터의 종류와 그 데이터를 사용하여 수행하려는 통계 분석을 지정해야합니다. – akappa
@akappa는 문맥이 없으면 말할 수 없다고 말합니다. –
무한 스토리지의 경우 데이터 세트가 "large"가 아닙니다 :-) –