2016-09-20 3 views
1
나는 다음과는 Kubernetes 통합 테스트는 RHEL 7.2, 페도라 (24), 및 CentOS7.1에 꽤 일관 시간의 약 90 %를 실패보고하고

:는 Kubernetes 복제 컨트롤러 통합 테스트는 실패

test/integration/garbagecollector 
test/integration/replicationcontroller 

그들은 것 같다 etcd 실패로 인해. 저의 온라인 질의는 저에게 이것이 apiserver 문제를 포함하고 있다고 믿게합니다. 내 설정은 간단합니다. 설치/시작 도커를 설치하고, github에서 kubernetes repo를 복제하고, repo에서 hack/install-etcd.sh를 사용하여 경로에 추가하고, 은행 나무, 고메가 및 go-bindata를 얻은 다음 ' 테스트 통합 '을하십시오. 수동으로 아무것도 변경하지 않거나 사용자 지정 파일/구성 파일을 추가하지 않습니다. 누구나 이러한 문제에 부딪쳐 해결책을 알고 있습니까? 온라인에서 본이 문제점에 대한 유일한 언급은 겉치레로 간주되어 나열된 해결책이 없지만이 문제는 거의 모든 단일 테스트가 실행됩니다. 오류의 조각이 필요하다면 내가 더 줄 수, 다음과 같습니다 :

가비지 콜렉터 :

\*many lines from garbagecollector.go that look good* 

I0920 14:42:39.725768 11823 garbagecollector.go:479] create storage for resource { v1 secrets} 

I0920 14:42:39.725786 11823 garbagecollector.go:479] create storage for resource { v1 serviceaccounts} 

I0920 14:42:39.725803 11823 garbagecollector.go:479] create storage for resource { v1 services} 

I0920 14:43:09.565529 11823 trace.go:61] Trace "List *rbac.ClusterRoleList" (started 2016-09-20 14:42:39.565113203 -0400 EDT): 

[2.564µs] [2.564µs] About to list etcd node 

[30.000353492s] [30.000350928s] Etcd node listed 

[30.000361771s] [8.279µs] END 

E0920 14:43:09.566770 11823 cacher.go:258] unexpected ListAndWatch error: pkg/storage/cacher.go:198: Failed to list *rbac.RoleBinding: client: etcd cluster is unavailable or misconfigured 

\*repeats over and over with different thing failed to list* 

복제 컨트롤러 : 심지어 시작하는 것이

I0920 14:35:16.907283 10482 replication_controller.go:481] replication controller worker shutting down 

I0920 14:35:16.907293 10482 replication_controller.go:481] replication controller worker shutting down 

I0920 14:35:16.907298 10482 replication_controller.go:481] replication controller worker shutting down 

I0920 14:35:16.907303 10482 replication_controller.go:481] replication controller worker shutting down 

I0920 14:35:16.907307 10482 replication_controller.go:481] replication controller worker shutting down 

E0920 14:35:16.948417 10482 util.go:45] Metric for replication_controller already registered 

--- FAIL: TestUpdateLabelToBeAdopted (30.07s) 

replicationcontroller_test.go:270: Failed to create replication controller rc: Timeout: request did not complete within allowed duration 

E0920 14:44:06.820506 12053 storage_rbac.go:116] unable to initialize clusterroles: client: etcd cluster is unavailable or misconfigured 

의/var의 파일이 없습니다/로그 kube와.

미리 감사드립니다.

+1

주인의 etcd 로그에 흥미로운 것이 있습니까? "etcd 클러스터를 사용할 수 없거나 잘못 구성되었습니다"라는 메시지는 사용자의 etcd에서 문제가 발생할 수 있음을 나타냅니다. –

+0

통합 테스트가 실행되는 동안 테스트가 끝날 때까지 다음과 같이 표시됩니다. 클러스터가 정상입니다. 구성원 ce2a822cea30bfca가 건강합니다. http://127.0.0.1:2379 에서 건강한 결과가 나옵니다. 그러나 실패한 테스트 시작하십시오. 클러스터가 비정상 일 수 있습니다. 구성원을 나열하지 못했습니다. 오류 : 클라이언트 : etcd 클러스터를 사용할 수 없거나 잘못 구성되었습니다. 오류 # 0 : 클라이언트 : 끝점 http://127.0.0.1:2379가 초과 된 헤더 시간 초과 오류 # 1 : 다이얼 tcp 127.0.0.1:4001 : getsockopt : 연결이 거부되었습니다 나는 etcdctl --no-sync를 실행하려했지만 도움이되지 않았습니다 –

+0

실패한 테스트 중에이 출력을 반복적으로 발견했습니다 : etcdserver : 파일의 80 % 서술하다 토크 제한이 사용됨 [used = 886, limit = 1024] –

답변

0

파일 설명자 수 제한이 늘어 났고 이후로이 문제를 보지 못했습니다. 그럼, 이걸 풀라고 부르 겠어.