3

이것은 핀홀 카메라 모델 :공식을 이해하는데 도움이 필요

enter image description here

(내가 얻을하지 않습니다 [R (t)가]가, 또는 (R, t)는) 이 공식은 점의 3 차원 좌표를 핀홀 카메라로 얻은 그림의 2 차원 좌표로 변환합니다.

투영도 : 벡터 위에

enter image description here

틸드는 "1"요소 벡터 등이 추가된다는 것을 의미한다. M은 3 차원 공간에서 점의 좌표이고, m은 그림에서 점의 좌표이며, f는 카메라의 초점 길이이며, s는 픽셀 종횡비입니다. (R, t)는 직사각형이 기술 된 세계 좌표계와 카메라 좌표계 간의 3D 변환을 나타냅니다.

A 이후의 [R t] (또는 (R, t))의 의미는 무엇인지, 모서리의 3D 좌표 (픽셀 종횡비 = 1)를 공식에 삽입하여 이 얻을 :

enter image description here

그리고 "t"편지가 무슨 뜻입니까?

이 수식은 here (13 페이지)에 있습니다.

+0

이 모델을 프로그래밍하고 있습니까? 아니면 수학 공식을 이해하려고하십니까? 후자의 경우 http://math.stackexchange.com/ –

+0

을 시도해야합니다. 예, 링크를 이용해 주셔서 감사합니다. 수식을 이해하려고합니다. – Userr

+0

우, 수학에 대해 몰랐어. 스 탁치 체인지 닷컴, 훌륭해! – PlexQ

답변

4

A [R t]는 카메라 이미지에서 이미지를 우리 세계로 가져 오는 전체 변형입니다. [R t]는 행렬 A와 곱해진 행렬입니다. R은 회전 행렬이고, t는 변환 행렬이며, 이들 모두는 카메라를 기술하는데 필요하다. A는 초점 거리, 픽셀 비율 및 중심점의 관점에서 사진 카메라를 설명하는 매트릭스입니다. 시스템이 [R t]를 풀려고합니다.

이 공식은 m에 의해 주어진 그림의 화이트 보드의 4 개 점이 평면에 놓여져 있고, 따라서 모든 m, z = 0 및 m에 대해 투영 공간 내에 좌표가 존재한다고 가정합니다 (1) .y = m (2) .y, m (3) .y = m (4) .y 및 m (1) .x = m (3) .x 및 m (2) .x = m 4) .x. 초점 거리, 픽셀 크기 및 변환에 의해 정의 된 물리적 카메라 왜곡을 m에 적용한 다음 A (m-tilde)가 M- 물결표로 끝나는 변환을 결정하고 그 변환이 매트릭스에 의해 주어지면 이미지를 수정합니다 [R t]. 기사를 끝까지 따라 가면 카메라 [R t]를 계산하는 공식이 (점으로) 표시됩니다. 그러나 m을 기준으로 M의 너비와 높이를 결정할 수는 없으며,이 응용 프로그램의 장기 실행에서는 임의의 해상도에서 다른 임의의 해상도로 매핑 할 때의 가로 세로 비율 만 알 수 있습니다. 절대 크기는 중요하지 않습니다.

+0

감사합니다. 그러나 수식 : (lambda) 2 * m2 = w * A * r2 + A * t가 어떻게 계산되는지 완전히 이해할 수 있는지 확실하지 않습니다. 모서리 좌표를 대입하면 다음과 같이됩니다. (lambda) 2m2 = A * r2 * t * w? – Userr