Camera Calibration
2022. 5. 11. 14:24
인공지능/pose estimation
Camera Calibration projection matrix - 3x4로 된 행렬 P - 여기에 world coordinates (X, Y, Z, 1) 를 곱하면 λ * (u, v, 1) 을 얻는다 - u, v : 픽셀 위치 - λ : unknown depth - central projeciton 과 픽셀을 활용하여 "range space" 구하기 --> Projection matrix P 를 먼저 알아야 함 더보기 V를 W로 변환해주는 행렬 A가 있다하자. A행렬의 Range space는 y가 W에 속할때 V에 속한 모든 x에 대해 Ax = y가 되는 공간을 말한다 즉, V공간에서 모든 x들이 W공간에서 특정 부분으로 대칭 된다는 말이다. [출처] 글로 정리하는 제어 - Null Space & R..
How to Compute Intrinsics from Vanishing Points
2022. 5. 11. 11:00
인공지능/pose estimation
Intrinsic parameters how to calculate focal length & image center horizon = line at infinity - horizon gives us the full information aboue how the ground plane is oriented with respect to the camera 정면에서 제대로 보고 있다면 horizon(주황선)이 이미지 중앙에 있었을 것 하지만 tilted 되었기 때문에 소실점 C도 이미지 밖 image plane 어딘가에 있게 됨 세 소실점 A, B, C의 관계는? horizon이 카메라의 방향(how oriented your camera is)에 달린 거라면, 소실점 C가 어디에 있는지 정확히 알 수 있어야..
컴퓨터 밑바닥부터 이해하기(2) - 가산기 만들기
2022. 5. 10. 20:31
컴퓨터/BASIS
덧셈? a + b = c, 즉 두 개의 입력을 받아 c 를 출력하게 함 1. 칩에 대한 진리표를 만든다 2. 진리표를 수식으로 만든다 3. 수식을 논리게이트로 표현한다 [칩에 대한 진리표를 만든다] 덧셈을 진리표 형식으로 나타내기 A B C 0 0 0 1 0 1 0 1 1 1 1 2 bit로는 마지막 행을 표현할 수가 없음 ---> '자리올림'으로 해결 ㄴ 위 그림을 열별로 보았을 때 덧셈을 두번 시행했다고 볼 수 있음 ㄴ (자리올림값) + a + b = c 로 된 계산이 두번 시행된 것 따라서 가산기의 모양은 아래와 같이 됨 input은 세 개 : A, B, Ci (자리올림) output은 두 개: Sum, Co (다음 자리올림에 올라갈 값) Co 값은 새로운 가산기의 Ci 값이 됨 위 가산기의 진리표..
3D World to First Person Transformation
2022. 5. 10. 16:14
인공지능/pose estimation
Multiple View Geometry: 3rd person view measurement - 동일한 오브젝트를 여러 다른 관점에서 보게 될 때 (step 3) : 3rd person to 1st person 3D mapping: the world to camera coordinates - 3rd person 3D 좌표계에서 측정된 3D 공간의 point들 --> 불변함. 상수임. - 바뀌는 것은? 1st person 관점에서 3D 벡터가 어떻게 보이는지 --> 3rd person 3D point 들을 1st person 으로 변환해야 함 - Rotation: 좌표계의 변화 - Translation : world center를 camera center로 변환 이러한 방식으로 최최종.. - X, Y, Z..
Pinhole Camera Model/Focal Length and Dolly Zoom Effect/Intrinsic Camera Parameter
2022. 5. 10. 10:00
인공지능/pose estimation
Pinhole Camera Model "First Person Camera World" - 눈이 세계 정중앙에 위치한다고 가정 - (0, 0) 에 위치 - 모든 것은 나에 대해 상대적으로 측정됨 - 오른쪽이 x축, 아래가 y축, 오른손 엄지 세웠을 때 정면이 z축 - z축 방향으로 focal length(f) 만큼 떨어진 위치에 canvas를 둠 - 3D 세계에서 한 지점을 2D로 가져오려면 shrinking하게 되는데, 그것이 얼마나 멀리 있는지와 관련됨 - Z로 shrink하고 (멀어질수록 z가 커지므로, 멀리 있을수록 더 shrink하게 됨), f로 magnify함 (focal length 커질수록 더 magnify됨) - image plane의 크기는 고정되어 있으므로, focal length 를..
컴퓨터 밑바닥부터 이해하기(1)
2022. 5. 10. 00:19
컴퓨터/BASIS
출처 https://www.youtube.com/playlist?list=PLIGFku39tFfbMweTcTx5GWF67em5kITnM 1. 누구나 이해하는 컴퓨터 하드웨어 개요 - CPU와 메모리를 이해하자! - 컴퓨터 하드웨어의 핵심은 CPU [CPU] 세 개의 부품 - ALU(arithmetic-logic unit) : 산술, 연산, 논리 ... - Register : 메모리 역할 - Control Unit : RAM에서 프로그램이 한 줄씩 올 때(0110101...) 맨 앞 두 비트는 연산자, 뒤 몇 비트는 저장 위치 등등 .. 디코딩 [ALU] - 논리게이트들의 부품들로 이루어져 있음 - 0, 1로 할 수 있는 논리 연산 (최하단의 단위) --> 컴퓨터 밑바닥부터 이해하기! 2. 논리게이트 - ..
Rotations and Translations
2022. 5. 9. 16:45
인공지능/pose estimation
how to write "cooridnate transformations" built out of rotations, translations between thess two cooridnate systems In computer vision, we project the points into image planes we take a picture of the point with a camera (1) the coordinates of the point in GPS - World Coordinates: wP (윗첨자) (2) the coordinates of the point in the camera coordinate system - the ray that is going out from the proje..
Point-line Duality
2022. 5. 9. 14:25
인공지능/pose estimation
동차좌표계의 Point-line Duality point 는 3차원 벡터로 표현되기 때문에 plane 임 [이전 내용과 동일] - 두 점을 cross 함으로써 두 점을 이루는 선에 대한 surface normal 를 구할 수 있음 (동차 3차원 벡터) - 두 선을 cross 함으로써 두 선의 surface noraml 에 대해 수직인 교차점(ray)을 구할 수 있음 "duality" 3차원 상 점이 선과 같이 기능하기 때문 만약 P가 (x, y, 0) 라면? * image plane 의 모든 점은 (x, y, 1) 이어야 했음. 그렇다면? 마지막 요소로 나눔으로써 2차원 점으로 변환할 수 있었음. x를 0으로 나누고 y를 0으로 나누면 무한대가 나옴 image 안에서, 평행하는 선들의 집합과 관련되는 하..