▲ 스텐포드 대학의 ImageNet 홈페이지



저작자 표시
신고
Posted by getcome
블로그에 얼굴을 찾고 이를 추적하고 싶은데 어떻게 해야 하냐고 문의하신 분이 있어 현재 시점에서 비교적 잘 되는 알고리즘을 소개합니다.

사용자 삽입 이미지

CMU(항상 그렇듯 ^^)에서 작업한 내용으로 Active Appearance Model(AAM)을 사용하여 얼굴을 추적하는 알고리즘입니다. 얼굴의 형태는 deformable body로 모델되는데 기존 모델을 계속적으로 변경하는 얼굴에 어떻게 fit 시킬 것인지 방법을 제시해 줍니다. 핵심은 물체는 3D 공간 상에서 움직이지만 영상은 2D로 projection 되어 있기 때문에 이 간극을 어떻게 처리할 것인가 입니다.
긴말 필요없이 해당 논문을 첨부해 둡니다.



아래 동영상은 비교적 예전에 발표된 AAM 방식의 얼굴 추적 데모 동영상입니다. 요즘은 이보다 훨씬 더 잘된답니다. ^^;




신고
Posted by getcome
2008년 작업2008.05.14 11:04
사용자 삽입 이미지

4월 말에 지폐를 인식할 수 있는 알고리즘 및 하드웨어를 개발해 달라는 의뢰가 들어왔습니다.
지폐의 방향, 위치, 오염도에 상관없이 강인하게 지폐를 인식해야 하는데, 일단 PC에서 알고리즘을 테스트하기 위해 구현한 시스템입니다. 추후 Smart-I 플랫폼을 베이스로 임베디드화를 진행하게 될 것 같습니다.

우선은 일반 웹캠을 사용하였고, 웹캠에서 받은 이미지를 토대로 천원, 오천원, 만원권을 인식합니다. 지폐는 앞면, 뒷면 상관없이 또한 방향에도 상관없이 인식합니다. 데모에서는 인식할 때 해당 지폐의 이미지가 출력되도록 해 두었습니다.

동영상으로 데모를 보시기 바랍니다.


신고
Posted by getcome
사용자 삽입 이미지

앞서 소개한 증강현실 기술을 이용하면 다양한 응용을 생각해 볼 수 있다.
예를 들어 그래픽 카드를 하나 구매했을 때 설명서가 따라온다.
우측 상단에 있는 포트가 어떤 포트인지 알려면 설명서를 뒤적거리면서
보드와 매뉴얼상의 그림을 매칭시켜가며 찾아야 하는데, 이 때 증강현실 기술을
이용하면 보다 지능적인 매뉴얼을 만들 수 있다.

웹캠 앞에 그래픽 카드를 비추면 LCD 모니터에서는 각 포트의 명칭을 화면에 뿌려주는 것이다. 이렇게 하면 보다 직관적이고 편리하게 정보를 전달할 수 있다.



신고
Posted by getcome
2008년 작업/Color-Eye2008.04.03 04:50
임베디드 비전 보드인 Smart-I를 이용하여 특정 색상을 추적하고, 그 위치로 팬-틸트 유닛을 이동하여 색상을 추적하는 시스템을 구현하였습니다. 특정 색상을 찾는 시스템이기에 Color-Eye라이는 이름을 붙였습니다. 이전에도 이러한 동일한 시스템이 많이 있었습니다만, NTSC 카메라에 이미지 그래버를 붙이고, PC에서 영상 처리는 수행하는 것이 일반적인 구성이었습니다. 오늘 소개하는 시스템은 모든 과정이 임베디드 시스템(Smart-I)에서 구현된 시스템으로 가격은 기존 시스템에 비해 1/10, 크기 역시 1/10 이하로 줄어드는 효과가 있습니다.
사용자 삽입 이미지


CMOS 센서로 부터 영상을 입력받고 영상에서 사용자가 지정한 색상을 실시간(30fps)으로 찾고, 색상을 추적하기 위해 pan-tilt를 제어하는 역할까지 smart-I 에서 수행합니다. 즉, PC는 전혀 사용하지 않습니다.

재미있는 데모를 구성하기 위해 원운동을 하는 돼지에 색종이를 매달고, 이 색상을 추적하도록 데모 셋트를 구성해 봤습니다.
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지

이 데모 셋트는 물건너 피츠버그에서 개최되는 RoboBusiness2008에 출품하게 되었습니다. 미국에 가서 위드로봇의 기술을 잘 홍보해 주었으면 합니다.
자, 동영상으로 감상해 보시죠.


신고
Posted by getcome
2008년 작업/V-yond2008.03.17 17:41
사용자 삽입 이미지

2008년도 V-yond 프로젝트에는 Smart-I를 이용해서 제스쳐 인식을 넣기로 결정하였습니다. 당장 테스트가 불편하니 Wiimote를 이용해서 테스트 플랫폼을 구현해 보았습니다. Wiimote를 이용한 테스트 플랫폼이 궁금하신 분은 앞서 소개한 글을 참조하시기 바랍니다.


중앙에 관찰 물체가 있고, IR 펜의 움직임에 따라 확대, 축소, 각 축 방향으로의 회전이 가능합니다. 당장은 마우스 커서가 잘 눈에 띄지 않고, 절대 위치라는 점이 좀 불편합니다.
일단 성능을 점검하기 위한 테스트 플랫폼으로 활용하고, 추후 정식으로 Smart-I를 이용해 제작이 완료되면 다시 소개하겠습니다.
신고
Posted by getcome
2008년 작업2008.03.17 16:14
Smart-I 플랫폼을 이용하여 다중 적외선 발광체 추적 장치를 만들고 있습니다. 유사한 개념으로 닌텐도의 Wii의 조정기인 wiimote에 구현이 잘 되어 있지요. 일단 비교 검증을 위해 wiimote를 이용해서 유사한 시스템을 만들어 보았습니다. 필요 시스템은 wiimote와 블루투스가 동작하는 노트북 한 대가 있으면 됩니다. 물론 IR 펜(건전지 + 저항 + IR LED 조합)도 필요하구요.
사용자 삽입 이미지
화면 상에 이미지를 출력하고, 두 개의 IR 발광체의 거리와 각도에 따라 확대, 축소, 회전, 이동이 구현됩니다. 실제로 실험해 보면 상당히 해상도가 높은 것을 관찰할 수 있습니다. 이걸 4만원대에 만들어 낸 닌텐도 엔지니어들... 대단합니다. 수천만대 팔아재끼는 시스템이다 보니 이정도의 customize가 가능했겠지요.

조만간 위드로봇에서도 유사한 개념의 시스템인 VR pen을 선보일 예정입니다. Wiimote보다 늦게 시작하는 만큼 좀 더 강력한 기능을 갖추고 세상에 내보낼 참입니다. 기대해 주시기 바랍니다.

신고
Posted by getcome
사용자 삽입 이미지

차범근 감독이 나오는 전화 선전 중에 손에서 전화 번호가 쭉 나와서 휘두르는 장면이 있다. 실제 영상(차범근 감독 손)과 가상 공간의 물체(전화 번호)를 서로 붙여서 가상 현실 공간을 확장하는 개념이 augmented reality 이다. 상업적인 용도로 쓰임새가 무척 많기 때문에 최근 많은 영상처리 연구자들이 눈이 뻘개져라 많은 연구 결과를 토해내고 있다. SIG Graphic 2007에서도 이쪽 동네 논문이 무척 많이 쏟아져 나온 것을 확인할 수 있다.

이드의 전공과는 약간 거리감이 있긴 하지만 low-level에서부터 비전을 다루다보니 이러한 시스템을 구현하는 것은 다른 팀에 비하면 매우 손쉬운편이다. myVision USB를 이용해서 간단한 데모 시스템을 구현한 결과이다. 아이디어를 이야기했더니 소프트웨어팀에서 뚝딱뚝딱 하루만에 구현한 시스템이다. 역시 위드로봇 랩의 각 팀들 능력은 대단하다는 생각이 든다. ^^;

실험은 매우 간단하다. 박스에 특정 물체를 출력시킨다. 박스가 움직이면 따라서 움직이는데, 박스 추적을 취소하면 그 장소에서 계속 출력되어 마치 그 자리에 가상의 스크린이 있는 것처럼 보인다.
시간이 허락하면 좀 더 일을 진행하겠는데 갑자기 새로운 일들이 생겨서 더 이상 만지작거리지는 못하고 있다. 4월은 되야  재미있는 또 다른 동영상을 소개할 수 있을 것 같다.

신고
Posted by getcome
특정 컬러를 추적하는 알고리즘은 많이 있지만 OpenCV에서 제공하는 CAMShift 알고리즘은 소스 자체가 공개된 덕분에 많이 사용되고 있습니다. NTSC 영상을 PC에서 처리할 수 있도록 디지타이즈해서 USB 포트로 전송하는 myVision USB를 이용하면 OpenCV의 알고리즘은 실시간 영상에 손쉽게 적용할 수 있죠. 사용방법은 별다른 어려움이 없습니다. myVision USB 디바이스만 제대로 설치했다면, OpenCV에서 바로 사용이 가능합니다. 단, 주의해야 할 점은 Ch1만 OpenCV에서 지원되므로 Ch1에 카메라 영상을 넣어야 합니다.

아래 예제는 sample 폴더에 있는 camshift 예제를 이용해 노란색 손수건을 추적하는 예입니다. 실시간으로 색상 정보를 업데이트하기 때문에 조명 변화에 강인합니다.
백문이 불여일견. 보시죠. (myVision USB에 대한 자료가 있는 곳으로 이동하기)


신고
Posted by getcome
도립 진자, Inverted Pendulum - 직선 운동 방식
도립 진자, Inverted Pendulum - 원운동 방식
도립 진자, Inverted Pendulum - 비전을 이용한 2차원 방식

도립 진자 시스템 소개의 마지막편으로 가장 진보된 형태를 소개한다. 더 이상 막대를 1차원 평면에서 세우는 것이 아닌 2차원 평면에서 공이 떨어지지 않도록 균형을 잡는 시스템이다. 1394 카메라로 공의 위치를 파악하고, 바닥의 기울기를 조절해 공이 떨어지지 않도록 제어한다. 놀라운 점은 공을 던져도 잡아낸다는 것이다. 30 프레임의 NTSC 카메라로는 힘든 작업을 프레임수를 높인 1394 카메라로 수행하고 있다.





신고
Posted by getcome

티스토리 툴바