▲ 스텐포드 대학의 ImageNet 홈페이지



저작자 표시
신고
Posted by getcome

  • 169102.pdf(출처:www.iitp.kr)

  • 주요 내용 요약
    • 지능형 CCTV는 현재 사용자의 만족도가 100점 만점에 21점 정도로 매우 낮은 편이다.
    • 1세대 motion detection, 2세대 video analysis, 3세대 Crowd sourcing으로 발전하고 있음
    • 2012년을 기준으로 DVR 시장은 성장 둔화기로 접어들었고, 대신 IP 카메라가 성장하고 있음. 국내 영상 보안 시장은 2012년 기준 2.4조원 규모
    • 시험인증은 현재 영국의 CAST(Centre for Applied Science and Technology)에서 운영하는 i-LIDS(Imagery Library for Intelligent Detection Systems)가 유일의 인증제도
      • 총 6개의 시나리오가 존재하며, 시나리오별로 인증을 부여
    • 국내에서 인증제도를 만들기 위해 준비 중인 시나리오의 6가지 이벤트: 배회, 침입, 방화, 쓰러짐, 유기, 군중군집, 싸움
    • 시험 평가 항목은 7가지: 적응시간, 정상검출, 미검출, 오검출, 검출률, 정확도, F1


저작자 표시
신고
Posted by getcome
Texas Instrument 사의 Davinci 시리즈에 새로운 제품군이 추가되었습니다. 비교적 저가형에 속하는 DM3x 군인데요, 모델 번호는 DM365 입니다. 모델 번호에서 풍기듯이 DM355의 업그레이드 버전입니다만, 많은 기능이 추가되어 단순히 DM355의 업그레이드 버전이라고만 보기에는 어렵습니다.

블록 다이어그램을 한 번 보죠.
전체적인 구조는 DM355와 유사합니다. ARM9 프로세서가 Front에 배치되어 밖에서 보기에는 ARM9 프로세서처럼 보입니다. 하지만 뒤에 DSP가 존재하여 MPEG-4/JPEG을 실시간 인코딩해 줍니다.
새롭게 추가된 기능 Video Processing Subsystem 항목입니다. 이곳에 있는 ISP에서는 크게 두 가지 기능이 눈길을 끕니다. 첫번째는 face detection 입니다. 하드웨어적으로 얼굴 검출 알고리즘을 구현해 두어, 별도의 프로그램을 작성하지 않아도, 320x240 해상도에서 30fps 속도로 얼굴을 검출, 추적합니다. 복수 개의 얼굴도 가능하며, 스펙상으로는 최대 20여명까지 가능하다곤 합니다만, 320x240 해상도에 20여명의 얼굴이라면 얼굴로만 꽉 차겠죠.
동영상 데모도 찾았습니다. 1분 47초 이후를 보시면 얼굴 검색 알고리즘이 동작하는 부분을 확인할 수 있습니다.



두 번째 기능은 Image stabilization 입니다. 소위 손떨림 방지라고도 하는데요, 모션 벡터를 실시간으로 구해 흔들리는 이미지를 흔들리지 않게 보여주는 기능이 하드웨어적으로 추가되었습니다.

이 밖에도 렌즈 왜곡을 보정해주는 기능도 하드웨어적으로 들어가 있어 비전 전공자들에게 많은 부분의 자유도가 생겨났습니다. 위드로봇에서도 조금 한가해지면 DM365로 새로운 모듈 보드를 만들어볼 계획을 가지고 있습니다.


신고
Posted by getcome
2008년 작업2008.05.14 11:04
사용자 삽입 이미지

4월 말에 지폐를 인식할 수 있는 알고리즘 및 하드웨어를 개발해 달라는 의뢰가 들어왔습니다.
지폐의 방향, 위치, 오염도에 상관없이 강인하게 지폐를 인식해야 하는데, 일단 PC에서 알고리즘을 테스트하기 위해 구현한 시스템입니다. 추후 Smart-I 플랫폼을 베이스로 임베디드화를 진행하게 될 것 같습니다.

우선은 일반 웹캠을 사용하였고, 웹캠에서 받은 이미지를 토대로 천원, 오천원, 만원권을 인식합니다. 지폐는 앞면, 뒷면 상관없이 또한 방향에도 상관없이 인식합니다. 데모에서는 인식할 때 해당 지폐의 이미지가 출력되도록 해 두었습니다.

동영상으로 데모를 보시기 바랍니다.


신고
Posted by getcome
비접촉 방식으로 물체를 인식할 수 있는 RFID는 어떤 물건에 있는지 없는지 판독하는데에는 매우 유리하지만 정확히 어디에 있는지 알기는 어렵습니다. RFID tag가 인지할 수 있는 안테나 범위 안에 들어왔는지 아닌지 바이너리로 값이 나오기 때문에 멀리서도 측정하려다 보면 상대적으로 위치 측정의 정밀도도 같이 떨어지게 됩니다. 작년에 수행했던 RFID를 이용한 이동 로봇의 위치 추정 실험(RAVI)에서도 이 문제를 풀기 위해 particle filter를 사용했었죠.

다른 방법으론 영상처리로 RFID의 단점을 보완하여 위치 정밀도를 높임과 동시에 프로젝터를 이용하여 다양한 영상을 출력하여 다양한 응용예를 보이는 장치를 만들어 데모를 보인 연구가 있습니다. 프로젝터와 RFID 리더, 가속도 센서, 레이저 포인터의 조합으로 구성된 하드웨어는 단순히 물체의 위치를 localization해 줄 뿐만 아니라, 해당 물체의 표면에 원하는 텍스쳐 투영 및 이미지 복사 등 쓰임새가 매우 다양합니다.

사용자 삽입 이미지

동영상 데모는 꽤 길지만 그만큼 응용예가 많다는 증거입니다. 한 번 보시고 다양한 아이디어를 내 보시기 바랍니다. 연구원 중에는 최근 Wiimote의 활용예를 공개해서 많은 네티즌으로부터 관심을 받고 있는 Jonny Lee의 이름도 보입니다.

신고
Posted by getcome
사용자 삽입 이미지

앞서 소개한 증강현실 기술을 이용하면 다양한 응용을 생각해 볼 수 있다.
예를 들어 그래픽 카드를 하나 구매했을 때 설명서가 따라온다.
우측 상단에 있는 포트가 어떤 포트인지 알려면 설명서를 뒤적거리면서
보드와 매뉴얼상의 그림을 매칭시켜가며 찾아야 하는데, 이 때 증강현실 기술을
이용하면 보다 지능적인 매뉴얼을 만들 수 있다.

웹캠 앞에 그래픽 카드를 비추면 LCD 모니터에서는 각 포트의 명칭을 화면에 뿌려주는 것이다. 이렇게 하면 보다 직관적이고 편리하게 정보를 전달할 수 있다.



신고
Posted by getcome
도립 진자, Inverted Pendulum - 직선 운동 방식
도립 진자, Inverted Pendulum - 원운동 방식
도립 진자, Inverted Pendulum - 비전을 이용한 2차원 방식

도립 진자 시스템 소개의 마지막편으로 가장 진보된 형태를 소개한다. 더 이상 막대를 1차원 평면에서 세우는 것이 아닌 2차원 평면에서 공이 떨어지지 않도록 균형을 잡는 시스템이다. 1394 카메라로 공의 위치를 파악하고, 바닥의 기울기를 조절해 공이 떨어지지 않도록 제어한다. 놀라운 점은 공을 던져도 잡아낸다는 것이다. 30 프레임의 NTSC 카메라로는 힘든 작업을 프레임수를 높인 1394 카메라로 수행하고 있다.





신고
Posted by getcome
Python2008.01.24 01:01
공개용 영상 처리 라이브러리 OpenCV는 발표 초기에는 그다지 관심을 끌지 못하더니 2000년대 중반에 들어서는 많은 곳에서 관심을 가지는 듯 하다. Withrobot Lab에서도 몇 번 myVision을 지원하는 방법을 고민했었고, 실제로 내부적으로는 OpenCV와 연동해서 사용하기도 했었다.

오늘은 OpenCV 라이브러리를 Visual C가 아닌 Python에서 사용하는 방법을 정리해 두고자한다. 다행히 OpenCV는 python에서 바로 사용할 수 있도록 준비가 완벽하게 되어있다. Visual C가 아닌 python으로 작업하면 알고리즘 본연에 좀 더 집중해서 빠르게 결과를 확인할 수 있다.

자, 우선 python 2.5는 설치되어있다고 가정한다. 만일 설치가 안되어 있다면 http://www.python.org/download/ 에서 해당 파일을 받아 설치한다.

OpenCV는 이곳에서 내려 받는다. 기본 설치 폴더는 Program Files\OpenCV 가 된다.

그다음 아래의 python OpenCV 모듈을 내려받아 압축을 풀면 OpenCV 폴더가 나온다. 이 폴더를 python의 Lib\site-packages 밑에 복사한다.

이것으로 설치는 완료되었다. 이제 OpenCV\Samples\Python 폴더에 있는 코드를 실행시켜본다. 얼굴 찾는 예제인 facedetect.py 를 실행해 보자. 영상처리 연구자들의 연인 lena에서 얼굴 위치를 찾아 붉은색으로 표시한다.


사용자 삽입 이미지

신고
Posted by getcome
2000년대 초반에 세계에서 비전분야로 잘나간다는 연구원들을 MS사에서 모두 채용해서 연구소를 하나 차린 적이 있다.Vision research group이라고 해서 한동안 Vision SDK도 공개하고 여러 가지 재미있는 툴들을 공개하곤 했는데 그 후론 한참 조용했었다.

물론 아직도 그 연구소는 건재하며 가끔 image processing이나 machine vision 쪽 conference에 가면 관련 연구자들을 만날 수 있었지만 눈에 띄는 연구를 발견하기는 어려웠다.

오늘 소개하는 기술은 간만에 그 침묵을 깨고 공개한 동영상으로 일년쯤 된 영상이다. 지능형 회의 테이블로서 Sony와 Phillips에서도 유사한 연구 결과를 이전에 발표한 적이 있었는데, MS에서는 user interface 부분을 좀 더 강화해서 내 놓았다. 개념 특허가 안 걸려있는지 이곳저곳 유사한 제품들이 나오는데, 최종 승자가 누가 될련지 궁금하다.


지능형 테이블이란 한 마디로 카메라 영상 인식 기술과 프로젝터(또는 스크린)을 결합시켜 테이블 자체가 스크린이자, 복사기 역할을 수행한다. 인터페이스는 손가락 또는 제스쳐, 또는 미리 약속된 특정 물체가 될 수 있다.

이드는 동영상 마지막의 야채 씻을 때 쓰는 볼(그릇)과 같은 인터페이스에 매우 흥미가 간다. 언제쯤 동영상에서 보여주는 장비가 우리 앞에 선보일지는 모르겠지만 생각보다는 짧은 시간안에 우리 앞에 등장할 것이다. Are you ready?
신고
Posted by getcome

티스토리 툴바