소프트웨어 개발/Computer Vision 4

Keras for Computer Vision

Keras는 쉬운 AI 개발을 위한 상위 레벨 인터페이스를 제공하는 파이썬 라이브러리이다. Tensorflow, Theano, CNTK, MXNET, PlaidML 등의 다양한 엔진을 사용할 수 있다. 공통 백엔드 함수를 제공하여 특정 엔진에 사용이 국한되지 않는다. Install Anaconda를 이용하여 설치하면 편리하다. Anaconda Distribution에서 Installer 다운 및 설치 Anaconda Prompt를 실행 conda install keras 입력 (or conda install keras-gpu) Basics 모델 개발 과정을 크게 4개의 단계로 나눌 수 있다. Data pre-processing Modeling Training Evaluation f(x) = 2x를 찾기 ..

Learning to Estimate 3D Hand Pose from Single RGB Images

Goal 3D hand pose estimation from a single color image with a learning based formulation. Background Use of multiple cameras limits the application domain Depth cameras are not as commonly available and only work reliably in indoor environments Representation 21 joints in 3D space Normalize the distance between certain pair of key-points to unit length (to solve scale ambiguity) Translation inva..

Deep Learning Basics For Computer Vision

Learning Methods Supervised Learning 주어진 입력 데이터 (Sample, Instance, X) 에 대한 타겟 (Target, Label, Y) 을 학습한다. Regression : 입력에 대한 결과값 예측 Classification : 입력이 어떤 분류인지 예측 Tagging : 입력이 어떤 분류인지 다중 예측 Search/Ranking : 입력 집합에 대한 순위 예측 Sequence Learning : 다중 입력에 대한 결과값 예측 Unsupervised Learning 주어진 입력 데이터에 대한 타겟 없이 학습한다. Clustering : 비슷한 분류로 그룹핑 Subspace Estimation : 부분 공간 추정 (특성을 좌우하는 파라미터 검출) Principal Co..

GANerated Hands for Real-Time 3D Hand Tracking from Monocular RGB

Goal Track hand pose from unconstrained monocular RGB video streams at real-time framerates Background Multi-view methods Hard to setup (calibration) Hard to operate on general hand motions in unconstrained scenes Expensive Monocular methods Without setup overhead Do not work in all scenes (e.g. outdoor with sunlight) Higher power consumption Not robust to occlusions by objects Not able to disti..