일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- DP
- Mask Processing
- 머신러닝
- SIFT
- MySQL
- C++
- 백준
- IN
- clustering
- MinHeap
- image processing
- 강화학습
- 딥러닝
- 그래프 이론
- 인공지능
- dynamic programming
- classification
- edge detection
- sklearn
- BFS
- Python
- Reinforcement Learning
- 자료구조
- opencv
- TD
- AlexNet
- canny edge detection
- machine learning
- exists
- dfs
- Today
- Total
JINWOOJUNG
[ GDSC ] MediaPipe 설치,환경설정 및 패키지 분석(Ubuntu 20.04) 본문
- Google MediaPipie
https://github.com/google/mediapipe
MediaPipie는 구글에서 제공하는 AI 프레임워크로, 대표적으로 사람의 손 등 인체를 대상으로 하는 비전 AI기능을 파이프라인 형태로 제공되는 서비스이다. MediaPipe Face Detection, Face Mesh, Hands, Pose 등 다양한 기능을 제공하는데 본 프로젝트에선 MediaPipe Hands를 주로 개발할 계획이다.
https://developers.google.com/mediapipe/solutions/vision/hand_landmarker
위와 같이 기본적인 가이드라인이 제공되며, 손을 감지하고 손 랜드마크(관절)을 감지한다. 기본적으로 아래와 같은 랜드마크가 존재하며, 각 랜드마크를 감지 혹은 관저들의 벡터사이 각도를 이용하여 수화를 인식 할 수 있도록 개발할 계획이다.
- MediaPipe Installation in Ubuntu 20.04
기본적으로 pip, python, OpenCV, Webcam Module은 설치되어 있다는 가정하에 진행하겠습니다.
pip3를 통해 Mediapipe를 설치하자
pip3 install mediapipe
예제코드를 실행시키면 다음과 같다.
- MediaPipe Package 분석
1. Coordinate
실제 각 Landmark의 Location이 World Coordinate 기준으로 출력된다고 하여 출력해본 결과 실제 5cm 차이가 10cm로 측정되는 약간의 오차가 있지만, 실제 미터 단위로 출력되고 각 coordinate 방향은 아래와 같다. 이때, 우리가 보고 있는 image 자체가 flip되어 self-camera 처럼 보이는 상황이고 이를 기준으로 했음을 주의하자.
2. 관절 Landmark를 이용한 벡터 계산
단순히 엄지, 검지, 손바닥 가장자리 젤 아래 랜드만크만을 이용해서 각도를 계산하고 판단하기에는 x,y,z 다 고려해야 하기 때문에 조금 다른 방법을 찾아야 할 것 같다.
'2024 > 공모전' 카테고리의 다른 글
[2024 Google Solution Challenge] Team Voice-Linker 회고록 (0) | 2024.03.09 |
---|