반응형
몇년 전 윈도우 환경에서 파이션에서 opencv를 이용해서 얼굴 인식 시키는 예제 소스를 돌려 보고 굉장히 신기해 했던적이 있었어요. 이때 느낀점은 신기하기는 한데 너무 버벅 거려서 무료든 유료든 서비스를 만들기는 힘들겠다고 생각을 했었다.
최근 AI를 이용해서 움직임을 인식해서 바른 운동 자세와 횟수에 대한 게임 의뢰가 들어와서 관련 기술을 다시 찾게 되다가 ML Kit와 MediaPipe를 알게 되었어요. 샘플을 돌려 보니 예전과는 전혀 다른 성능과 기능이 있었어요. 서비스를 만들어도 될 만큼 품질도 나와서 기술 변화에 대한 격세지감을 느꼇다.
Media Pipe에서 제공하는 기능은 그림 1과 같다.
- Face Detection : 얼굴을 감지한다. 여러명 얼굴을 고속으로 감지한다.
- Face Mesh : 3D 얼굴 표면을 추론하여 얼굴 변화를 감지한다.
- Iris : 눈 안의 홍채를 정확하게 추적한다.
- Hands : 손의 모양과 움직임을 감지한다.
- Pose : 사람의 자세를 추적한다. 얼굴, 팔, 다리 어깨, 발, 손의 변화를 추적한다.
- Holistic : 위 Pose에 손가락과 얼굴 변화가 더 추가해서 추적한다.
- Hair segmentation : 머리카락을 추적한다.
- Object Detection : 사과, 컵, 책 처럼 사물을 인식한다.
- Box Tracking : 사물 단위로 추적한다.
- Instant Motion Tracking : 정적 또는 움직이는 표면에 가상 2D 및 3D 콘텐츠를 배치하여 실제 환경과 원활하게 상호 작용하게 한다.
- Objectron : 물체를 3D 형태로 감지한다.
- KNIFT (Keypoint Neural Invariant Feature Transform) : 템플릿 기반으로 특징을 매칭하여 인식한다.
MediaPipe의 가장 큰 특징은 클로스 플랫폼 지원이다. Android, iOS, C++, Python, JS를 지원하고 있다. 모바일과 PC 환경 양쪽을 다 지원하고 있다.
MediaPipe로 앱을 만들면서 내용을 계속 추가할 예정입니다.
보다 자세한 사용법과 전체 사용법은 아래 MediaPipe 사이트를 참고 바랍니다.
https://google.github.io/mediapipe/
Home
Cross-platform, customizable ML solutions for live and streaming media.
google.github.io
반응형
'프로그램 개발해서 돈벌기 > AI' 카테고리의 다른 글
DreamBooth : 주어진 사물(인물 포함)을 최대한 보존하면서 새로운 이미지 생성하기 (0) | 2023.01.16 |
---|---|
Stable Diffusion 기술 설명 : 텍스트로 이미지 생성 (0) | 2023.01.10 |
[실습] AI 장비 없이 단지 웹에서 AI로 이미지(그림) 생성(그리기)해 보기 (0) | 2023.01.06 |
AI가 개발을 같이 해 줘요. (0) | 2022.10.28 |
[teachable machine] AI 학습 도구 (이미지, 사운드, 자세) (0) | 2022.10.14 |
댓글