화상/(동)영상/음성 | 머신러닝 인공지능과 실시간 카메라 피드를 사용해 정보를 탐색 가능한 기능(머신러닝, 실시간 카메라, 구글 렌즈, 텍스트 이미지 인식)(구글 렌즈와 유사)

페이지 정보

작성자 최고관리자 작성일24-09-27 15:43 조회420회 댓글0건

특징 : 머신러닝 AI 모델과 실시간 카메라 피드를 통해 촬영되는 텍스트와 이미지를 식별해 정보를 얻을 수 있는 기능

주요기능

- 카메라로 텍스트를 찍어, 텍스트를 100개 이상의 언어로 번역 가능

- 텍스트가 문제 형식일 경우 해당 문제의 풀이와 설명을 확인 가능

- 텍스트는 블록(단락), 라인(행), 단어 단위로 분류해 인식

- 카메라로 사물 촬영시 인공지능이 상품을 인식해 해당 상품, 유사 상품의 정보를 검색 가능

- 실시간 카메라 피드 기능을 제작하려면 머신러닝 AI 모델이 필요하고, 구글 ML Kit를 사용해 제작됨

- ML Kit는 기본 API 연동을 통해 머신러닝 AI 모델로 데이터를 전송 가능

- ML Kit는 기기에서 직접 작동하는 온디바이스 API와 구글 클라우드를 기반으로 작동하는 클라우드 기반 API로 분류됨

- 온디바이스 API는 기기에서 직접 작동하므로 네트워크 연결이 필요없고, 빠른 데이터 처리가 가능

- 클라우드 기반 API는 구글 클라우드의 머신러닝 기술을 활용하여 보다 정확한 데이터 처리가 가능

- 쇼핑 앱 개발시 상품 사진으로 유사 상품 목록, 유사 상품 가격 비교, 상품 평점과 리뷰 확인 가능

- 여행, 숙박 관련 앱의 경우 현재 위치를 검색 할 필요 없이 주변 랜드마크 사진을 통해 현재 위치를 확인

- 해당 랜드마크를 검색할 뿐 아니라, 주변 위치 정보와 주요 장소를 카테고리별로(식당, 숙박, 랜드마크 등) 확인 할 수 있게 제작

- 앱 내 커뮤니티를 제작 할 경우 사용자가 업로드한 사진이나 동영상을 분석하고 등장하는 사물을 자동 인식

- 인식된 사물은 상품 태그로 자동 등록 할 수 있도록 제작

[이 게시물은 최고관리자님에 의해 2024-06-24 17:27:01 포트폴리오에서 복사 됨]

[이 게시물은 최고관리자님에 의해 2024-06-24 17:28:11 포트폴리오에서 복사 됨]