2023. 12. 2. 22:46ㆍProject/Face DB 구축
원본 자료는 개인 정보 보호를 위해 과제 종료 후 삭제되었습니다.
블로그에 업로드된 모든 내용 자료는 진행 중 테스트를 위해 만든 별도의 복제본입니다.
최종 사용된 코드 및 시트와 다를 수 있습니다.
아래에 작성된 내용은 과제 진행 중 본인이 직접 진행한 부분 만 포함하였습니다.
문제 사항 발생 시 포스트는 즉시 삭제할 예정입니다.
**필자는 전체 데이터 중 구글 폼을 통해 취합된 데이터에 대한 처리를 진행하였다. 그외의 경우 다른 인원들이 메일이나 카톡으로 취합하여 진행하였다. 해당 부분에 대한 포스트는 진행하지 않을 것이다.
**포스트는 본인이 처리한 과정에 대한 내용만 작성하였고 그외 프로젝트 관련 내용과 상세한 부분은 전부 생략했다.
사진 수집
사진 수집은 구글 폼으로 진행하였다. 홍보글을 접한 제공자가 구글폼에 접속하여 개인정보 및 민간정보의 수집 및 이용에 동의하고 제공자의 인적사항, 가족 구성원 별 역할(부, 모, 아들, 딸)/나이(출생년도)/성별 입력, 사진 업로드 순으로 입력하여 제출할 수 있도록 구성하였다.
제출 창구로 구글 폼을 채택한 이유는 다음과 같다.
- 별도의 웹 페이지와 서버를 구성하지 않아도 된다.
- 안내 문구 및 안내 이미지 삽입이 쉽다.
- 배포를 위한 QR과 짧은 URL 생성이 쉽다.
- 질문 별 상세한 조건 설정이 편리하다.(ex. 미응답 시 진행 불가, 조건에 따른 질 세션 진행 등)
- 이미지 제출 시 구글 드라이브로 업로드가 가능하다.
- Sheet로 응답을 출력할 수 있다.
이중에서 "이미지 제출 시 구글 드라이브로 업로드가 가능하다"는 점과 "Sheet로 응답을 출력할 수 있다"는 점을 적극적으로 이용하려 하였다.
지금까지 준비된 것은 구글 폼과 응답 시트 2가지 이다.
이제 응답시트를 살표 보면 아래와 같이 타임 스탬프와 이메일 외에는 작성한 구글폼 질문들과 동일함을 알 수 있다.
타임 스탬프는 구글 폼에 답변이 제출된 시간이 기록된다. 이메일의 경우 구글의 정책 때문에 추가되었다. 구글 폼 질문을 통해 파일을 업로드하도록 설정 시 답변자는 무조건 구글 이메일로 로그인 하도록 되어있었다.
추가적인 매우 중요한 특이 사항이다
눈썰미가 좋은 분이라면 필자가 이를 확인하고 이후 처리를 어떻게 진행하였을지 짐작하실 수 있을 것이라 생각한다.
이제부터 구글 폼과 시트, 드라이브를 이용한 처리의 강력함을 알 수 있다.
과제 진행 초기, 본인은 교수님께 처리 자동화(완전X, 일부)를 위해 몇 가지 사항을 제안하였다.
- 구글 폼을 이용 제출 => 구글 시트(결과 분석), 구글 드라이브(파일 저장)
- 결과 확인 편의를 위한 검증 시트 작성
- 코랩을 이용한 얼굴 영역 Crop(Dlib, Pandas, OS, CV2 이용)
*** 초기에는 얼굴 인식 라이브러리를 통해 성별, 나이를 구분하여 나열하면 부, 모, 자식을 구분하여 높은 수준의 자동화를 진행할 수 있을 것으로 생각했지만 얼굴 인식 성능과 특성 인식의 성능 한계로 이것이 힘들다는 것을 확인해 폐기하였다.
다은 편은 구글 시트를 이용한 간단한 처리, 마지막 편은 코랩을 이용한 이미지 처리와 라벨링, json 작성에 관한 것이다.
'Project > Face DB 구축' 카테고리의 다른 글
Projet[01]-Face DB 구축 [3] 이미지 처리와 라벨링, json 작성 (0) | 2024.02.12 |
---|---|
Projet[01]-Face DB 구축 [2] 응답 데이터 처리(구글 시트) (0) | 2023.12.03 |