뚱이월드

DataSet 간단한 설명 본문

공부/코딩 관련

DataSet 간단한 설명

우리집뚱 2021. 8. 11. 23:47

9월 1일부터 대회가 시작이어서 아직 데이터셋이 공개되지 않았지만, 데이터셋에 대한 간단한 힌트를 줬다.

 

일단 주어지는 문제는 영상인식 문제로 학습 데이터가 주어지고, 학습 데이터로 인공지능 모델을 만들면 된다.

classification으로 이미지와 레이블이 주어지면 이미지를 보고 레이블을 예측하는 모델이다.

 

데이터셋에 대해 설명하면 입력으로 주어지는 이미지는 한 장이 아닌 여러 장이다.

예를 들어 자동차로 레이블이 되어 있고 이미지가 여러장 들어온다. 즉 데이터 셋이 RGB 3개의 채널이라면 10장의 이미지 30채널이 하나의 레이블(예: 자동차)을 가지게 된다.

그 이미지는 객체 전체의 이미지가 여러 장 들어오는 것이 아닌 하나의 객체에서 바퀴부분, 범퍼부분, 헤드라이트 부분 등 자동차의 여러부분을 랜덤하게 crop해서 하나의 자동차에 대해서 여러장이 주어지는 것이다.

그리고 가장 중요한 들어오는 입력 이미지에는 "노이즈"가 섞여 있다.

 

 

위 그림처럼 자동차를 예측할 때 하나의 자동차 이미지를 crop한 사진과 자동차가 아닌 노이즈 이미지를 crop한 사진이 함께 입력 이미지로 들어오게 된다. 즉, 2장의 이미지가 노이즈로 섞여 있다(실제 대회에서는 3장의 노이즈가 섞여 있었다).

 

이 상황에서 노이즈에 강건한 인공지능 모델을 만들어야 한다. 2장의 기차 객체 노이즈를 사람 눈으로 제거하는 것이 아니라, 인공지능의 학습을 통해서 노이즈에 강인한 모델을 만들어 정확도가 높은 분류기를 만드는 것이 이번 딥러닝 챌린지의 목표이다.

 

화이팅!😊👍

 

728x90

'공부 > 코딩 관련' 카테고리의 다른 글

[Pytorch]Transfer Learning  (0) 2021.08.15
Deep Learning Challenge시작  (0) 2021.08.11
Comments