관리 메뉴

ComputerVision Jack

Public Dataset (VGG Face) 본문

Computer Vision/Public Data

Public Dataset (VGG Face)

JackYoon 2021. 5. 6. 22:27
반응형

www.robots.ox.ac.uk/~vgg/data/vgg_face/

 

Visual Geometry Group - University of Oxford

[NEW] See Also VGGFace2 Dataset New large scale face dataset with 9131 identities. VoxCeleb URLs and timestamps of YouTube Videos for 1251 of the VGG Face identities. Overview This page contains the download links for building the VGG-Face dataset, describ

www.robots.ox.ac.uk

저번 WIDER Face Dataset에 이어 소개할 Face Dataset은 VGG Face입니다.

제가 현재 Face Detection과 관련된 Task를 진행하고 있어 public dataset을 자주 찾아보고 있으며, public dataset으로 모델을 pretrain 시키기도 합니다.

 

우선 해당 사이트로 가서 Dataset을 다운로드하면

VGG Face

이렇게 파일들이 되어있습니다. 하지만 막상 files 폴더에 들어가면 해당 데이터는 없습니다. 대신 데이터를 가져올 수 있는 URL 파일을 제공합니다. 이제 URL을 통해 VGG Face Dataset을 가져오겠습니다.

VGG Face Dataset 가져오기

우선 URL을 통해 데이터를 가져와야하기 때문에 Socket을 사용하고, urlib.request를 사용해야합니다.

위 해당 코드를 사용하시면 URL을 통해 데이터를 가져오고 해당 JPG 파일과 Annotation이 적혀있는 txt파일을 만들어 줍니다.

 

마찬가지로 bounding box 정보가 필요하기 때문에 해당 image에서 Face bbox에 대한 cx, cy, w, h의 정보를 가져왔습니다. 

 

VGG Face Dataset 구축

코드를 돌리게 된다면 위에 보이는 화면처럼 생성되는 것을 확인할 수 있습니다.

 

앞에서 제시한 WIDER Face 및 VGG Face Data를 이용하여 저는 pretrain 모델을 제작하고, 해당 학습된 모델에 대해 Task에 적합한 데이터셋을 사용하여 모델을 재학습 시켰습니다. 그 결과 초기 Loss 값도 낮게 시작하며 scale에 좀더 강인한 모델을 얻을 수 있었습니다.

반응형

'Computer Vision > Public Data' 카테고리의 다른 글

Public Dataset (COCO)  (0) 2021.06.14
Public Dataset (Wider Face)  (0) 2021.05.03
Comments