관리 메뉴

ComputerVision Jack

Public Dataset (COCO) 본문

Computer Vision/Public Data

Public Dataset (COCO)

JackYoon 2021. 6. 14. 21:10
반응형

오늘 소개할 Dataset은 Detection 및 Classification에 범용적으로 사용 가능한 COCO Dataset입니다.

해당 Data는 아래의 사이트에 접근하시면 받을 수 있습니다.

https://cocodataset.org/#home

 

COCO - Common Objects in Context

 

cocodataset.org

COCO Dataset을 다운받으면 JPG 압축 파일과 Annotation으로 이루어진 json 파일이 존재합니다.

하지만 해당 json파일을 열면 annotation이 한줄로 길게 표기되어 있기 때문에 파일이 열리지 않고 오류를 발생시킵니다. 따라서 해당 annotation을 정리하고 txt파일로 변환하는 public code를 소개합니다.

 

우선 작업을 진행하기 위해선 jq-linux64 를 사용해야합니다.

$sudo apt install jq
$jq . instance_train2017.json > instance train2017_jq.json

jq-linux64를 이용하여 json 파일을 변경하시면 한줄이었던 annotation이 정리되어 보기 편하게 json 파일이 열립니다.

하지만 Detection을 진행할 경우, 다른 annotation 값은 필요가 없고 해당 클래스 정보와 bounding box의 영역 정보만 필요합니다. 

따라서 그와 관련된 정보를 txt 파일로 추출하며, Dataset format을 지정해주는 public code를 소개합니다.

https://github.com/ssaru/convert2Yolo

 

ssaru/convert2Yolo

This project purpose is convert voc annotation xml file to yolo-darknet training file format - ssaru/convert2Yolo

github.com

이분의 github를 이용하시면 쉽게 데이터 annotation에 대한 data format과 txt파일로 가공할 수 있습니다.

ReadMe를 참고하여 code를 진행하시면

Result

다음과 같이 해당 jpg 파일에 대한 annotation txt 파일을 얻을 수 있습니다.

반응형

'Computer Vision > Public Data' 카테고리의 다른 글

Public Dataset (VGG Face)  (1) 2021.05.06
Public Dataset (Wider Face)  (0) 2021.05.03
Comments