일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 미디언 필터링
- Pytorch Lecture
- c언어
- 영상처리
- tensorflow 예제
- object detection
- MFC 프로그래밍
- 딥러닝 공부
- C언어 공부
- 컴퓨터 비전
- 파이토치 강의 정리
- matlab 영상처리
- 김성훈 교수님 PyTorch
- c언어 정리
- c++
- 모두의 딥러닝
- pytorch zero to all
- pytorch
- 파이토치 김성훈 교수님 강의 정리
- 가우시안 필터링
- 딥러닝
- 모두의 딥러닝 예제
- 딥러닝 스터디
- c++공부
- TensorFlow
- 해리스 코너 검출
- 파이토치
- 골빈해커
- 케라스 정리
- 팀프로젝트
- Today
- Total
ComputerVision Jack
Public Dataset (COCO) 본문
오늘 소개할 Dataset은 Detection 및 Classification에 범용적으로 사용 가능한 COCO Dataset입니다.
해당 Data는 아래의 사이트에 접근하시면 받을 수 있습니다.
COCO Dataset을 다운받으면 JPG 압축 파일과 Annotation으로 이루어진 json 파일이 존재합니다.
하지만 해당 json파일을 열면 annotation이 한줄로 길게 표기되어 있기 때문에 파일이 열리지 않고 오류를 발생시킵니다. 따라서 해당 annotation을 정리하고 txt파일로 변환하는 public code를 소개합니다.
우선 작업을 진행하기 위해선 jq-linux64 를 사용해야합니다.
$sudo apt install jq
$jq . instance_train2017.json > instance train2017_jq.json
jq-linux64를 이용하여 json 파일을 변경하시면 한줄이었던 annotation이 정리되어 보기 편하게 json 파일이 열립니다.
하지만 Detection을 진행할 경우, 다른 annotation 값은 필요가 없고 해당 클래스 정보와 bounding box의 영역 정보만 필요합니다.
따라서 그와 관련된 정보를 txt 파일로 추출하며, Dataset format을 지정해주는 public code를 소개합니다.
https://github.com/ssaru/convert2Yolo
이분의 github를 이용하시면 쉽게 데이터 annotation에 대한 data format과 txt파일로 가공할 수 있습니다.
ReadMe를 참고하여 code를 진행하시면
다음과 같이 해당 jpg 파일에 대한 annotation txt 파일을 얻을 수 있습니다.
'Computer Vision > Public Data' 카테고리의 다른 글
Public Dataset (VGG Face) (1) | 2021.05.06 |
---|---|
Public Dataset (Wider Face) (0) | 2021.05.03 |