책소개

AI, 빅데이터 활용이 쉬워지는
142가지 데이터셋
#세계가 #주목하는 #데이터셋 #집대성
CHAPTER 0

데이터셋 사용 안내

Section 1 이 책을 활용하는 방법
Section 2 데이터셋의 사용과 저작권법





CHAPTER 1

데이터 포털 (Data Portal)

001 텐서플로 데이터셋 link
002 AI Hub link
003 공공데이터포털 link
004 야후(Yahoo!) 데이터셋 link

데이터 백업 스토리지 서비스 종료 안내

데이터 백업 스토리지 서비스는 서버 비용 문제로 더이상 제공되지 않습니다.





CHAPTER 2
이미지 분류 (Image Classification)

005 FGVC - 항공기 사진 link 006 MNIST - 숫자 손 글씨 link 007 Fashion MNIST - 패션의류link 008 Omniglot - 알파벳 손 글씨 link 009 Quick, Draw! - 손그림 link 010 CIFAR-10 - 실물 오브젝트 link 011 CIFAR-100 - 실물 오브젝트 link 012 CUB-200 - 조류 사진 link 013 SVHN - 현실 숫자 link 014 Conflict Stimuli - CNN 일반화 link 015 iNaturalist - 자연 사진 link 016 So2Sat - 인공위성 사진 link 017 SI-SCORE - CNN 일반화 link 018 CO3D - 객체 다각도 촬영 link





CHAPTER 3
탐지 및 표지 (Detection and Segmentation)

019 COCO - 대규모 종합 영상 데이터 link
020 Open Image V6 - 대규모 종합 영상 데이터 link
021 Scluptures 6K - 조각상 찾기 link 022 Oxford-IIIT PET - 동물 사진 link 023 Penguin - 펭귄 찾기 link 024 DAVIS - 비디오 세그멘테이션 link





CHAPTER 4
의미론적 연관성 (Semantic Correspondence)

025 Animal Parts - 동물 신체부위 link 026 PF-PASCAL - Semantic Flow link 027 SPair-71k - Semantic Correspondence link 028 TTS - Semantic Correspondence link





CHAPTER 5
안면인식 (Human Face Recognition)

029 FairFace - 다인종 얼굴 link 030 CelebA - 유명인 얼굴 link 031 CelebA Mask-HQ - 얼굴 조작 link 032 AFLW - 얼굴 3차원 정보 link 033 LS3D-W - 얼굴 3차원 정보 link 034 VGG-Face2 - 얼굴 인식 link 035 Celebrity Together - 얼굴 인식 link backup
036 Celebrity in Place - 인물과 장소 동시 인식 link backup





CHAPTER 6
자세 인식 (Human Pose Estimation)

037 Hand Dataset - 사람 손 link 038 Buffy Pose - 특정 포즈 인식 link 039 Buffy Stickman - 자세 인식 link 040 VGG HPE - 자세 인식 link 041 Sign Language Pose - 수화 인식 link 042 LSP - 스포츠 포즈 link 043 MPI-INF-3DHP - 자세 추론 link 044 Human 3.6M - 대규모 인체 데이터 link 045 3DPW - 3D 자세 추론 link





CHAPTER 7
자율주행 (Automonous Driving)

046 BDD100K - 대규모 자율주행 데이터 link
047 KITTI - 대규모 자율주행 데이터 link
048 Cityscape - 길거리 세그멘테이션 link
049 Cityscape 3D - 탈것 인식 link 050 CULane - 도로만 인식 link





CHAPTER 8
비디오 (Video)

051 Vox Converse - 발화자 찾기 link 052 VGG-Sound - Audio-Visual link 053 MoCA - 은신 중인 동물 찾기 link 054 Condensed Movie - 영화 클립 link 055 Sherlock TV Series - 안면 인식 link 056 LAEO - Human Interaction link 057 TV Human Interaction - Human Interaction link 058 SCV - 스타크래프트 2 플레이 영상 link 059 Fake AVCeleb - 딥페이크 감지 link





CHAPTER 9
농업 영상 (Agricultural Images)

060 Citrus - 시트러스 link 061 Deep Weeds - 잡초 link 062 Plant Leaves - 잎사귀 link 063 Plant Village - 잎사귀 link 064 PlanteK - 잎사귀 link 065 iBean - 콩잎 link





CHAPTER 10
의료 영상 (Medical Images)

066 MimickNet - 영상 재건 link 067 CBIS-DDSM - 유방암 조영 link 068 CCH - 현미경 사진 link 069 BCCD - 혈구 link 070 Malaria - 말라리아 감염 혈액 link 071 MSD - Segmentation link 072 VFP290K - 실신 환자 찾기 link





CHAPTER 11
그 외 영상 데이터 (Other Visual Data)

073 SyntText - OCR link 074 MJSynth - OCR link 075 Oxford Buildings - 객체 인식 link 076 S3O4D - 다각도 랜더링 link 077 3D Shapes - 다각도 렌더링 link 078 NYU Depth - 깊이 추론 link 079 DMLab - 깊이 추론 link

CHAPTER 12
영어 자연어 처리 (English NLP)

080 WikiBio - 위키피디아 문서 link 081 GPT2 Output - 대규모 텍스트 link 082 Summ Screen - 대화 요약 link 083 Long Summarization - 논문 요약 link 084 PubMed Crawl - 논문 정보 수집 link backup
085 DART - 시멘틱 트리플렛 link 086 Twitch Chat - 트위치 채팅 link





CHAPTER 13
한국어 자연어 처리 (Korean NLP)

087 ParaKQC - 질문과 명령 link 088 Chatbot_data - 챗봇 link 089 ClovaCall - 음성 대화 link 090 KorQuAD 2.0 - 질의응답 link 091 Song-NER - 개체명 인식 link 092 KMOUNLP-NER - 개체명 인식 link 093 Sci-News-Sum-Kr-50 -뉴스 요약 link 094 Petitions - 청와대 국민청원 link 095 KLUE - 한국어 이해 link 096 KorNLU - 문장 분류 및 유사성 link 097 NSMC - 네이버 영화 리뷰 link 098 Toxic Comment - NSMC 감정 상세화 link 099 3i4K - 발화 의도 분석 link 100 Korean Hate Speech - 혐오발언 link 101 KAIST Corpus - 코퍼스 데이터셋 모음 link





CHAPTER 14
질의응답 (Question Answering)

102 ARC - 지능검사 문제 link 103 ARM - 행렬추론 link 104 AI2 ARC - 과학 시험문제 link 105 NQ-Open - 영어 질의응답 link 106 SQuAD - 독해 기반 질의응답 link 107 CoQA - 대화 기반 질의응답 link





CHAPTER 15
기계번역 (Machine Translation)

108 XQuAD - 다국어 질의응답 link 109 MLQA - 다국어 질의응답 link 110 TyDi - 다국어 질의응답 link 111 FloRes-101 - 101가지 언어 번역 link 112 Ted Talks - 테드 강연 link 113 KPC - 한국어, 영어, 불어 매핑 link

CHAPTER 16
음성 발화 (Speech and Voices)

114 Spoken Digit - 음성 MNIST link 115 Libri Speech - 대규모 음성 코퍼스 link 116 LibriTTS - 음성 코퍼스 link 117 LJSpeech - 오디오북 link 118 Common Voice Corpus - 대규모 음성 코퍼스 link
119 CREMA-D - 감정 인식 link 120 VoxCeleb2 - 대규모 발화 데이터 link 121 LRW - 입술 읽기 (단어) link 122 LRS3-TED - 입술 읽기(문장) link





CHAPTER 17
음악 및 소리 (Music and Sound)

123 FUSS - 소리 분해 link 124 CMM - 클래식 음악 link 125 GMD - 전자 드럼 link 126 E-GMD -전자 드럼 link 127 NSynth - 대규모 악보 link 128 Bach-Doodle -화음 link 129 MAESTRO - 피아노 연주 link

CHAPTER 18
강화학습 (Reinforcement Learning Environments)

130 Green House - 온실 시뮬레이션 link 131 OpenAI GYM - 대규모 강화학습 환경들 link 132 D4RL - 대규모 강화학습 환경들 link

CHAPTER 19
생명과학 (Biology)

133 GDC - 암 유전자 포털 link
134 CTPR - 항암 약물치료 반응 link
135 KEGG - 유전자 & 물질대사 link
136 OOD - 박테리아 유전자 link 137 COVID-19 Open-Data - 코로나19 link





CHAPTER 20
화학 (Chemistry)

138 iEnvCmplx - 화학 복잡계 link 139 iPlantNutrient - 식물-화학 복잡계 상호작용 link 140 OGB-LSC - 그래프 추론 link 141 ProteinNet - 단백질 분자구조 link 142 GDB - 유기물 분자구조 link