Underdog을 위한 AI 기술 1편: wesee
Underdog을 위한 인공지능의 발전 첫번째 이야기, 소외된 90%를 위한 기술 WeSee의 교차로 정보 데이터셋입니다.
May 25, 2022
10분 안에 이런 걸 얻을 수 있어요.
- 셀렉트스타만의 데이터셋 구축 솔루션
- 사회적 약자를 위한 데이터셋이 실질적으로 필요한 분야
- 오픈데이터셋 다운로드
** 오픈데이터셋은 AI 업계의 건강한 발전을 위해 셀렉트스타에서 자체 진행하는 무료 데이터셋 지원 사업입니다.
AI기술은 사회적 약자를 위해 어떻게 발전하고 있을까?

Underdog을 위한 인공지능의 발전 첫번째 이야기, 소외된 90%를 위한 기술 WeSee의 교차로 정보 데이터셋입니다.
데이터셋 스펙
데이터셋 구축 목적
저시력자와 같은 교통약자에게 보행신호 및 횡단보도에 대한 정보 전달을 통해 안전 횡단 서비스 제공
수량
총량: 73,616건 (이미지 36,808건, JSON 36,808건)
bbox_1 : 22,879건 x 1 = 22,879 box
bbox_2 : 13,325건 x 2 = 26,650 box
bbox_3 : 369건 x 3 = 1,107 box
bbox_4 : 190건 x 4 = 760 box
bbox_5 : 29건 x 5 = 145 box
bbox_6 : 16건 x 6 = 96 box
최종데이터 생산 진행률: 51,636 box / 30,000 box (172.12%)
데이터 형식
PNG/JPG, JSON
모든 데이터는 셀렉트스타의 크라우드소싱 플랫폼 캐시미션을 통해 수집 가공되었습니다.
어떤 약자를 위한 인공지능 데이터셋일까?
셀렉트스타는 WeSee와 함께 저시력자 및 시각장애인 등 교통약자를 위한 ‘교차로 정보 데이터셋’을 구축했습니다.
알고 계셨나요?
저시력자나 시각장애인(이동 시 휠체어나 보조기구가 필요한 이)들이 이동 시 많은 어려움을 겪고 있음에도 불구하고 국내외, 장애인의 주요 이동 통로인 ‘인도’에 대한 대규모 데이터가 구축된 사례를 찾아볼 수 없었습니다.
인공지능의 도움으로 보행을 보다 안전하고 원활하게 하여 시각장애인 이동권을 신장하고, 나아가 일반적인 이동과 관련된 기술개발 확장에 적용될 수 있는 데이터셋을 만들었습니다. 평소 우리가 불편함 없이 다니는 길도, 저시력자나 시각장애인에게는 큰 벽이 되는 경우가 많습니다. 음성안내가 없는 교차로, 신호등이 없는 횡단보도, 장애인 보도블럭이 없는 인도 등 미쳐 우리가 생각치 못한 곳에서 많은 시각장애인들이 불편함을 겪으며 생활하고 있습니다.
‘기술의 발전으로부터 소외된 분들을 위한 따뜻한 기술을 선물하고 싶다’는 WeSee 창업자 분들의 일념으로 구축된 ‘교차로 정보 데이터셋’입니다.

‘캐시미션(앱)’에서 크라우드소싱과 유사 데이터 필터링 기술로 전국 각지의 다양한 인도 보행영상 40만장 구축
데이터셋은 어떻게 구축했을까?
신호등과 횡단보도 박스 그리기 미션

‘캐시미션(앱)’에서 수집한 ‘G_Signal’과 ‘R_Signal’ 사진에 크라우드 소싱을 통해 박스를 그려서 수집, 가공

‘캐시미션(앱)’에서 수집된 횡단보도 사진에 크라우드 소싱을 통해 박스를 그려서 수집, 가공
셀렉트스타와 한국정보화진흥원(NIA)이 함께 인도(人道) 보행 영상 데이터셋 40만 장을 구축한 내용을 활용하여, 보행자 신호, 횡단보도, 인도 등 총 73,616건의 이미지 수집 및 레이블링 진행하여 데이터셋을 구축했습니다.
양질의 데이터를 확보할 수 있었던 좋은 기회

WeSee 공동 창업자 오선택
인공지능의 품질은 데이터셋의 양과 질에 의해 좌우되는 폭이 큰데, 많은 양질의 데이터셋을 이번 프로젝트를 통해 확보할 수 있게 되어 기쁩니다. 무엇보다 시각장애인들의 삶에 작은 진보를 이뤄낼 가능성이 더 커졌다는 점이 과한 업무에 지친 팀원들에게 하나의 보상이 된 듯 싶습니다. 많은 도움을 준 셀렉트스타에게 감사의 인사를 전합니다.
이 데이터셋은 실제로 어떻게 사용될까?
WeSee는 시각장애인들 위한 AI 모델에 활용되기를 꿈꾸고 있다고 합니다. 웨어러블 디바이스 또는 스마트폰 앱의 음성 서비스와 같은 직관적인 방식으로 실시간 도로상황과 신호등 및 횡당보도 정보를 시각장애인들이 쉽고 빠르게 인지할 수 있도록 돕는 서비스에 적용될 수 있습니다.

인공지능 컨텐츠를 다루는 유튜버 ‘빵형의 개발도상국’님께서 실제로 오픈데이터셋에 공개된 WeSee의 교차로 정보 데이터셋을 활용한 AI를 선보인 멋진 사례도 찾아볼 수 있었습니다!

기술의 발전이 모두에게 평등할 수는 없습니다. 하지만 이와 같은 underdog을 위한 AI 기술의 발전이 소외된 이들에게 희망을 줄 수 있기를 바랍니다.
WeSee 대표 인터뷰

Open Datasets for Data-Centric AI
위 데이터셋은 셀렉트스타 ‘OPEN DATASETS’를 통해 무료로 다운받으실 수 있습니다.

AI 산업의 발전을 위해 셀렉트스타가 무료로 데이터셋을 제공합니다.
Share article