[아이뉴스24 윤소진 기자] AI 테크 기업 크라우드웍스는 과학기술정보통신부가 추진하는 ‘독자 AI 파운데이션 모델 프로젝트’에 선정된 5개 개발팀이 활용할 공동 데이터 공급기업에 참여한다고 5일 밝혔다.
![크라우드웍스 CI. [사진=크라우드웍스]](https://image.inews24.com/v1/283c2bab49cdd9.jpg)
'국가대표 AI' 개발 사업에 선정된 5개 개발팀(네이버클라우드, LG AI연구원, NC AI, SK텔레콤, 업스테이지)은 정부로부터 데이터, 인재, 고성능 GPU 등 전방위적 지원을 받게 된다.
이 중 데이터 분야에서는 5개 팀에 데이터 공동구매(100억원), 팀별 데이터셋 구축(28억원), 고품질 방송영상 데이터(200억원) 등의 지원이 예정돼 있다.
이와 관련해 크라우드웍스는 5개 개발팀이 AI 개발에 활용할 공동 데이터 제공에 나선다. 저작권 문제를 합법적으로 해결한 ‘STEM 데이터셋’과 국내 최다 규모의 도서 데이터셋, 국내외 뉴스 데이터, 국어학 데이터 등이 포함된다.
STEM 데이터셋은 과학(Science), 기술(Technology), 공학(Engineering), 수학(Mathematics) 등 고차원적 전문 지식이 담긴 데이터셋으로, 이는 AI의 추론·분석·문해 역량 향상에 기여한다.
모든 데이터는 크라우드웍스가 직접 구축하거나 자체 검수 시스템을 통해 전문성과 품질을 검증해 데이터 정확도와 신뢰도를 높였다. 개발팀의 개발 방향에 따라 맞춤형 데이터셋 공급도 가능하다.
김우승 크라우드웍스 대표는 “AI 모델의 성능은 결국 데이터를 기반으로 결정된다”며 “국내외에서 인정받은 데이터 품질과 전문성을 바탕으로 개발팀의 성공적인 AI 모델 개발에 기여할 수 있기를 기대한다”고 말했다.
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기