[아이뉴스24 윤소진 기자] 한국지능정보사회진흥원(NIA)은 과학기술정보통신부(과기정통부)와 함께 ‘AI 데이터 품질관리 가이드라인 v3.5(이하 가이드라인)’를 발간했다고 26일 밝혔다.
![AI 데이터 품질관리 가이드라인 v3.5 이미지. [사진=NIA]](https://image.inews24.com/v1/4a1a8f0c622726.jpg)
NIA는 2021년 인공지능 학습용 데이터 품질관리 가이드라인 v1.0을 발간한 이후 매년 인공지능 기술 발전에 따라 고도화해왔다. 2024년 공개된 가이드라인 v3.1은 6만건 이상의 다운로드를 기록하는 등 공공 및 민간에서 기준서로 활용되고 있다.
가이드라인 v3.5는 2024년‘초거대AI 확산 생태계 조성사업’의 경험을 바탕으로 최신 인공지능 기술과 산업의 변화를 반영했다. 총 3권으로 구성돼 있으며 △1권은 인공지능 데이터 품질관리 프레임워크 △2권은 데이터 구축 방법론 및 오류 대응 전략 실무사례 △3권은 생성형 인공지능 데이터에 특화된 품질관리 방법을 각각 제시하고 있다.
이번 가이드라인은 거대언어모델(LLM) 뿐만 아니라 다중양식(멀티모달) 데이터, 합성데이터 등 생성형 인공지능을 위한 데이터 특성에 맞춘 신규 지표와 구축 방법론을 별도 제시함으로써 빠르게 변화하는 인공지능 기술 동향에 유연하게 대응할 수 있도록 확장성을 확보했다.
가이드라인은 AI허브(www.aihub.or.kr) 및 NIA 누리집을 통해 누구나 내려받아 활용할 수 있다. 권별로도 별도 제공해 현장 실무자가 업무 및 관리 범위에 따라 편리하게 참조할 수 있도록 구성했다.
데이터 구성의 ‘잘된 사례 vs 부족한 사례’ 비교 분석과 체크리스트 제공 등을 통해 현장 중심의 데이터 품질관리에 실질적인 도움을 줄 것으로 기대된다.
황종성 NIA 원장은 "인공지능 기술의 핵심은 데이터로 인공지능의 생명은 데이터 품질관리에 있다고 할 수 있다”며 "빠르게 발전하는 인공지능 기술에 대응하기 위하여 고품질 데이터 생태계 기반이 조성될 수 있도록 지속적으로 인공지능 데이터 품질 가이드라인 및 기준을 고도화하고 제시하겠다”고 밝혔다.
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기