IT·과학 산업 경제
정치 사회 문화·생활
전국 글로벌 연예·스포츠
오피니언 포토·영상 기획&시리즈
스페셜&이벤트 포럼 리포트 아이뉴스TV

스마일게이트 AI센터, 악플·혐오발언 데이터셋 공개…커뮤니티, 챗봇 등 활용

본문 글자 크기 설정
글자크기 설정 시 다른 기사의 본문도 동일하게 적용됩니다.

55만 여개 데이터 대상으로 1만 개 데이터 선별

 스마일게이트 AI 센터가 인공지능 윤리성 연구를 위한 혐오 발언 데이터를 구축해 공개한다. [사진=스마일게이트]
스마일게이트 AI 센터가 인공지능 윤리성 연구를 위한 혐오 발언 데이터를 구축해 공개한다. [사진=스마일게이트]

[아이뉴스24 박예진 기자] 스마일게이트 AI센터(센터장 한우진)이 악플 및 혐오 발언 데이터셋을 공개한다고 20일 발표했다.

스마일게이트 AI 센터는 최근 혐오 표현이 온라인 공간에서 광범위하게 증가하고 있고, 사회적 문제로 이어질 수 있다는 점을 고려해 혐오 표현을 선제적으로 감지하고 대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다. 이번 프로젝트는 지식 콘텐츠 스타트업 언더스코어와 협업을 통해 이뤄졌다.

악플 및 혐오 발언 데이터는 지난 2019년 1월 1일부터 2021년 7월 1일까지 기간 동안 포털 사이트, 커뮤니티 등 다양한 웹사이트의 게시글을 대상으로 수집했다. 수집 과정에서 혐오 관련 데이터의 시의성과 편향성을 띄고 있는 특성을 감안했으며, 약 55만 여 개의 데이터를 기반으로 1만 개의 데이터셋을 구축했다.

특히 데이터셋 구축 과정에서 '여성/가족' '성소수자' '남성' '인종/국적' '연령' '지역' '종교' '기타혐오' 등 8개의 대상으로 범주화했다. 혐오 발언 분류를 위한 기준 모델 공개를 통해 혐오 발언 추출이 가능하다는 설명이다.

스마일게이트 AI 센터의 악플 및 혐오 발언 데이터셋은 향후 다양한 영역에서 활용될 수 있을 것으로 기대된다. 게임 커뮤니티 내 댓글, 고객 응대 상담 챗봇, 여론 조사 등 여러 분야에서 대상을 둘러싼 혐오 발언 여부를 파악할 수 있다. 향후 지속적인 연구개발을 실시하면서 확보 된 기술력을 바탕으로 혐오 표현을 보다 높은 정확도로 정확하게 찾아낼 수 있는 기술을 고도화 할 계획이다.

한편 이번에 수집된 데이터는 스마일게이트 AI 센터 깃허브 페이지를 통해 1월 중 공개될 예정이다.

한우진 스마일게이트 AI 센터장은 "AI 센터는 자연어 처리 및 분류 관련 연구 목적 외에도 윤리성이 결여된 인공지능이 사회에 미치는 문제에 대해서 연구하고 있는 기관으로서 책임과 문제의식을 갖고 있다"면서 "특히 이번에 공개된 데이터가 좀 더 안전하게 인공지능을 활용하는 데 밑거름이 되기를 바란다"고 말했다.

이어 "향후 스마일게이트 AI 센터는 그동안 진행해온 연구 결과와 노력들이 기술적인 관점에서 뿐만 아니라 사회에 긍정적인 기여를 할 수 있도록 다양한 노력을 시도할 것"이라고 말했다.

/박예진 기자(true.art@inews24.com)


주요뉴스


공유하기

주소가 복사되었습니다.
원하는 곳에 붙여넣기 해주세요.
alert

댓글 쓰기 제목 스마일게이트 AI센터, 악플·혐오발언 데이터셋 공개…커뮤니티, 챗봇 등 활용

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
댓글 바로가기

BJ과즙세연 TIMELINE

BJ과즙세연과 함께 걸어가는 방시혁 회장 8일 유튜브 채널 'I am WalKing'이 공개한 영상에서 방시혁 하이브 의장이 지난 7월 미국 LA 베벌리힐스에서 유명 인터넷방송인 BJ과즙세연과 함께 걸어가는 모습이 포착됐다. 사진은 유튜브 영상 캡처.

  • 다음 뉴스에서 아이뉴스24 채널 구독 하고 스타벅스 커피 쿠폰 받으세요!

뉴스톡톡 인기 댓글을 확인해보세요.