IT·과학 산업 경제
정치 사회 문화·생활
전국 글로벌 연예·스포츠
오피니언 포토·영상 기획&시리즈
스페셜&이벤트 포럼 리포트 아이뉴스TV

[인터뷰] SKT "고품질 데이터 확보에 총력...국가대표 AI '톱2' 진입 목표"

본문 글자 크기 설정
글자크기 설정 시 다른 기사의 본문도 동일하게 적용됩니다.

SKT, 국가대표 AI 정예 5팀 진입⋯정부, 2027년 상반기 최종 2팀 선정
지속적 기술 내재화 노력 덕분⋯LLM 이야기 나오기 전부터 기술 보유
초기 목표 매개변수 500B급⋯"고품질 데이터를 잘 담아내는 데 노력할 것"

[아이뉴스24 안세준 기자] "5개 정예팀에 들어갔다고 해서 만족하는 건 아니에요. 저희 컨소시엄에 들어와 계시는 여러 기업들, 서울대학교 및 카이스트(KAIST) 교수님들과 함께 최선의 노력을 다해서 톱(TOP) 2에 들어서도록 하겠습니다."

조동연 SK텔레콤 이노베이티브모델 담당(부사장)은 지난 7일 취재진과 만나 독자 AI 파운데이션 모델 프로젝트에 대한 향후 목표를 묻는 질의에 이같이 답했다. 짧은 개발 일정과 그래픽처리장치(GPU) 제약에도 불구하고, 그동안 쌓은 기술 노하우와 차세대 구조 연구, 데이터 정제·학습 효율화 등을 통해 상위 2개 팀에 이름을 올리겠다는 목표다.

지난 7일 조동연 SK텔레콤 이노베이티브모델 담당(부사장)이 취재진과 만나 SK텔레콤 독자 AI 파운데이션 모델 프로젝트와 관련해 인터뷰를 진행하고 있다. [사진=안세준 기자]
지난 7일 조동연 SK텔레콤 이노베이티브모델 담당(부사장)이 취재진과 만나 SK텔레콤 독자 AI 파운데이션 모델 프로젝트와 관련해 인터뷰를 진행하고 있다. [사진=안세준 기자]

"기술 내재화, 한 번도 놓지 않았다"

앞서 과학기술정보통신부는 독자 AI 파운데이션 모델 프로젝트 수행 주체로 SK텔레콤, 네이버클라우드, 업스테이지, NC AI, LG연구원 컨소시엄을 선정했다. 정부는 6개월 단위 평가를 거쳐 2027년 상반기까지 최종 2개 팀을 확정한다. 전 국민이 사용할 수 있는 '모두의 AI'를 제공하겠다는 취지다.

이날 조 부사장은 SK텔레콤의 정예 5개 팀 진출 배경으로 '꾸준한 기술 내재화'를 꼽았다. 그는 "우리는 A.X(에이닷엑스)를 계속해왔다. LLM이라는 말이 나오기 전부터 이미 기술을 갖고 있었다"며 "글로벌 협업도 했었지만, 내재화하는 기술들은 한 번도 놓지 않았다. 그것이 어떻게 보면 시드(seed, 씨앗)가 됐다고 생각한다"고 말했다.

그러면서 "모델을 만들고 학습하고 NPU 위에서 돌리는 것까지 기술이 많이 쌓여 있다. 이것은 LLM을 하겠다며 뛰어든다고 1~2년 내 되는 부분이 아니다"며 "특히 큰 규모의 파운데이션을 모델을 만드는 것은 금방 되는 일이 아니다. 기술은 많이 쌓여야 한다. 이런 강점이 있었다고 생각한다"고 덧붙였다.

SK텔레콤이 개발하는 독자 파운데이션 모델은 기존 A.X와는 다른 노선이다. 조 부사장은 "A.X를 만들어 온 경험은 살리겠지만, 그 모델하고는 다른 새로운 모델을 만들 생각"이라며 "A.X 4점대 모델을 죽이는 건 아니고, 내부적으로는 계속 운영하는 상황"이라고 밝혔다.

초기 목표 매개변수 500B급⋯"제한된 시간·사이즈에 데이터 얼마나 잘 담을지 중요"

SK텔레콤 모델의 초기 목표 매개변수(파라미터)는 500B급인 것으로 알려졌다. 조 부사장은 "숫자가 커져서 수치적으로 어려운 숫자 아니냐는 우려가 있지만, 모델 측면에서 보면 MoE(Mixture of Experts, 전문가 혼합) 구조다. 실제로 액티브는 굉장히 작은 수이기 때문에 타이트한 기간이기는 하지만 할 수 있는 목표라고 생각한다"고 언급했다.

조 부사장은 양질의 데이터를 얼마나 효과적으로 담을지가 관건이라고 했다. 그는 "결국은 모델에 무엇을 담을 것이냐는 문제다. 고품질의 데이터를 얼마나 제한된 시간, 제한된 사이즈에 잘 담을 것인지가 중요하다"며 "조금 더 집중적으로 좋은 데이터를 담는 데 노력할 것"이라고 했다.

소버린 AI 추진 이유에 대해서는 기술과 비용 두 가지 측면을 동시에 지목했다. 조 부사장은 "(다른 기업 등과) 협력하면서 기술도 어느 정도 받아들일 수는 있지만, 스스로 해보는 것과 그냥 가져다 쓰는 것은 많은 차이가 있다. 그래서 기술적인 측면에서의 소버린의 강점이 있을 수 있다"고 했다.

이어 "또 하나의 문제는 현실적인 문제다. 작은 스케일일 때는 큰 차이가 없지만 큰 스케일로 갈 경우 비용 차이가 엄청나다. 쉬운 예로 에이닷 전화 통화 요약을 초창기에는 외국 API를 썼는데, 수요가 늘어나면 비용 감당이 안 된다. 그래서 에이닷 전화 통화 요약도 전부 A.X 자체 모델로 대체해 쓰고 있다"고 설명했다.

지난 7일 조동연 SK텔레콤 이노베이티브모델 담당(부사장)이 취재진과 만나 SK텔레콤 독자 AI 파운데이션 모델 프로젝트와 관련해 인터뷰를 진행하고 있다. [사진=안세준 기자]
지난 7일 조동연 SK텔레콤 이노베이티브모델 담당(부사장)이 취재진과 만나 SK텔레콤 독자 AI 파운데이션 모델 프로젝트와 관련해 인터뷰를 진행하고 있다. [사진=안세준 기자]

"인력·기술력 갖춘 컨소 파트너사⋯향후 글로벌 진출도 고려"

GPU 자원이 얼마나 쓰일 것으로 예상되는지에 대해서는 "우리와 네이버는 못 받지만 이외 3개 컨소시엄의 경우 정부로부터 GPU를 지원받는다. (3개 컨소시엄이 GPU 지원) 받는 만큼, 아니면 그 이상으로 최소한 들어가야 되지 않을까라는 생각을 하고 있다"고 했다. 과기정통부는 올해 B200 512장 또는 H100 1024장 수준을 지원할 계획이다.

조 부사장은 컨소시엄 파트너사에 대해 높게 평가했다. 그는 "크래프톤은 게임사로 알고 계실 수 있다. 하지만 크래프톤의 AI 연구 인력은 상당하다. AI로 보면 국내에서 손꼽힌다"며 "기술을 발전시키는 측면에서 함께 하게 된 것도 있다"고 했다. 그는 또 "포티투닷도 크래프톤도 글로벌 진출 측면에서 마찬가지다. 국내뿐만 아니라 글로벌로 나가는 것도 생각하고 있다"고 했다.

한국형 LLM의 필요성에 대해서는 "한국어 특화 LLM, 한국적인 소리나 배경, 그림, 비디오를 더 잘 이해하는 LLM은 분명히 필요한 상황"이라며 "제조나 산업 현장에서 외국 LLM이 잘 동작하지 않는 경우가 있다. 현장에서 쓰이는 용어는 한국화된 기술 용어가 많아 이를 이해하는 모델이 필요하다"고 주장했다.

조 부사장은 "다행히 5개 컨소시엄에 들어섰지만, 1차년도에서도 좋은 결과를 내도록 하겠다"며 "서울대와 카이스트 교수진, 여러 컨소시엄 기업들과 함께 목표 달성을 위해 최선을 다하겠다"고 다짐했다.

◇조동연 SK텔레콤 이노베이티브모델 담당(부사장)은? 조 부사장은 서울대학교 컴퓨터공학 석박사 학위를 취득한 공학 전문가다. 2007년부터 2009년까지 미국 국립표준기술연구소(NIST) 객원 연구원으로, 2009년부터 2016년까지 미국 국립생물정보센터(NCBI) 연구원으로 각각 근무했다. 2018년 SK텔레콤으로 합류했다.

/안세준 기자(nocount-jun@inews24.com)



주요뉴스


공유하기

주소가 복사되었습니다.
원하는 곳에 붙여넣기 해주세요.
alert

댓글 쓰기 제목 [인터뷰] SKT "고품질 데이터 확보에 총력...국가대표 AI '톱2' 진입 목표"

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
댓글 바로가기


뉴스톡톡 인기 댓글을 확인해보세요.



TIMELINE



포토 F/O/C/U/S