[아이뉴스24 권서아 기자] 인텔은 IBM 클라우드가 자사의 가우디 3 인공지능(AI) 가속기 기반 상용서비스를 제공한다고 8일 밝혔다.
이는 가우디 3를 이용한 첫 대규모 상용 서비스로서, 클라우드 기반 AI 인프라 시장에서 고성능·고비용 GPU 독점 구도에 변화가 생길 지 주목된다.
![인텔과 IBM 클라우드 관련 이미지 [사진=인텔]](https://image.inews24.com/v1/32dafcfe798fcb.jpg)
가우디 3은 생성형 AI, 대규모 언어모델 추론, 파인튜닝, RAG(검색 증강 생성) 등 최신 워크로드에 최적화돼 있다. 개방형 개발 프레임워크를 지원하며, IBM 클라우드 내에서는 독일 프랑크푸르트, 미국 워싱턴 D.C. 및 댈러스 리전에서 우선 제공된다.
IBM VPC(가상 프라이빗 클라우드)에서 사용 가능하며, 왓슨엑스(watsonx), 레드햇 오픈시프트 등 주요 플랫폼과의 연동도 예정돼 있다.
AI 인프라 고도화가 가속화되는 가운데, 가우디 3의 가장 큰 강점은 '성능 대비 비용 효율'이다. 인텔이 의뢰한 시그널65의 최신 벤치마크에 따르면, 메타의 라마(Llama)-3.1-405B-FP8 모델 기준에서 경쟁 GPU 대비 92% 높은 비용 효율성을 기록했다.
IBM의 크래나이트(Granite)-3.1-8B-인스트럭트(Instruct) 모델 기준으로는 처리 속도(TPS)에서 43% 우위를, Llama 모델 기준 대용량 워크로드에서도 36% 높은 처리량을 보였다.
사우라브 쿨카니 인텔 AI 전략 담당은 "이번 협력은 기업들이 AI를 보다 합리적인 비용으로 실용화할 수 있도록 돕는 전환점으로, 가우디 3은 클라우드에서의 추론·미세조정 작업에 최적화된 플랫폼"이라고 말했다.
IBM 클라우드 인프라 총괄 사틴더 세티도 "가우디 3은 고객에게 더 많은 선택권과 자유, 그리고 낮은 진입 장벽을 제공한다"고 강조했다.
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기