구글 클라우드 "AI 추론 시대 도래"… TPU 아이언우드로 국내 혁신 가속화

서울 리전 5주년 맞아 AI 처리 국내 보관 서비스 출시

2025-07-08 손지하 기자

구글 클라우드 로고. 사진=구글 클라우드

[포인트데일리 손지하 기자] 구글 클라우드가 서울 리전 설립 5주년을 맞아 국내 기업의 AI 워크로드 처리와 데이터 저장을 모두 국내에서 수행할 수 있는 새로운 데이터 레지던시 서비스를 출시했다고 8일 발표했다.

구글 클라우드는 이날 서울 강남구 코엑스 컨벤션센터에서 열린 '구글 클라우드 데이 서울'에서 AI 추론에 특화된 7세대 텐서처리장치(TPU) 아이언우드를 공개하며 국내 AI 혁신 가속화 방안을 제시했다.

지기성 구글 클라우드 코리아 사장은 "AI가 불러온 혁신의 물결은 더욱 빨라지고 있다"며 "구글 클라우드는 기업에 모델, 하드웨어와 함께 개방적이며 상호운용성을 갖춘 소프트웨어 도구 및 플랫폼을 제공해 멀티 에이전트 시스템을 구축할 수 있도록 지원한다"고 말했다.

◇데이터 레지던시 서비스 확장=구글 클라우드가 이번에 발표한 새로운 데이터 레지던시 서비스는 기존의 데이터 저장 위치 제어에 더해 머신러닝 처리 작업까지 국내에서 수행할 수 있는 옵션을 제공한다. 특히 머신러닝 처리 위치에 대한 규제준수 요건을 가진 기업이 구글의 최신 거대언어모델(LLM)인 제미나이 2.5 플래시를 국내에서 활용할 수 있도록 지원한다.

이 서비스는 저장 상태인 데이터가 고객이 지정한 특정 지리적 위치에만 저장되도록 보장하며 머신러닝 처리 작업이 데이터가 저장된 곳과 동일한 특정 리전 또는 멀티 리전 내에서만 이뤄지도록 보장한다.

◇7세대 TPU 아이언우드 공개=구글 클라우드는 대규모 AI 추론을 위해 특별히 설계된 최초의 TPU 가속기인 아이언우드를 공개했다. 아이언우드는 구글 TPU 중 가장 강력하고 뛰어난 성능을 제공하는 에너지 효율적인 모델로 조만간 정식 버전으로 출시될 예정이다.

지기성 사장은 "아이언우드의 등장은 AI 발전과 이를 뒷받침하는 인프라에 있어 중요한 변화를 의미한다"며 "사람이 해석해야 할 정보를 실시간으로 제공하는 반응형 AI 모델에서 해석과 인사이트를 선제적으로 생성하는 모델로 전환되는 '추론의 시대'가 온 것"이라고 설명했다.

◇국내 AI 스타트업과 협업 확대=이번 행사에는 국내 AI 스타트업 뤼튼테크놀로지스가 참여해 최근 출시한 '뤼튼 3.0' 서비스를 소개했다. 유영준 뤼튼테크놀로지스 최고운영책임자(COO)는 "새로운 서비스에 쓰일 거대언어모델은 좋은 성능과 합리적인 가격, 높은 안정성 등 여러 기준을 만족해야 했다"며 "제미나이 2.5 모델군은 뤼튼 자체 테스트 결과 그 기준을 충족했고 현재 다양한 여러 LLM들과 함께 서비스 내 적재적소에서 활용되고 있다"고 말했다.

놀유니버스, LG유플러스, NC AI, 카카오모빌리티, 매스프레소 등도 'AI 체험 공간 제미나이 플레이그라운드'에서 부스를 통해 현장 관람객들과 소통하며 다양한 산업에 도입된 생성형 AI 협업 사례를 소개했다.

◇서울 리전 5년간 성장=구글 클라우드는 2020년 서울 리전을 설립한 이후 지난 5년간 국내 고객 수요를 충족하기 위해 컴퓨팅 역량을 지속적으로 확장해왔다. 서울 리전은 국내에 위치한 상호 연결된 대용량 인프라로 구성돼 있으며 전 세계적 규모의 구글 프라이빗 네트워크와 연결되어 고대역폭과 제로에 가까운 지연 시간을 제공한다.

구글의 프라이빗 네트워크는 200개 이상의 국가 및 지역에 걸쳐 200만 마일 이상의 광케이블로 구성돼 AI 기반 미래를 위한 탄력적인 글로벌 인프라를 제공한다고 회사 측은 설명했다.