저가 칩 설계 혁신 자극 분석도
챗GPT 20분의 1 비용으로 제작
저비용·고성능 칩 개발 희망 ↑
“딥시크(DeepSeek) 써봤어?”
인공지능(AI)이 일상에 녹아들고 있다. 직장인들 사이에서 ‘우리 회사 우수사원은 챗GPT’라는 우스갯소리도 나온다. 한동안 오픈AI의 챗GPT가 생성형 AI의 독보적인 존재로 여겨졌지만 딥시크가 신흥 강자로 떠올랐다. 중국 스타트업 딥시크가 창업 1년 8개월 만에 혁신적인 AI 모델을 공개하며 전 세계의 주목을 받고 있다.

딥시크라는 이름은 ‘심층 탐색’을 의미하는 중국어 ‘심도구색(深度求索)’을 영어로 표현한 것이다. 대중에게는 ‘챗GPT의 중국 버전’ 정도로 여겨진다. 딥시크나 챗GPT 모두 대량의 텍스트 데이터를 학습해 인간처럼 자연스럽게 언어를 이해하고 생성이 가능한 AI모델이란 점은 같다.
다만 AI 업계에서는 딥시크의 존재 자체가 파격이다. 초저비용으로 고성능 AI 모델을 개발한 첫 성공 사례여서다. 지난달 20일 출시된 딥시크의 최신 AI모델은 미국 애플 스토어에서 챗GPT를 제치고 최다 다운로드와 최고 평가를 받았다.
◆시골 출신 량원펑, 초저비용 AI 모델로 선봬
‘딥시크의 아버지’는 량원펑(梁文鋒)이다. 중국 남부 광저우에서 기차로 4시간 떨어진 농촌 마을 출신이다. 1인당 월소득이 20만원도 되지 않는 가난한 마을이었다. 이곳에서 나고 자란 량원평은 공학분야 명문대인 저장대학에서 컴퓨터공학을 전공하며 학사와 석사 학위를 받았다. 그는 2019년 대학 친구 두 명과 투자기업 ‘하이플라이어’를 창업해 100억 위안(약 20조원)의 자산을 축적했다. 알고리즘에 딥러닝 기법을 접목한 AI 트레이딩으로 자금을 빠르게 끌어모았다. 이는 현재 중국 시장에서 운영되는 최대 규모의 퀀트 펀드중 하나로 커졌다.
2023년 5월에는 AI 스타트업 딥시크를 창업하며 새로운 도전에 나섰다. 량원평은 당시 2년 전부터 취미로 구입한 엔비디아의 AI칩 A100 GPU 1만개를 활용해 거대언어모델(LLM)을 훈련하고, 대규모 클러스터를 구축했다. 이후 이 GPU들을 활용해 딥시크를 설립했다.
이를 위해 량원펑은 젊은 중국 인재들을 모았다. 최고의 대우를 제공하면서도 돈과 성과보다 꿈과 명예를 강조하는 전략을 펼쳤다. 량원펑은 오픈소스 방식으로 개발한 첫 AI모델 딥시크 코더를 같은해 11월 출시했다. 이후 딥시크 매스, 딥시크, VL, V2, 코더2, V3 등을 연이어 선보인다. 최근엔 추론을 위한 R1 모델까지 나왔다. 딥시크는 자사 V3 모델과 R1모델이 오픈AI의 최신 GPT-4o, 앤트로픽의 클로드 3.5, 메타의 라마 3.1 등과 비교해 성능이 뒤지지 않는다고 밝혔다.
◆AI모델 훈련 비용 빅테크의 10분의 1?
딥시크는 저성능 하드웨어를 훈련시켜 초가성비 개발을 이뤄낸 사례가 됐다. 공식 개발 비용은 557만 6000달러(약 81억원)로 알려졌다. 이는 미국의 빅테크들이 AI모델 훈련에 쓰는 통상 ‘1억 달러(1453억원)’의 10분의 1도 채 되지 않는다. 실제 메타의 라마 개발 비용의 10%, 오픈AI의 GPT-4 개발 비용의 5% 수준이다.
여기에는 미국 바이든 행정부의 대중 정책이 영향을 미쳤다. 바이든 정부는 2022~2023년 AI 모델 훈련용 칩의 중국 수출을 제한했다. 이에 따라 엔비디아는 성능이 제한된 H800 GPU를 중국에 공급했다. 량원펑은 초기엔 A100으로 인프라를 만들고, 이후 H800으로 본격적으로 AI 모델 훈련에 나간 것으로 알려졌다. H800 GPU 2048개를 훈련해 나온 게 V3 모델이다. 업계에서는 오히려 이런 제한이 중국 개발자들의 창의성을 자극했을 것이라는 분석도 나온다. 딥시크가 추론 모델 R1을 출시한 지난달 27일엔 고성능 AI칩 무용론이 제기되며 엔비디아의 주가가 하루만에 17% 폭락했다. 당시 엔비디아는 하루 만에 시가총액이 약 6000억 달러(약 872조원)나 증발했다.
◆후발주자들, 딥시크 방식 뒤따를까
딥시크는 자사 AI 모델을 오픈소스로 공개하기까지 했다. 앞으로는 신흥국이나 저개발국도 소수의 AI 엔지니어와 최소한의 조건만 갖추면 AI 모델을 구축할 수 있는 환경이 만들어졌다는 게 업계의 분석이다.
과거에는 AI 모델 개발에 천문학적인 비용과 높은 기술력이 필요했다. 미국, 일본, 한국, 유럽 같은 선진국이나 인도 같은 신흥 경제대국에서만 가능한 일이었다. 하지만 딥시크는 미국 빅테크 기업의 AI 모델 개발비의 10분의 1 수준으로도 우수한 AI 모델을 만들어냈다. 무엇보다 엔비디아의 고성능 AI 칩 없이도 가능했다는 점을 증명했다.
향후 AI 시장에서 중국의 영향력이 커질 것이라는 시선도 있다. 현실적으로 신흥국가가 AI 데이터센터를 구축할 때 개당 3만 달러에 달하는 엔비디아의 고성능 AI칩인 H100 GPU를 대량 구매하기란 어렵다. 이 때문에 AI 인프라를 구축하려는 국가나 기업들이 ‘딥시크의 길’을 따라갈 가능성도 커졌다. 결국 중국산 반도체, IT장비, 소프트웨어 등을 도입하는 결과로 이어질 수 있다는 분석이 나온다.
정희원 기자 happy1@segye.com
[ⓒ 세계비즈앤스포츠월드 & sportsworldi.com, 무단전재 및 재배포 금지]