본문 바로가기
AI

중국 AI 모델 딥시크, 미국 AI 모델 성능 능가

by Daniel_Lee 2025. 1. 28.
반응형

중국의 딥시크가 미국 주요 AI 모델을 성능 면에서 뛰어 넘어 주목 받고 있다.

 

중국 인공지능 연구소 딥시크(DeepSeek)가 저비용으로 개발한 AI 모델이 미국의 주요 AI 모델을 성능 면에서 뛰어넘으며 주목 받고 있다.

 

현지시간 지난 24일 딥시크는 무료 오픈소스 대형 언어 모델인 R1을 공개했다. 이 모델은 개발에 약 두 달과 600만 달러 미만의 비용으로 제작됐으며 엔비디아 H800 칩을 사용하여 제작됐다.

 

R1은 다양한 제3자 벤치마크 테스트에서 메타의 라마(LLaMA)3.1, 오픈AI GPT-4o, 앤스로픽(Anthropic)의 클로드(Claude) Sounnet3.5룰 능가하는 성과를 기록했다.

 

마이크로소프트의 CEO 사티아 나델라(Satya Nadella)는 스위스 다보스에서 열린 세계 경제 포럼에서 딥시크의 새로운 모델은 효율적인 컴퓨팅 측면에서 매우 인상적이다며 중국의 발전을 매우 진지하게 받아들어야 한다고 밝혔다.

 

딥시크는 증류 기술을 활용해 소형 모델의 학습 효율을 극대화했다. 벤치마크의 체탄 푸타군타(Chetan Puttagunta)는 이를 비용 효율적인 접근법이라 평가하며 대형 모델을 기반으로 소형 모델이 특정 작업에서 높은 성능을 발휘할 수 있도록 돕는 방식이라고 설명했다.

 

한편 딥시크는 약 80억 달러( 11 4848억 원) 자산을 관리하는 중국 헤지 펀드 하이-플라이-퀀트(High-Flyer-Quant)에서 설립됐다고 알려졌다. 

 

설립자인 량원펑(Liang WenFeng)에 대한 구체적인 정보는 많지 않지만 딥시크 외에도 바이트댄스(ByteDance) 0.1.ai 등 중국의 다른 연구소들도 AI 모델에 참가하고 있다.

반응형