중국 인공지능 연구소 딥시크(DeepSeek)가 저비용으로 개발한 AI 모델이 미국의 주요 AI 모델을 성능 면에서 뛰어넘으며 주목 받고 있다.
현지시간 지난 24일 딥시크는 무료 오픈소스 대형 언어 모델인 R1을 공개했다. 이 모델은 개발에 약 두 달과 600만 달러 미만의 비용으로 제작됐으며 엔비디아 H800 칩을 사용하여 제작됐다.
R1은 다양한 제3자 벤치마크 테스트에서 메타의 라마(LLaMA)3.1, 오픈AI의 GPT-4o, 앤스로픽(Anthropic)의 클로드(Claude) Sounnet3.5룰 능가하는 성과를 기록했다.
마이크로소프트의 CEO 사티아 나델라(Satya Nadella)는 스위스 다보스에서 열린 세계 경제 포럼에서 “딥시크의 새로운 모델은 효율적인 컴퓨팅 측면에서 매우 인상적이다”며 중국의 발전을 매우 진지하게 받아들어야 한다”고 밝혔다.
딥시크는 ‘증류’ 기술을 활용해 소형 모델의 학습 효율을 극대화했다. 벤치마크의 체탄 푸타군타(Chetan Puttagunta)는 이를 “비용 효율적인 접근법”이라 평가하며 대형 모델을 기반으로 소형 모델이 특정 작업에서 높은 성능을 발휘할 수 있도록 돕는 방식이라고 설명했다.
한편 딥시크는 약 80억 달러(약 11조 4848억 원) 자산을 관리하는 중국 헤지 펀드 하이-플라이-퀀트(High-Flyer-Quant)에서 설립됐다고 알려졌다.
설립자인 량원펑(Liang WenFeng)에 대한 구체적인 정보는 많지 않지만 딥시크 외에도 바이트댄스(ByteDance)와 0.1.ai 등 중국의 다른 연구소들도 AI 모델에 참가하고 있다.
'AI' 카테고리의 다른 글
AI, 대량 살상 화학 무기 제조법 제공 논란 (0) | 2025.02.24 |
---|---|
미국 딥시크 사용 금지 법안 추진 (0) | 2025.02.06 |
트렐리스(Trellis), 3D 모델링의 새로운 패러다임을 제시하다 (0) | 2024.12.09 |
새로운 AI 모델 ‘MultiFoley’ 연구 중 (1) | 2024.12.01 |
런웨이, AI 기반 영상 생성 모델 'Gen-3' 출시 (0) | 2024.11.14 |