Mac Studio에서 초당 20개의 토큰을 달성한 DeepSeek-V3, OpenAI에 도전장을 내다

일일 및 주간 뉴스레터를 구독하여 최신 업데이트와 산업 선도 AI 발전에 대한 독점적인 통찰력을 받아보세요. 자세히 알아보기

Table of Contents

DeepSeek의 새로운 언어 모델이 AI 환경을 혁신하다

중국의 AI 스타트업 DeepSeek가 무게 641GB의 새로운 대형 언어 모델 DeepSeek-V3-0324를 공식 출시했습니다. 이 모델은 Hugging Face에서 사용할 수 있으며, 성능 뿐만 아니라 회사의 미니멀하면서도 효과적인 출시 전략과 일치하는 배포 방식 덕분에 AI 커뮤니티에서 큰 기대를 모으고 있습니다.

DeepSeek V3-0324의 주목할 만한 특징

이번 출시의 특별한 점은 모델의 MIT 라이선스로, 상업적 사용이 무료로 허용된다는 것입니다. 초기 연구 결과에 따르면, 이 모델은 Apple의 Mac Studio와 같은 소비자 등급 하드웨어에서 작동할 수 있으며, M3 Ultra 칩이 장착된 기기에서도 뛰어난 성능을 발휘하고 있습니다. 사용자들은 모델을 로컬에서 실행할 때 초당 20개 이상의 토큰 속도를 기록했다고 보고했습니다.

딥시크의 은밀한 출시 전략

DeepSeek의 출시는 전통적인 마케팅 활동이 없는 것이 특징으로, 단지 README 파일만을 포함하고 있으며, 추가 문서나 발표가 없었습니다. 이는 많은 서구 AI 기업의 일반적인 과대 광고 접근 방식과 현격히 대조됩니다. 초기 테스터들은 이전 버전보다 상당한 개선을 발견했으며, 한 연구자는 이제 Sonnet 3.5와 같은 기존 모델보다 뛰어난 성능을 발휘한다고 주장했습니다.

혁신적인 구조가 효율성을 향상시킨다

DeepSeek-V3-0324는 혼합 전문가(MoE) 설계를 활용하여 각 작업별로 일부 매개변수만 활성화시켜 효율성을 높입니다. 맥락 유지를 위한 다중 헤드 잠재 주의(Multi-Head Latent Attention, MLA)와 더 빠른 생성 속도를 위한 다중 토큰 예측(Multi-Token Prediction, MTP)이라는 두 가지 첨단 기술을 보완하여, 이 구조는 모델이 경쟁력 있는 출력 속도를 제공하면서도 계산 요구를 대폭 줄일 수 있도록 합니다. 이러한 효율성은 AI 작업 부하 처리 방식에 큰 전환을 예고할 수 있습니다.

중국의 오픈 소스 AI 운동이 서구 기준에 도전하다

이번 출시는 중국 AI 기업들이 미국 시장에서 일반적인 독점 모델 대신 오픈 소스 전략을 채택하는 광범위한 추세를 반영합니다. 중국은 정교한 AI 기능에 대한 접근성을 쉽게 제공함으로써 AI 환경을 빠르게 발전시키고 있으며, 서구 기술과의 격차를 좁히고 있습니다. 바이두와 알리바바와 같은 주요 기업들도 오픈 소스 릴리스를 향해 방향을 전환하고 있으며, 이는 AI 개발의 경쟁 환경에 중요한 변화를 의미합니다.

미래 AI 발전 가능성

DeepSeek-V3-0324가 확고하게 자리 잡은 가운데, 다음 논리적 발전인 DeepSeek-R2, 고급 추론 모델에 대한 기대가 높아지고 있습니다. 이는 OpenAI의 발전에 도전할 수 있으며, DeepSeek를 AI 진화의 주요 선수로 더욱 자리매김할 수 있게 합니다. 이제 경쟁은 AI 기술의 접근성과 민주화에 달려 있으며, 이는 DeepSeek의 전략적 오픈 소스 가능성에 잘 나타나 있습니다.