기술

딥시크 V4, GPT-5 5분의 1 가격에 엔비디아 없이 작동

엔비디아 주가를 R1으로 무너뜨렸던 중국 연구실이 더 크고, 훨씬 저렴하며, 중국산 하드웨어에 최적화된 버전으로 돌아왔다. V4-프로는 지금까지 만들어진 오픈소스 AI 모델 가운데 가장 크며, 두 버전 모두 MIT 라이선스로 허깅페이스에 공개됐다.
Susan Hill

딥시크가 V4-프로와 V4-플래시의 프리뷰 버전을 공개했다. 두 오픈소스 언어 모델이 던지는 메시지는 분명하다. 100만 토큰 컨텍스트 처리는 이제 용량의 문제가 아니라 효율성의 문제라는 것이다.

V4-프로는 총 1.6조 개의 파라미터를 담고 있으며, 쿼리마다 490억 개가 활성화된다. 코드 저장소 전체나 책 한 권을 단일 프롬프트 안에서 처리할 수 있는 규모다. 오픈 모델이 수학, 프로그래밍, 에이전트 작업에서 최상위 폐쇄형 모델과 본격적으로 경쟁하는 것은 이번이 처음이다.

YouTube video

두 모델의 구성

두 모델 모두 MIT 라이선스로 제공되며, 가중치는 이미 허깅페이스에 공개돼 있다. V4-플래시는 효율형 버전으로, 총 2,840억 개 파라미터 중 130억 개가 활성화된다. 양자화 버전이라면 고사양 노트북에서도 구동할 수 있을 만큼 작다.

V4-프로는 플래그십이다. 디스크 용량은 865기가바이트로 클라우드 배포와 연구소용으로 설계됐다. 두 모델 모두 동일한 100만 토큰 컨텍스트 창을 갖춰, 구글 제미나이를 따라잡고 대다수 경쟁 오픈 모델의 두 배를 제공한다.

하이브리드 어텐션의 효과

핵심 아키텍처 설계는 ‘하이브리드 어텐션(Hybrid Attention)’으로 불린다. 딥시크는 두 가지 압축 기법을 결합해 메모리 비용을 공격적으로 낮췄다. V4-프로는 같은 컨텍스트 길이에서 V3.2 대비 연산력의 27%, 캐시의 10%만 사용한다.

V4-플래시는 이보다 더 나아간다. 실질적으로 V4-프로로 100만 토큰 프롬프트를 처리하는 비용이 이전 세대에서 10만 토큰을 처리하는 비용보다 낮다. 이는 장문 컨텍스트 모델이 실험실 시연을 벗어나 상업 제품으로 이행할 수 있게 만드는 경제적 조건이다.

가격 파괴

가격 측면의 충격이 가장 크다. V4-플래시는 입력 토큰 100만 개당 0.14달러다. 오픈AI의 GPT-5.4 Nano보다도 낮다.

V4-프로는 입력 토큰 100만 개당 1.74달러, 출력은 3.48달러다. 앤트로픽이 클로드 오푸스 4.7에 매기는 금액의 3분의 1, 오픈AI가 GPT-5.5에 매기는 금액의 5분의 1 수준이다. 프로그래밍 벤치마크에서 V4-프로는 코드포스 3,206점을 기록했다. 딥시크에 따르면 세계 경쟁 프로그래머 가운데 23위에 해당하는 점수다.

지정학적 함의

지정학적 맥락은 벤치마크 수치 못지않게 중요하다. 딥시크는 V4를 화웨이의 어센드 950 칩과 중국 캄브리콘의 실리콘에 맞춰 최적화했고, 엔비디아와 AMD에는 성능 캘리브레이션용 사전 접근을 제공하지 않았다. 업계 표준 관행과 정반대 조치다.

이번 출시는 수년간 워싱턴의 수출 규제 아래 가동돼 온 중국 기술 체인 전체의 상업적 스트레스 테스트다. 유럽의 입장은 더 난처해진다. 베이징이 개방 가중치, 국산 칩, 자체 추론 소프트웨어까지 갖춘 독자적 완성 체인을 구축하고 워싱턴이 법으로 자국 체인을 닫는 동안, 유럽의 디지털 주권은 양 진영 인프라에 구조적으로 의존하는 상태로 남는다.

주의할 부분

짚어둘 단서는 있다. V4는 프리뷰 버전이지 프로덕션 릴리스가 아니다. 독립 3자 벤치마크도 아직 완료되지 않았다. 딥시크는 자체 기술 보고서에서 이 모델이 GPT-5.4와 제미나이 3.1 프로에 비해 최첨단 역량에서 3∼6개월 뒤처진다고 인정하고 있다.

전작 R1은 출시 직후 몇 주 만에 미국의 여러 주, 호주, 대만, 한국, 덴마크, 이탈리아에서 금지되거나 제한됐다. V4도 이들 시장에서 동일한 규제 리스크를 그대로 떠안는다. 펜타곤 계약자는 2026년 미국 NDAA법에 따라 명시적 예외 허가가 없는 한 딥시크 모델 사용이 금지돼 있다.

이런 제한 구역 밖에서는 즉시 접근이 가능하다. 딥시크 웹 챗봇은 ‘엑스퍼트(Expert)’ 모드로 V4-프로를, ‘인스턴트(Instant)’ 모드로 V4-플래시를 무료 제공한다. 개발자는 API 호출 시 모델 이름을 deepseek-v4-pro 또는 deepseek-v4-flash로 바꾸기만 하면 된다.

이번 공개는 2025년 1월 20일 딥시크-R1이 세계 AI 시장을 흔든 지 정확히 1년 만에 이뤄졌다. 캘린더는 의도적으로 선택됐다. 프리뷰 단계를 넘어선 정식 API 가격은 아직 공개되지 않았다.

기존 엔드포인트인 deepseek-chat과 deepseek-reasoner는 2026년 7월 24일에 중단되며, 이때 모든 트래픽이 V4로 자동 전환된다.

여기서 걸려 있는 것은 단일 벤치마크를 넘어선다. 경쟁 강국이 미국 공급업체에 의존하지 않고도 완전하고 경쟁력 있으며 저렴한 AI 스택을 공급할 수 있다는 최초의 공개 증거다. 이 증거만으로도 향후 모든 AI 주권 전략의 좌표가 다시 그려진다.

토론

댓글 0개가 있습니다.