cafe
DeepSeek-V4 프리뷰: 백만 컨텍스트, 누구나 쓸 수 있는 시대
오늘, 새로운 모델 시리즈 DeepSeek-V4의 프리뷰 버전을 공식 출시하며, 동시에 오픈소스로 공개합니다.
DeepSeek-V4는 100만 토큰급 초장문 컨텍스트를 지원하며, Agent 역량·세계 지식·추론 성능 모두에서 국내 및 오픈소스 영역 최고 수준을 달성했습니다. 모델은 크기에 따라 두 가지 버전으로 제공됩니다:
오늘부터 공식 웹사이트 chat.deepseek.com 또는 공식 앱에 로그인하면 최신 DeepSeek-V4와 대화할 수 있으며, 1M 초장문 컨텍스트 메모리가 선사하는 새로운 경험을 직접 체험해 보실 수 있습니다. API 서비스도 동시에 업데이트되었습니다. model_name을 deepseek-v4-pro 또는 deepseek-v4-flash로 변경하기만 하면 바로 새 모델을 호출할 수 있습니다.
DeepSeek-V4-Pro: 최상위 클로즈드 모델에 견주는 성능
Agent 역량의 대폭 향상
이전 세대 모델 대비, DeepSeek-V4-Pro의 Agent 역량은 비약적으로 향상되었습니다. Agentic Coding 벤치마크에서 V4-Pro는 현재 오픈소스 모델 중 최고 수준에 도달했으며, 그 외 Agent 관련 벤치마크에서도 우수한 성적을 기록했습니다.
현재 DeepSeek-V4는 사내 엔지니어들의 Agentic Coding 도구로 실제 운영되고 있습니다. 사내 평가에 따르면, 사용감은 Sonnet 4.5를 상회하며, 결과물 품질은 Opus 4.6 비사고 모드에 근접한 수준입니다. 다만 Opus 4.6 사고 모드와는 아직 격차가 있습니다.
풍부한 세계 지식
DeepSeek-V4-Pro는 세계 지식 벤치마크에서 다른 오픈소스 모델을 크게 앞서며, 최상위 클로즈드 모델인 Gemini-Pro-3.1에만 근소하게 뒤지는 수준입니다.
세계 최고 수준의 추론 성능
수학·STEM·경쟁 프로그래밍 벤치마크에서 DeepSeek-V4-Pro는 공개 평가가 이루어진 전체 오픈소스 모델을 능가하며, 세계 최상위 클로즈드 모델에 견주는 우수한 성적을 거두었습니다.
DeepSeek-V4-Flash: 가성비 뛰어난 고속 모델
DeepSeek-V4-Pro와 비교하면 세계 지식 면에서는 다소 부족하지만, 추론 능력은 거의 동등한 수준입니다. 파라미터 수와 활성화 규모가 더 작아, 한층 빠르고 경제적인 API 서비스를 제공합니다.
Agent 벤치마크에서 DeepSeek-V4-Flash는 단순 작업에서 DeepSeek-V4-Pro와 대등한 성능을 보이지만, 고난도 작업에서는 여전히 차이가 존재합니다.
아키텍처 혁신과 초고효율 장문 컨텍스트 처리
DeepSeek-V4는 토큰 차원에서 압축을 수행하는 완전히 새로운 어텐션 메커니즘을 도입했습니다. 여기에 DSA(DeepSeek Sparse Attention)를 결합하여 세계 최고 수준의 롱 컨텍스트 처리 능력을 구현했으며, 기존 방식 대비 연산량과 GPU 메모리 요구량을 대폭 절감했습니다.
앞으로 1M(100만) 컨텍스트는 DeepSeek의 모든 공식 서비스에서 기본 스펙이 됩니다.
Agent 역량 전용 최적화
DeepSeek-V4는 Claude Code·OpenClaw·OpenCode·CodeBuddy 등 주요 Agent 제품에 맞춰 적응 및 최적화를 진행했습니다. 코드 작업, 문서 생성 작업 등에서 성능 향상이 확인되었습니다.
아래는 특정 Agent 프레임워크에서 V4-Pro가 생성한 PPT 슬라이드 예시입니다:
API 접근
현재 DeepSeek API에서 V4-Pro와 V4-Flash를 동시에 제공하고 있습니다. OpenAI Chat Completions 인터페이스와 Anthropic 인터페이스를 모두 지원합니다.
새 모델 사용 시 base_url은 변경할 필요 없이, model 파라미터만 아래 중 하나로 변경하면 됩니다:
- deepseek-v4-pro
- deepseek-v4-flash
V4-Pro와 V4-Flash 모두 최대 컨텍스트 길이는 1M이며, 비사고 모드와 사고 모드를 모두 지원합니다. 사고 모드에서는 reasoning_effort 파라미터로 사고 강도를 설정할 수 있습니다(high / max).
복잡한 Agent 시나리오에서는 사고 모드를 사용하고, 강도를 max로 설정하는 것을 권장합니다.
모델 호출 및 파라미터 조정 방법은 API 문서를 참고해 주세요:
https://api-docs.deepseek.com/zh-cn/guides/thinking_mode
참고: 기존 API 모델명 deepseek-chat과 deepseek-reasoner는 3개월 후인 2026년 7월 24일에 지원이 종료됩니다. 현재는 각각 다음을 가리킵니다:
- deepseek-chat → deepseek-v4-flash 비사고 모드
- deepseek-reasoner → deepseek-v4-flash 사고 모드
오픈소스 가중치 및 로컬 배포
DeepSeek-V4 모델 오픈소스 링크:
- https://huggingface.co/collections/deepseek-ai/deepseek-v4
- https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
DeepSeek-V4 기술 보고서:
마치며
"명예에 흔들리지 않고, 비방을 두려워하지 않으며, 올바른 길을 걸어가고, 스스로를 바르게 세운다."
모든 사용자 여러분의 신뢰와 성원에 진심으로 감사드립니다. 여러분의 피드백과 기대는, 우리가 끊임없이 탐구하고 나아가는 원동력입니다.
앞으로도 장기적 관점을 견지하며, 시도와 성찰을 거듭하고, AGI 실현이라는 목표를 향해 한 걸음씩 나아가겠습니다.
댓글 쓰기