2026년 5월, AI 업계에서 역사적인 변화가 일어났습니다. Anthropic이 $65B 규모의 Series H 펀딩으로 $965B 밸류에이션을 달성했고, Claude Opus 4.8이 공개되었으며, $47B의 연간 수익을 기록했습니다. 동시에 SpaceX, Microsoft, ByteDance, Mistral AI 등 글로벌 테크 기업들이 앞다투어 자체 AI 칩 제조에 진출하고 있습니다. 이 뉴스레터는 AI 산업을 급속도로 변화시키고 있는 주요 뉴스와 기술 혁신을 살펴봅니다.
💰 빅테크 & 스타트업
Opus 4.8 출시
Anthropic이 Claude Opus 4.8을 출시했습니다. 새 버전은 벤치마크 개선, 조정 가능한 노력 제어, Claude Code의 동적 워크플로우, 그리고 상당히 저렴해진 빠른 모드를 포함하고 있습니다. 기업 고객들의 강력한 수요에 응하며 AI 모델 업데이트를 통해 시장 경쟁력을 강화하고 있습니다.
- 벤치마크 성능 개선
- 조정 가능한 노력 제어 기능 추가
- Claude Code에 동적 워크플로우 통합
- 더욱 저렴한 빠른 모드 제공
Anthropic Series H 펀딩 650억 달러 조성
Anthropic이 Series H 라운드에서 650억 달러를 조성했으며, 기업 평가액은 965억 달러에 도달했습니다. 강력한 엔터프라이즈 채택, 470억 달러의 연간 실행 기준 수익을 바탕으로 AI 스타트업의 빠른 성장을 입증하고 있습니다. 펀딩은 컴퓨트 용량 확대, 연구 개발, 제품 개발에 투자될 예정입니다.
- 650억 달러 Series H 라운드 펀딩 조성
- 965억 달러 사후 평가액 달성
- 470억 달러 연간 실행 기준 수익 기록
- 컴퓨트 용량 및 R&D 확대 계획
SpaceX와 Anthropic 컴퓨트 거래 내용 공개
SpaceX가 Anthropic과 체결한 월 수십억 달러 규모의 대규모 컴퓨트 계약이 180일 임차 기간에 90일 상호 해지 조항으로 구성되어 있음이 밝혀졌습니다. SpaceX의 요청으로 단기 계약을 체결했으며, 향후 컴퓨트 회수 가능성을 남겨두었습니다. 이는 기업 간 인프라 거래에서 유연성이 중요함을 보여줍니다.
- 월 수십억 달러 규모의 대규모 컴퓨트 계약
- 180일 임차 기간 + 90일 상호 해지 조항
- SpaceX의 단기 계약 요청으로 진행
- 향후 컴퓨트 회수 가능성 보유
Microsoft, AI 코딩 시장 재진출 위한 신규 모델 개발
Microsoft가 AI 코딩 분야에서의 입지를 강화하기 위해 새로운 AI 모델 개발을 추진 중입니다. 이는 급변하는 업계 수요에 대응하고 코딩 역량을 향상시키려는 기술 기업의 전략적 움직임입니다.
- AI 코딩 경쟁에서 입지 강화 위한 신규 모델 개발
- 개발자 생산성 향상 목표
- 업계 변화하는 요구사항에 대한 적극 대응
MiniMax, 차세대 M3 모델 및 희소 어텐션 기술 공개
MiniMax가 인기 M2 시리즈 개발 과정을 담은 기술 보고서를 발표하고 차세대 M3 모델을 예고했습니다. 새로운 희소 어텐션 메커니즘을 통해 긴 컨텍스트에서 최대 15.6배 빠른 디코드 속도를 달성하며, 장문 AI 에이전트 배포의 경제성을 획기적으로 개선합니다.
- M2 시리즈 기술 보고서 발표
- 새로운 희소 어텐션 메커니즘 공개
- 장문 컨텍스트에서 15.6배 빠른 성능
- AI 에이전트 배포 경제성 대폭 향상
IBM Project Lightwell, 엔터프라이즈 보안 통합 플랫폼 구축
IBM이 Project Lightwell을 통해 신뢰할 수 있는 엔터프라이즈 클리어링하우스를 구축하고 있습니다. 기업들이 보안 패치를 기존 소프트웨어 공급망에 엔터프라이즈급 검증 및 라이프사이클 관리와 함께 직접 통합할 수 있는 보안 조율 계층으로 기능할 것입니다.
- 신뢰할 수 있는 엔터프라이즈 클리어링하우스 구축
- 보안 패치 직접 통합 지원
- 엔터프라이즈급 검증 및 라이프사이클 관리 제공
ByteDance, 칩 자체 설계 추진으로 AI 인프라 독립성 강화
ByteDance가 프로세서 대기 시간 문제를 해결하기 위해 칩 자체 설계를 추진하고 있습니다. 외부 파트너들과의 협력을 통해 자사 AI 인프라를 더 효과적으로 지원할 수 있는 맞춤형 칩을 개발하려는 대형 기술 기업의 전략적 선택입니다.
- AI 인프라 지원용 신규 칩 설계 추진
- 외부 파트너와의 협력 진행
- 프로세서 공급망 자립화 추진
Mistral AI, 맞춤형 칩 설계로 인프라 통제 및 비용 절감 추진
Mistral AI가 자체 칩 설계를 통해 데이터센터 인프라에 대한 통제력을 강화하고 배포 비용을 절감하려 합니다. 유럽을 중심으로 데이터센터 presence를 확대하는 가운데, AI 스타트업의 수직 통합 전략이 가속화되고 있습니다.
- 맞춤형 칩 설계 추진
- 인프라 통제 및 배포 비용 절감 목표
- 유럽 데이터센터 확대 진행
- 수직 통합 전략 강화
BCG, AI 도입 수요 증가로 수익 성장 및 인력 확대 중
Boston Consulting Group(BCG)의 수익이 지난해 7% 성장했으며, AI 도입을 지원하기 위해 도움이 필요한 기업들의 무한한 수요로 인해 인력을 지속적으로 확대하고 있습니다. 엔터프라이즈 AI 컨설팅 시장의 급성장이 기존 컨설팅 비즈니스 모델을 재편하고 있습니다.
- 지난해 7% 수익 성장 기록
- AI 도입 지원 수요 지속 증가
- 인력 확대 진행 중
- 컨설팅 비즈니스 모델 재편 중
🔬 과학 & 미래 기술
오픈 모델은 얼마나 뒤처져 있나?
오픈 소스 모델들은 최고 성능의 폐쇄형 모델에 비해 완전히 뒤처져 있지 않으며, 공개 벤치마크에서 4~6개월 정도의 성능 격차를 보입니다. DeepSeek R1 출시 당시 격차가 가장 좁았으나 이후 다시 벌어지고 있는 추세입니다.
- 오픈 모델의 성능 격차는 공개 벤치마크 기준 4~6개월 수준으로 예상보다 크지 않음
- DeepSeek R1 출시 당시 가장 좁은 격차를 기록
- 최근 폐쇄형 모델의 발전으로 격차가 다시 확대되는 중
다중 에이전트 월드 모델: NVIDIA γ-World
NVIDIA의 γ-World는 독립적으로 제어 가능한 다중 에이전트를 지원하는 생성형 월드 모델입니다. 제로샷 일반화를 통해 2인 플레이 설정에서 4인 플레이로 자동 확장되며, 실시간 롤아웃 성능을 제공하는 차세대 AI 연구 기술입니다.
- 독립 제어 가능한 다중 에이전트 지원 및 순열 대칭성 구현
- 제로샷 일반화로 2인 설정에서 4인 설정으로 자동 확장
- 실시간 롤아웃 성능으로 강화학습 및 에이전트 훈련 가속화
신경망 훈련의 패러다임 전환: 블록 기반 독립 훈련
Sakana Labs가 신경망 훈련 시 전체 네트워크를 메모리에 유지해야 한다는 10년 이상의 통념을 깼습니다. 네트워크의 포워드 패스를 확산 모델의 신호 제거 프로세스처럼 처리하여 신경망 블록을 독립적으로 훈련할 수 있게 했으며, 깊은 모델 훈련에 필요한 메모리를 획기적으로 절감합니다.
- 엔드투엔드 역전파의 대안 개발로 신경망 훈련 방식 혁신
- 네트워크를 독립적 블록으로 분할하여 병렬 훈련 가능
- AI 훈련의 메모리 병목 현상 해결로 대규모 모델 훈련 비용 대폭 감소
💻 프로그래밍
Agent Judge: 프로덕션 에이전트의 장기 컨텍스트 평가 솔루션
Agent Judge는 Search, Verification, Adaptation에 중점을 두어 장기 컨텍스트 프로덕션 에이전트의 평가를 개선하는 프레임워크입니다. LLM 판사의 한계를 극복하면서 긴 실행 궤적을 탐색하고, 시스템에 대한 상태 저장 작업을 검증하며, 실제 피드백을 바탕으로 평가 기준을 동적으로 업데이트합니다. 테스트 결과는 Agent Judge가 특히 개선된 평가 기준을 통해 전통적인 LLM 판사를 능가하며, 도전적인 시나리오에서 정확성과 일관성이 우수함을 보여줍니다.
- Search, Verification, Adaptation을 통한 장기 컨텍스트 에이전트 평가 개선
- 긴 실행 궤적 탐색, 상태 저장 작업 검증, 피드백 기반 평가 기준 업데이트
- 전통적 LLM 판사 대비 정확성과 일관성 향상, 특히 도전적 시나리오에서 우수
Cursor 개발자 습관 보고서: 컨텍스트 기반 비용 최적화
AI 모델이 더 많은 컨텍스트를 활용하여 코드베이스를 이해하는 새로운 개발 패러다임이 주목받고 있습니다. 입력 및 캐시 읽기 토큰이 출력 토큰보다 저렴하기 때문에, 이러한 컨텍스트 중심 방식은 개발자 생산성을 극대화하고 비용을 절감합니다. Cursor의 분석에 따르면 이 접근 방식은 코드 품질을 향상시키고 diff 생존율을 증가시킵니다.
Cursor Developer Habits Report
- 모델이 코드베이스 이해를 위해 더 많은 컨텍스트 활용
- 저렴한 입력 및 캐시 읽기 토큰 활용으로 비용 절감
- 코드 품질 개선과 diff 생존율 증가로 개발자 생산성 향상
Claude Code 동적 워크플로우: AI 기반 개발 자동화
Claude의 동적 워크플로우는 개발 프로세스를 근본적으로 변화시키는 혁신적인 개발자 도구입니다. Jarred Sumner는 이를 활용하여 Bun을 Zig에서 Rust로 재작성하면서 11일 만에 750,000줄의 Rust 코드를 작성하고 99.8% 테스트 성공률을 달성했습니다. 이 방식에서는 Claude가 복잡한 작업을 자동으로 소작업으로 분해하고, 에이전트들이 병렬로 실행되어 결과가 수렴될 때까지 진행됩니다.
- 작업을 소작업으로 자동 분해하는 Claude 에이전트 기능
- 병렬 처리로 여러 에이전트 동시 실행 및 효율성 증대
- 11일 만에 750,000줄 코드 작성, 99.8% 테스트 성공율 달성
SpaceX의 C 기반 AI 훈련 스택 V1.0 개발 완료
SpaceX는 C 언어로 작성된 자체 AI 훈련 스택 V1.0 개발을 거의 완료했습니다. 이 프레임워크는 220k GB300s와 800G NIC를 정확하게 매핑하여 파이프라인 병렬화를 광범위하게 활용하며, 베어 메탈에 최대한 근접한 최적화를 달성합니다. 이를 통해 한 자리 수 이상의 속도 개선을 기대하고 있으며, 다음 목표는 대규모 GB300s 블록에서 동시에 고속 강화학습(RL)을 실행할 수 있는 추론 스택을 C 언어로 작성하는 것입니다.
- C 언어 기반 자체 AI 훈련 스택 개발로 최적화 달성
- 파이프라인 병렬화를 통한 베어 메탈 수준의 성능 최적화
- 한 자리 수 이상의 속도 개선 및 고속 강화학습 추론 계획
📊 디자인 & 데이터 사이언스
데이터가 부족한 게 아니라 상상력이 부족해
Asuka Zheng은 '데이터 부족' 공황이 데이터 마켓의 실제 문제를 간과한다고 주장합니다. 자신의 SRE 교체 프로젝트에서 두 개의 월드 모델을 학습했으나, 첫 번째 이상 감지부터 완전한 해결까지의 장기 사건 궤적 데이터가 데이터셋으로 존재하지 않아 정체되었던 경험을 바탕으로, 데이터 부족보다는 특정 타입의 구조화된 데이터 생성의 어려움을 실질적 과제로 지적합니다.
- 데이터 부족 담론의 오류와 실제 데이터 마켓의 현실 분석
- 장기 궤적 데이터 등 특정 타입 데이터의 생성 어려움
- ML 파이프라인에 필요한 고품질, 구조화 데이터의 중요성
⚡️ 퀵 링크
Scribe Optimize — AI로 회사 워크플로우 가시화
Scribe Optimize는 AI를 통해 회사의 숨겨진 워크플로우를 자동으로 감지하고 비효율성을 발견하는 도구입니다. 감시나 추측 없이 실제 워크플로우를 파악할 수 있으며, OpenAI와 Vercel을 포함한 수백만 사용자가 활용 중입니다.
- AI가 자동 감지한 실제 워크플로우로 비효율성 발견
- OpenAI, Vercel 등 수백만 사용자가 매일 활용
TLDR 채용 — 선임 소프트웨어 엔지니어, Applied AI
TLDR의 Applied AI 팀은 모든 프로세스를 코드로 만들고 누구나 실행 가능하게 하며 더 큰 워크플로우로 조합할 수 있도록 하는 미션을 수행합니다. 최신 AI 도구와 무제한 토큰 예산으로 일하는 빠르게 움직이는 팀입니다.
- 프로세스 자동화 및 워크플로우 조합 개발
- 최신 AI 도구와 무제한 토큰 예산 제공
- 완전 원격 근무, 급여 $250k-$350k
Claude Opus 4.8의 벤치마크 성능 향상과 빠르고 저렴해진 기능이 공개되었고, Anthropic은 $47B의 연간 수익으로 $965B의 기업 가치를 달성했습니다. SpaceX와의 수십억 달러 규모 컴퓨팅 거래를 시작으로, Microsoft, ByteDance, Mistral AI 등이 자체 AI 칩 개발에 나서고 있으며, 동적 워크플로우와 스파스 어텐션 메커니즘 같은 혁신 기술들이 AI 모델의 효율성을 획기적으로 높이고 있습니다.
AI 산업의 경쟁은 최고조에 도달했습니다. 주요 기업들이 인프라 구축과 커스텀 칩 개발에 막대한 자본을 투자하고 있으며, 오픈 모델도 폐쇄 모델과의 격차를 4~6개월로 좁혀가고 있습니다. 향후 AI 산업은 소프트웨어 경쟁을 넘어 하드웨어, 인프라, 에너지 효율성 경쟁으로 확대될 것으로 예상되며, 이는 전 산업의 AI 도입 속도를 더욱 가속화할 것입니다.
댓글
댓글 쓰기