Join the AI in Real Newsletter

미니맥스, 'M3' 시리즈 예고…희소 어텐션으로 100만 토큰 효율화

이전 M2 는 풀 어텐션(full attention) 방향이었습니다. 미니맥스(MiniMax)가 5월 26일 X 에 공개한 차세대 M3 는 100만 토큰 에이전트 시장 진입 장벽을 낮추는 선례입니다.

기존 트랜스포머의 제곱 연산 부담 탓에 닫혀 있던 전략 옵션이 다시 열린다고 벤처비트(VentureBeat) 는 분석했습니다.

핵심 메커니즘은 두 단계 동적 블록 선택입니다. 모델이 압축되지 않은 키-값(KV) 블록을 스캔한 뒤 질의와 연관된 블록만 처리하는 서브 쿼드라틱 설계로 n제곱 스케일링을 우회합니다.

2022년 출범한 미니맥스는 2026년 1월 홍콩 증권거래소(HKG: 0100) 에 상장했습니다. 같은 해 6월 항셍테크지수에 편입됐다고 사우스차이나모닝포스트(SCMP) 가 전했습니다.

당신이 장문 에이전트를 운영하는 개발자라면 2027년 추론 계약 체결 전 MSA 기반 파이프라인을 재벤치마킹해야 합니다.

규제 환경도 좁아지고 있습니다. 베이커 매켄지(Baker McKenzie) 분석에 따르면 미니맥스는 2026년 미국 사례별 심사 정책 아래 엔비디아 H200 도입 시 25% AI 관세와 수량 한도를 적용받습니다. 4월에는 미니맥스를 엔티티 리스트에 추가하는 법안이 발의됐다고 스트레이츠타임스(Straits Times) 가 보도했습니다.

에이전트 플랫폼 구매자에게 이번 공개는 아키텍처 결정이 아닙니다. 2026년 연말까지 25% 관세와 엔티티 리스트 잠재 위험이 따라붙는 조달 결정입니다.

댓글 쓰기

다음 이전