AI

미국이 수출 금지한 칩으로 GPT-5.5를 이긴 중국 AI, LongCat 2.0

Susan Hill

LongCat 2.0은 1.6조 개의 파라미터를 보유하고, 100만 토큰의 컨텍스트 윈도우를 처리하며, 실제 소프트웨어 엔지니어링 벤치마크에서 OpenAI의 GPT-5.5를 제쳤다. 개발사는 Meituan(美团) — 중국 밖에서는 음식 배달 앱으로만 알려진 기업이다.

모델은 SWE-bench Pro에서 GPT-5.5의 58.6점에 맞서 59.5점을 기록했다. 점수 차가 작아 보일 수 있지만, 이 시스템이 어떻게 만들어졌는지가 이 성과를 특별하게 만든다. Meituan은 LongCat 2.0을 5만 개 이상의 중국산 AI 가속기 칩으로 학습시켰다 — 2022년부터 중국이 대량 수입할 수 없게 된 Nvidia 하드웨어 없이. 칩 제조사는 공식적으로 확인되지 않았지만 기술 커뮤니티는 Huawei(화웨이) Ascend 910B를 지목한다. 사실이라면 화웨이 칩으로 학습된 모델이 공개 벤치마크에서 최전선 성능에 도달한 첫 사례가 된다.

LongCat 2.0은 Mixture-of-Experts 아키텍처를 사용한다. 쿼리마다 330억~560억 개의 파라미터만 활성화되어 고성능 하드웨어 없이도 빠른 추론이 가능하다. 100만 토큰 컨텍스트 윈도우로 전체 코드베이스를 한 세션에서 읽을 수 있다. SWE-bench Multilingual에서 77.3점, 실제 Unix 환경 탐색을 평가하는 Terminal-Bench에서 70.8점을 받았다.

공식 발표 전, 이 모델은 “Owl Alpha”라는 코드명으로 약 두 달간 OpenRouter에서 조용히 운영됐다. 사용한 개발자들은 뛰어난 코딩 능력을 알아챘지만 출처는 몰랐다. Meituan은 출시 후 Owl Alpha가 LongCat 2.0의 초기 평가 단계였음을 확인했다.

MIT 라이선스가 이야기의 전부는 아니다. 가장 개방적인 라이선스 중 하나임에도 모델 가중치는 아직 공개되지 않았다 — GitHub와 Hugging Face 모두 “곧 공개”라고 적혀 있다. 현재 LongCat 2.0은 호스팅된 API로만 접근 가능하며, 다운로드·파인튜닝·로컬 실행은 불가능하다.

Meituan은 매일 5천만 건 이상의 식품 주문을 처리하며, 외부 AI 개발에 나서기 전 Zhichi라는 내부 언어 모델을 조용히 개발했다. LongCat 2.0은 첫 공개 모델이자, 벤치마크 성능 기준으로 오픈 라이선스 하에서 이용 가능한 가장 강력한 코딩 시스템 중 하나다.

가중치가 공개되면 LongCat 2.0은 Meta의 Llama 4.1, DeepSeek-V4 Pro와 다운로드 가능한 최강 오픈 코딩 모델을 두고 직접 경쟁에 돌입한다. 어떤 국산 칩이 이 결과를 가능하게 했는지에 대한 답은 AI 커뮤니티를 훨씬 넘어선 의미를 갖게 될 것이다.

태그: , , , , ,

토론

댓글 0개가 있습니다.