🔮 AI 인사이드 스쿠프

Google Gemini 3.5: 루머, 유출 정보 및 성능 분석

Snow Bunny 체크포인트부터 Fierce Falcon까지, 차세대 AI 모델의 모든 것

📅 2026년 1월 29일 기준

⚠️ 비공식 정보 포함

⚠️ 주의: Gemini 3.5는 2026년 1월 29일 기준 아직 공식 출시되지 않았습니다. 본 문서의 정보는 개발자 커뮤니티의 유출 정보와 A/B 테스트 관찰을 기반으로 합니다. 공식 성능 수치는 Google의 발표를 통해서만 확인 가능합니다.

📋 개요

Google의 AI 모델 라인업은 빠르게 진화하고 있습니다. 2025년 11월 Gemini 3 Pro가 공식 출시된 이후, 개발자 커뮤니티에서는 차세대 버전인 Gemini 3.5에 대한 활발한 논의가 이루어지고 있습니다. 특히 Google AI Studio의 A/B 테스트를 통해 내부 테스트 버전에 접근한 사용자들의 보고가 증가하면서, "Snow Bunny"라는 코드명의 체크포인트가 화제가 되고 있습니다.

현재 공식 Gemini 3 Pro는 LMArena에서 1501 Elo를 기록하며 최초로 1500 벽을 돌파한 모델로, GPT-5.2 및 Claude Opus 4.5와 치열한 경쟁을 벌이고 있습니다. 이러한 경쟁 환경에서 Gemini 3.5의 등장은 AI 업계의 판도를 다시 한번 뒤흔들 것으로 예상됩니다.

🏷️ 유출된 코드명과 체크포인트

개발자들이 Google AI Studio의 브라우저 코드와 LaMarina 플랫폼을 분석하여 발견한 Gemini 3.5의 내부 코드명들입니다. 각 모델은 특화된 영역에서 최적의 성능을 발휘하도록 설계되었습니다.

🐰

Snow Bunny

주요 체크포인트

단일 프롬프트로 완전한 애플리케이션 구축 가능. Game Boy 에뮬레이터를 한 번에 생성한 사례로 화제

🦅

Fierce Falcon

속도 · 논리 특화

빠른 응답 시간과 정확한 논리 처리에 최적화. 수학적 추론과 알고리즘 설계에 강점

👻

Ghost Falcon

멀티모달 특화

UI 디자인, 이미지 생성, 오디오 창작 전문. 3D 시뮬레이션 및 시각적 요소 처리 탁월

🔍 발견된 테스트 모델 ID

개발자들이 API 호출 모니터링을 통해 발견한 테스트 모델 ID들:

Day9 (D9) D13 D14 D17 gemini-for-google-3.5

이들은 표준 Gemini 3 Pro ID와 다르며, A/B 테스트를 통해 일부 사용자에게 무작위로 활성화됩니다.

📊 주요 성능 클레임 (미확인)

유출된 정보가 주장하는 Gemini 3.5의 성능 개선 사항들입니다. 이 수치들은 공식 확인되지 않았으며, 실제 출시 시 변경될 수 있습니다.

3,000+

단일 프롬프트 코드 라인

218

토큰/초 처리 속도

2.1M

컨텍스트 윈도우 (토큰)

40%

Gemini 3 대비 성능 향상

✨ 새로운 기능 (유출 정보)

🧠

Deep Think 모드

복잡한 논리 문제 해결을 위한 심화 분석 기능. 어려운 논리 테스트에서 80%의 높은 점수를 기록했다고 알려져 있습니다.

⚙️

System2 추론

"생각한 후 출력하는" 메커니즘으로, 답변 전 내부적으로 심층 분석을 수행합니다. 이를 통해 더 정확하고 논리적인 응답을 생성합니다.

🤝

멀티 모달 콜라보레이션

Fierce Falcon(속도/논리)과 Ghost Falcon(창작/디자인)의 역할 분담을 통해 복합적인 작업을 효율적으로 처리합니다.

Gemini 3.5 추정 아키텍처 흐름도

📥 입력 텍스트/이미지/코드

→

🧠 System2 심층 추론

→

🔀 라우터 모델 선택

→

📤 출력 최적화된 응답

✅ 공식 Gemini 3 성능 (확인된 정보)

Gemini 3.5의 맥락을 이해하기 위해 현재 공식 발표된 Gemini 3의 성능을 살펴보겠습니다. 2025년 11월에 출시된 Gemini 3 Pro는 여러 벤치마크에서 업계 최고 수준의 성능을 보여주고 있습니다.

벤치마크	Gemini 3 Pro	GPT-5.2	Claude 4.5
LMArena Elo	1501 🏆	~1480	~1475
Humanity's Last Exam	37.5%	26.5%	미보고
GPQA Diamond	91.9%	~88%	~87%
MathArena Apex	23.4%	미보고	미보고
SWE-bench Verified	76.2%	80.0%	~78%
AIME 2025	95.0%	미보고	미보고

📈 2026년 1월 주요 AI 모델 성능 비교

Gemini 3 Pro (LMArena Text) #1

GPT-5.2 (Benchmark Intelligence) #1

Claude Opus 4.5 (WebDev/Coding) #1

📅 공식 출시 현황 및 예상 일정

2025년 11월 18일

✅ Gemini 3 Pro 출시

가장 지능적인 모델로, 심화 추론 능력과 우수한 코딩 성능을 자랑

2025년 12월 16-17일

✅ Gemini 3 Flash 출시

기본 모델로 사용, Gemini 2.5 Pro 대비 3배 빠른 속도

2026년 Q1 (진행 중)

🔄 Gemini 3 Deep Think 롤아웃

Google AI Ultra 구독자 대상으로 단계적 배포 중

2026년 2-4월 (예상)

⏳ Gemini 3.5 출시 예상

예측 시장에서 4월 이전 출시 확률 44%, 5월 이전 69%

🎲 예측 시장 데이터 (Manifold Markets)

예상 출시 시기	확률
2026년 2월 이전	4%
2026년 3월 이전	21%
2026년 4월 이전	44%
2026년 5월 이전 (Google I/O)	69%
2026년 6월 이전	79%

🔎 루머의 신뢰성 평가

✅ 긍정적 신호

여러 독립적 소스에서 일관된 모델 ID 발견 보고
브라우저 코드 검사를 통한 기술적 증거 존재
Google이 일반적으로 릴리스 전 A/B 테스트 실시
LaMarina 플랫폼에서의 집중적 테스팅 관찰
Snow Bunny 체크포인트의 실제 성능 데모 다수

❌ 주의 사항

Google은 공식적으로 3.5 버전 존재를 인정하지 않음
일부 벤치마크가 이상적인 조건에서의 결과일 가능성
출시 시기 예측이 "2월 초"부터 "5월 I/O"까지 다양
기술 블로거들의 주장이 학술적 검증을 거치지 않음
Ghost Falcon의 일부 불일치 문제 보고

⚔️ 경쟁 환경 및 시장 맥락

2026년 AI 시장은 그 어느 때보다 치열한 경쟁 상황입니다. 단일 모델이 모든 영역을 지배하는 시대는 끝났으며, 각 모델은 특화된 영역에서 강점을 보이고 있습니다.

🏢 주요 경쟁사 동향

OpenAI: GPT-5.2 출시로 벤치마크 인텔리전스 1위 달성. SWE-bench Verified에서 80.0% 기록.

Anthropic: Claude Opus 4.5가 WebDev 및 코딩 분야에서 1위. "Thinking" 모드로 복잡한 아키텍처 설계에 강점.

DeepSeek: V3.2로 프론티어급 성능을 94% 저렴한 비용으로 제공하며 "경제적 파괴자"로 부상.

xAI: Grok 4.1이 자연스러운 대화 톤과 "AI 클리셰" 회피로 차별화.

"2026년의 핵심 역량은 더 이상 '프롬프트 엔지니어링'이 아닙니다. 이제는 '모델 라우팅'입니다 - 올바른 작업을 올바른 모델에 배정하는 방법을 아는 것이 중요합니다."

— AI 전략 전문가

🔑 접근 방법 (유출된 정보)

A/B 테스트에 참여하려던 사용자들이 보고한 방법들입니다. 이 방법들은 Google의 공식 지원 사항이 아닙니다.

1 Google AI Studio에서 Gemini 3 Pro 선택 후 프롬프트 실행
2 두 개의 다른 응답을 나란히 비교 가능한지 확인
3 Canvas 모드 모바일 버전 사용 시 더 높은 노출 확률
4 API 호출 모니터링으로 모델 ID 확인 (개발자 도구 사용)

💡 결론

Gemini 3.5는 아직 공식 제품이 아니며, 모든 성능 클레임은 미확인 상태입니다. 그러나 Google AI Studio와 LaMarina 플랫폼에서의 A/B 테스트 증거, 그리고 개발자 커뮤니티의 일관된 보고는 내부 개발이 활발하게 진행 중임을 강력히 시사합니다.

예상되는 주요 개선 영역:

🚀 Gemini 3 Pro 대비 대폭 향상된 코드 생성 능력 (3,000줄 이상)
⚡ Fierce Falcon을 통한 더 빠른 응답 시간과 논리 처리
🎨 Ghost Falcon을 통한 향상된 멀티모달 및 창작 성능
📚 2.1M 토큰으로 확장된 컨텍스트 처리 능력

공식 출시 시 정확한 성능 수치와 기능은 Google의 발표를 통해서만 확인될 수 있습니다. 예측 시장 데이터에 따르면 2026년 5월 Google I/O 이전 출시 가능성이 69%로, 향후 몇 달 내 공식 발표가 있을 것으로 기대됩니다.

#Gemini3.5 #GoogleAI #SnowBunny #FierceFalcon #GhostFalcon #AI2026 #LLM #AILeaks

macOS에 gemini-CLI 설치방법(with iTerm)

1월 02, 2026

자세한 내용 보기

이 블로그 검색

SW Develope

Gemini 3.5 루머 총정리