kv-cache 3 Do Transformers Need Three Projections? — QKV 투영을 공유해 KV 캐시를 절반으로 Jun 11, 2026 TurboQuant: 정보 이론적 최적에 근접하는 온라인 벡터 양자화 Apr 16, 2026 Stanford CME295: Lecture 3 - LLMs & 추론 최적화 Mar 8, 2026