Rag | Srinidhi Ramanujam

The Million-Token Question: What We Actually Found

Structured context beat naive long context, retrieval handled noise better, and simple baselines held up better than expected.