Caffeine будет обладать наибольшим объемом интернет-контента среди всех систем индексирования, использовавшихся поисковиком ранее. При этом, как обещает Google, обновление индекса будет происходить быстрее, чем раньше. Таким образом, пользователи смогут быстрее находить ссылки на новые сайты в поисковой выдаче.
В записи в блоге объясняется, что предыдущая версия индекса состояла из нескольких слоев, которые обновлялись с различной периодичностью. Так, основной слой обновлялся в среднем раз в две недели. Новый индекс будет анализировать интернет-сайты на постоянной основе небольшими фрагментами.
Отмечается, что общий объем базы данных Caffeine превышает 100 миллионов гигабайт (100 петабайт). При этом каждый день в индекс добавляется несколько сотен тысяч гигабайт новых данных.
Тестирование новой системы с участием пользователей началось в августе 2009 года и продолжалось до ноября.