Говорят, есть подвижки по радикальному сокращению объёма вычислений работы LLM (и потребления как следствие).
Но, конечно, эти "быстрые ответы" одно из самых идиотических применений, которые только можно придумать.