Back-end
Infra de IA: como reduzir custos e latência com cache
Infra de IA: veja como eu penso além da GPU; o ganho vem do stack inteiro, com cache, dados e rede reduzindo custo e p95.
Ler artigo completo