A Primate Labs acaba de lançar o Geekbench 6, uma nova versão de seu popular aplicativo de benchmarking. A nova versão inclui novos testes e novos conjuntos de dados para medir melhor o desempenho. Os novos testes incluem desfoque de fundo, semelhante à tecnologia usada durante videoconferências; filtros de fotos, semelhantes aos usados pelos aplicativos de mídia social modernos; e detecção de objetos para cargas de trabalho de IA. Os novos conjuntos de dados incluem fotos de maior resolução para alinhar com as capturadas pelos melhores telefones de hoje (12 a 48MP) e exemplos de PDF maiores e mais modernos.
Uma grande mudança para o Geekbench 6 em comparação com o Geekbench 5 e outras versões está na forma como as pontuações multi-core são calculadas. Anteriormente, várias tarefas individuais eram criadas e medidas para ver a rapidez com que seriam concluídas. Quanto mais núcleos você tivesse, mais rápido eles seriam concluídos. No entanto, no Geekbench 6, uma carga de trabalho é usada e todos os núcleos trabalham juntos nesse objetivo compartilhado. Ainda é verdade que quanto mais núcleos você tiver, mais rápido ele será concluído. No entanto, agora há interação entre os núcleos.
Para coincidir com o lançamento, tivemos a chance de conversar com John Poole, CEO e fundador da Primate Labs, e autor original das primeiras versões do Geekbench, para discutir tudo sobre o Geekbench 6.
Para obter os resultados do benchmark Geekbench 6, verifique novamente com Autoridade do Android ao longo dos próximos dias e semanas, pois iremos colocá-lo à prova com os melhores e mais recentes dispositivos. Você também pode conferir a transcrição completa de nossa entrevista com John Poole no link ou assistindo ao vídeo acima.
Você já usou o Geekbench?
7 votos
Geekbench 6: É um benchmark sintético?
Robert Triggs / Autoridade do Android
Em 2003, a Apple lançou o primeiro computador desktop de 64 bits do mundo, o Power Mac G5. Poole comprou um, mas assim que chegou em casa sentiu que não era muito mais rápido que a geração anterior. Então ele baixou alguns benchmarks padrão da época, mas depois de alguns testes, percebeu que os benchmarks existentes não estavam fazendo um bom trabalho. Então ele decidiu escrever o seu próprio! Avanço rápido de três anos e o Geekbench 1.0 foi lançado ao público. Hoje em dia, o Geekebench é o padrão de fato para testar dispositivos de computação de consumo, desde laptops e desktops até telefones Android e iOS.
Apesar de sua popularidade, algumas pessoas ainda desconfiam profundamente dos benchmarks, pois afirmam que são sintéticos e não representam casos de uso do mundo real. Fiz esta pergunta ao João. “Portanto, no Geekbench 6, temos quinze cargas de trabalho separadas que usamos para medir o desempenho da CPU e tentamos escolher uma variedade de tarefas diferentes que refletem, pelo menos, pensamos, o que as pessoas usam seus computadores no dia-a-dia. dia-a-dia ou o que eles usam em seus smartphones no dia-a-dia”, ele me disse. O foco do Geekbench 6, diz Poole, é “realmente restringir o que as pessoas realmente farão com seus computadores”. Ele continua:
Então, estamos realmente tentando nos limitar ao que as pessoas realmente farão com seus computadores. Portanto, algo como compactação é importante porque, quando você baixa aplicativos em seu smartphone, o Android os descompacta e os instala. Outras coisas, como testes de HTML, estão lá porque as pessoas passam muito tempo em seus navegadores da Web hoje, essa é uma métrica importante a ser capturada. Outras coisas que surgiram da pandemia, coisas como videoconferência e temos uma carga de trabalho de desfoque de fundo para aquele efeito de zoom de onde seu rosto está visível, mas seu plano de fundo não, que de repente se tornou uma nova carga de trabalho que nem era relevante três ou quatro anos atrás.
Ele acrescentou: “Nós tentamos e olhamos para o que vai ser interessante para os usuários, o que é realmente intensivo em CPU, o que realmente importa para o dispositivo dia após dia. Nós realmente não queremos que o Geekbench exista no vácuo, queremos que seja representativo do que as pessoas realmente fazem.”
Podemos comparar as pontuações do Geekbench 5 com o Geekbench 6?
Robert Triggs / Autoridade do Android
Poole confirmou para mim que você não pode comparar as pontuações do Geekbench 5 com as do Geekbench 6, pois é um benchmark completamente novo. Para o Geekbench 5, as pontuações são calibradas em relação a uma pontuação de referência de 1.000, que é a pontuação de um Intel Core i3-8100. Uma pontuação mais alta indica melhor desempenho e uma duplicação da pontuação significa um aumento de duas vezes no desempenho. A linha de base mudou para Geekbench 6, é calibrada contra uma pontuação de linha de base de 2.500, que é a pontuação de um Intel Core i7-12700.
Curiosamente, Poole também apontou que você não pode necessariamente comparar uma versão pontual (digamos 5.0) com outra versão pontual (como 5.1):
Sempre haverá feedback que receberemos depois de enviarmos um benchmark, alguém apontará algo e diremos ‘oops’, cometemos um erro, devemos corrigir isso. Sempre tentamos fazer isso no primeiro ou segundo mês, então 6.0 a 6.1, será comparável? É difícil dizer, mas depois desse ponto, nós realmente tentamos manter o benchmark comparável para o 6.1, 6.2, 6.3 etc. Normalmente, quando fazemos um lançamento pontual, é porque estamos adicionando suporte para um novo hardware. Portanto, se você estiver comparando um novo hardware, talvez queira usar apenas a versão mais recente. Na maioria das vezes, é comparável, tentamos chamar explicitamente onde é ou não comparável nas notas de lançamento.
Podemos comparar o desempenho de desktop e móvel com base nas pontuações do Geekbench?
Às vezes, recebo comentários sobre Gary explica que o Geekbench é melhor otimizado para um sistema e não para outro, levando a uma disparidade nas pontuações entre desktop e celular. Perguntei a Poole se o Geekbench é igualmente otimizado para todos os sistemas, “com certeza, gastamos muito tempo [on that].”
“Digamos, como exemplo, que escrevemos uma versão NEON de uma função, não queremos pegar essa versão NEON e tentar enxertá-la em uma versão SSE”, explica ele. “Tentamos escrever as coisas de uma forma que seja natural para o conjunto de instruções específico, que aproveite as vantagens e tenha em mente as desvantagens desse conjunto de instruções. Para que possamos obter algo que seja comparável em ambas as plataformas.”
Aceleração de hardware, otimização e o ‘Hardware Computer Museum’
Robert Triggs / Autoridade do Android
Os processadores, seja em desktops, laptops ou smartphones, tendem a ter aceleração de hardware para diferentes tarefas, como criptografia ou codificação/decodificação de vídeo. Além disso, existem conjuntos de instruções especiais como SSE e AVX em x86-64, ou NEON e SVE em chips Arm. Perguntei a Poole qual é a abordagem do Geekbench para aceleração de hardware. O primeiro ponto que ele destacou foi que o Geekbench não inclui nenhum teste específico de codificação de vídeo. Isso não é porque eles não querem incluí-los, mas porque todos os sistemas modernos de codificação de vídeo precisam ser licenciados e ter patentes anexadas a eles. Então, no momento, o Primate Labs os evitou. Mas para outros testes, como um teste de filtro no estilo Instagram, os engenheiros usam o que um aplicativo comum usaria, então para Arm seria NEON (e SVE está chegando em breve, talvez no Geekbench 6.1), e para x86-64 isso significa SSE e AVX2.
A Primate Labs leva o desenvolvimento do Geekbench a sério – e o Geekbench 6 não é exceção.
“Trabalhamos com empresas de hardware, as que criaram ou implementaram as instruções, trabalhamos com eles para garantir que o que temos não seja necessariamente o melhor que pode ser, mas que seja uma amostra justa e representativa do que as instruções de uso podem ser”, explicou Poole. “Fazemos isso com todos os vários conjuntos de instruções que suportamos, portanto, seja NEON no lado Arm, seja AVX no lado x86, tentamos garantir que o que escrevemos seja justo e razoável.”
Todas as grandes decisões são tomadas no ambiente de teste e desenvolvimento do Primate Labs — apelidado de “The Hardware Computer Museum” — que abriga mais de 150 dispositivos de teste, desde um sistema Intel Core Duo até sistemas Raptor Lake (ou seja, usando um processador Intel 13th- geração do processador Core). Eu brinquei com Poole que eu realmente gostaria de ver um tour por aquele laboratório! Ele concordou que uma visita ao laboratório e seu processo de desenvolvimento seria útil “porque acho que isso acabaria com muitos daqueles medos que as pessoas têm sobre o Geekbench ser uma caixa preta, ‘quem sabe o que tem dentro dele?’”
Com turnê ou sem turnê, Poole é muito claro sobre o quão sério eles levam o desenvolvimento do Geekbench – e o Geekbench 6 não é exceção.