Embora existam muitos fatores que podem influenciar as decisões de compra de PCs, o desempenho ainda é a principal preocupação para empresas de todos os tamanhos. Muitas empresas procuram benchmarks de desempenho para ajudar a determinar qual sistema atenderia melhor às suas necessidades. No entanto, esses benchmarks podem não fornecer o quadro completo de desempenho. Eles são baseados em aplicativos profissionais ou principalmente em cargas de trabalho do consumidor? Quais foram as condições ambientais? Neste artigo, veremos algumas considerações principais para usar benchmarks para avaliar o desempenho de PCs empresariais modernos – e como garantir que você escolha o sistema certo para as necessidades atuais e futuras.
O método tradicional de medir o desempenho do PC
Tradicionalmente, as empresas usam várias especificações físicas, como frequência do processador e tamanho do cache, para definir uma linha de base para o desempenho do PC. Há dois problemas com esta abordagem. Primeiro, você pode ter dois processadores que operam com a mesma frequência e ver um desempenho dramaticamente diferente devido à eficiência de suas implementações subjacentes, algo medido como “Instruções por relógio” (IPC). O segundo problema é que, para a maioria dos processadores modernos, a frequência não é uma constante. Isso é especialmente verdadeiro para processadores em notebooks, onde a frequência é limitada por considerações térmicas. A frequência também irá variar dramaticamente dependendo do tipo de tarefa que está sendo executada, a duração da tarefa, o número de núcleos sendo usados, etc.
Avaliação de desempenho com testes do mundo real
Os aplicativos modernos são altamente complexos, envolvendo diferentes algoritmos subjacentes e padrões de acesso a dados. Como resultado, a eficiência medida de um processador – ou seja, seu IPC – geralmente varia substancialmente entre os aplicativos e até mesmo entre as cargas de trabalho. Muitos aplicativos incluem funções que envolvem a exibição de gráficos na tela, leitura de dados do armazenamento ou mesmo da rede; para essas cargas de trabalho, o desempenho da CPU, embora importante, não é o único fator a ser considerado.
Uma das melhores maneiras de avaliar o desempenho de um novo PC é conduzir um teste do mundo real. Em outras palavras, faça com que os usuários reais realizem suas tarefas diárias no ambiente de trabalho usando dados do mundo real. A experiência desses usuários provavelmente se correlacionará melhor com sua satisfação futura e será mais precisa do que qualquer benchmark publicado. Essa abordagem tem desvantagens, no entanto, incluindo o tempo necessário para realizar a avaliação, a dificuldade de decidir quais cargas de trabalho medir e o desafio de medir o desempenho de maneira consistente, confiável e imparcial.
Além do teste de usuário individual, a próxima melhor abordagem seria que os desenvolvedores internos recebessem a opinião dos usuários e criassem scripts “sob medida” para medir o desempenho do aplicativo de uma forma que corresponda às prioridades desses usuários. Essa abordagem pode melhorar a consistência das medições de desempenho e fornecer resultados repetíveis. No entanto, ainda é uma tarefa considerável e pode ser difícil de manter entre diferentes gerações de PCs.
Em vez disso, a maioria das empresas confia nos resultados dos benchmarks de PC padrão da indústria para avaliar o desempenho do sistema. Em vez de usar apenas um benchmark, as empresas podem ter uma visão mais ampla do desempenho construindo uma pontuação composta em vários benchmarks.
A Figura 1 compara três abordagens diferentes para avaliar o desempenho do PC – benchmarks, scripts de aplicativos e avaliações do usuário – e mostra como os resultados têm diferentes níveis de relevância para os negócios.
O que faz um bom benchmark?
Dois tipos de benchmarks são comumente usados para avaliar o desempenho do PC: “sintético” e “baseado em aplicativo”. Ambos os tipos podem ser úteis no processo de decisão, embora benchmarks individuais possam frequentemente ter atributos indesejáveis. Isso pode ser atenuado seguindo o princípio geral de usar vários benchmarks juntos para obter uma imagem mais ampla e confiável do desempenho.
Um bom benchmark deve ser o mais transparente possível, com uma descrição clara do que o benchmark está testando e seus métodos de teste. No caso de benchmarks baseados em aplicativos, isso permite que os compradores entendam se as cargas de trabalho sendo usadas correspondem ao uso de sua organização. Sem transparência suficiente, também pode surgir a questão de saber se os testes são selecionados para destacar uma arquitetura particular em detrimento de outra.
Nem todos os benchmarks baseados em aplicativos são iguais
Os testes em benchmarks baseados em aplicativos devem representar as cargas de trabalho que são mais relevantes para a organização. Por exemplo, se 30-50% de um benchmark vem de aplicativos que raramente são usados em um ambiente comercial, então essa pontuação provavelmente não é relevante. Considere o benchmark na Figura 2, que se baseia principalmente em cargas de trabalho do tipo consumidor e tem uma baixa porcentagem de uso de aplicativos de escritório. Portanto, esse benchmark provavelmente não seria útil para a maioria das organizações comerciais.
Alguns benchmarks baseados em aplicativos medem o desempenho de aplicativos de prateleira, mas podem não representar a versão do aplicativo implantado na organização ou incluir as otimizações de desempenho mais recentes dos fornecedores de software. É aqui que entram os benchmarks sintéticos.
Avaliando o potencial de desempenho de uma plataforma
Ao contrário dos benchmarks baseados em aplicativos, benchmarks sintéticos medem o desempenho geral potencial de uma plataforma específica. Embora os benchmarks de aplicativos mostrem o quão bem uma plataforma é otimizada para certas versões de certos aplicativos, eles nem sempre são um bom indicador do desempenho de novos aplicativos. Por exemplo, muitas soluções de videoconferência usam vários núcleos de CPU para executar funções, como o uso de fundos virtuais. Benchmarks sintéticos que medem a capacidade multithread de uma plataforma podem ser usados para prever quão bem uma plataforma pode entregar esta nova funcionalidade.
Com benchmarks sintéticos, é importante evitar o uso de uma medida estreita de desempenho. Processadores individuais, mesmo na mesma família, podem variar em como lidam com até mesmo um pequeno trecho de código. Uma pontuação de benchmark sintética deve incluir vários testes individuais, executando mais linhas de código que exercem diferentes cargas de trabalho. Isso fornece uma visão muito mais ampla do desempenho da plataforma.
A multitarefa é difícil de comparar
Os benchmarks de aplicativos têm dificuldade em simular a carga de trabalho do desktop de um funcionário de escritório multitarefa moderno. A razão para isso é que a execução de vários aplicativos simultaneamente pode adicionar uma margem maior de erro de teste do que simplesmente testar um aplicativo por vez. Os aplicativos sintéticos que medem o poder de processamento multitarefa bruto de uma plataforma são um bom proxy para as demandas dos usuários multitarefas de hoje.
Uma prática recomendada é considerar as pontuações de benchmark baseadas em aplicativo e sintéticas juntas. Combinando pontuações usando uma média geométrica, você pode levar em conta as diferentes escalas de pontuação de diferentes benchmarks. Isso fornece a melhor imagem de desempenho para uma plataforma específica, considerando os aplicativos usados hoje e prevendo o futuro.
Outras Considerações Importantes
Os benchmarks são uma parte importante da avaliação do sistema. No entanto, essas ferramentas poderosas podem ter algumas limitações importantes:
- O desempenho de benchmark medido pode variar de acordo com o sistema operacional (SO) e a versão do aplicativo – certifique-se de que essas versões correspondam ao que está em uso em seu ambiente.
- Outras condições podem afetar as pontuações, como tarefas em segundo plano, temperatura ambiente e recursos do sistema operacional, como habilitação de segurança baseada em virtualização (VBS). Novamente, certifique-se de que as condições sejam as mesmas e correspondam às suas implantações.
- Alguns usuários podem usar aplicativos e funções de nicho relativamente não cobertos pelos benchmarks. Considere aumentar as pontuações de benchmark com medições do usuário e correlacioná-las com pontuações de benchmark sintéticas.
Cuidado com o erro de medição
Qualquer medição terá uma margem de “erro de medição”, ou seja, quanto pode variar de um teste para outro. A maioria dos benchmarks tem um erro de medição geral na faixa de 3-5%, causado por uma variedade de fatores, incluindo as limitações de tempo de medição, o “efeito borboleta” de pequenas mudanças nas tarefas de fundo do sistema operacional, etc. Uma maneira de superar esse erro seria será medir os resultados cinco vezes, descartar as pontuações mais altas e mais baixas e obter a média das três pontuações restantes.
É importante considerar o erro de medição ao definir os requisitos nas requisições de compra. Se uma pontuação de X se correlaciona bem com a satisfação do usuário, a requisição deve estipular que as pontuações devem estar dentro [X-Epsilon, Epsilon] onde épsilon é o erro de medição conhecido. Quando o epsilon não é conhecido, é razoável supor que esteja na faixa de 3-5% da pontuação desejada.
Conclusão
Avaliar corretamente o desempenho não é uma tarefa unidimensional. Existem várias técnicas que podem ser usadas por uma organização para determinar qual sistema atenderia melhor às suas necessidades. Usar uma pontuação de benchmark estreita pode levar a conclusões incorretas, enquanto o melhor quadro geral de desempenho vem da observação de uma ampla gama de benchmarks baseados em aplicativos e sintéticos.
A última e melhor etapa em qualquer avaliação é permitir que grupos de usuários “testem” os sistemas em seu ambiente de trabalho real. Não importa quão bem um sistema pontue em benchmarks ou em scripts de aplicativo, os usuários devem estar satisfeitos com sua experiência. Quer você use benchmarks, scripts de aplicativos ou testes organizacionais para medir o desempenho, a série de processadores AMD Ryzen PRO 4000 oferece novos níveis de velocidade e eficiência para encantar os usuários de hoje. Aprenda como obter o desempenho do notebook para atender aos requisitos de computação de hoje, junto com a capacidade de atender às futuras demandas de negócios.
Para obter mais informações sobre como os processadores AMD Ryzen PRO podem atender às necessidades de desempenho de sua organização, visite: https://www.amd.com/en/processors/laptop-processors-for-business ou https: //www.amd. com / en / ryzen-pro
Embora existam muitos fatores que podem influenciar as decisões de compra de PCs, o desempenho ainda é a principal preocupação para empresas de todos os tamanhos. Muitas empresas procuram benchmarks de desempenho para ajudar a determinar qual sistema atenderia melhor às suas necessidades. No entanto, esses benchmarks podem não fornecer o quadro completo de desempenho. Eles são baseados em aplicativos profissionais ou principalmente em cargas de trabalho do consumidor? Quais foram as condições ambientais? Neste artigo, veremos algumas considerações principais para usar benchmarks para avaliar o desempenho de PCs empresariais modernos – e como garantir que você escolha o sistema certo para as necessidades atuais e futuras.
O método tradicional de medir o desempenho do PC
Tradicionalmente, as empresas usam várias especificações físicas, como frequência do processador e tamanho do cache, para definir uma linha de base para o desempenho do PC. Há dois problemas com esta abordagem. Primeiro, você pode ter dois processadores que operam com a mesma frequência e ver um desempenho dramaticamente diferente devido à eficiência de suas implementações subjacentes, algo medido como “Instruções por relógio” (IPC). O segundo problema é que, para a maioria dos processadores modernos, a frequência não é uma constante. Isso é especialmente verdadeiro para processadores em notebooks, onde a frequência é limitada por considerações térmicas. A frequência também irá variar dramaticamente dependendo do tipo de tarefa que está sendo executada, a duração da tarefa, o número de núcleos sendo usados, etc.
Avaliação de desempenho com testes do mundo real
Os aplicativos modernos são altamente complexos, envolvendo diferentes algoritmos subjacentes e padrões de acesso a dados. Como resultado, a eficiência medida de um processador – ou seja, seu IPC – geralmente varia substancialmente entre os aplicativos e até mesmo entre as cargas de trabalho. Muitos aplicativos incluem funções que envolvem a exibição de gráficos na tela, leitura de dados do armazenamento ou mesmo da rede; para essas cargas de trabalho, o desempenho da CPU, embora importante, não é o único fator a ser considerado.
Uma das melhores maneiras de avaliar o desempenho de um novo PC é conduzir um teste do mundo real. Em outras palavras, faça com que os usuários reais realizem suas tarefas diárias no ambiente de trabalho usando dados do mundo real. A experiência desses usuários provavelmente se correlacionará melhor com sua satisfação futura e será mais precisa do que qualquer benchmark publicado. Essa abordagem tem desvantagens, no entanto, incluindo o tempo necessário para realizar a avaliação, a dificuldade de decidir quais cargas de trabalho medir e o desafio de medir o desempenho de maneira consistente, confiável e imparcial.
Além do teste de usuário individual, a próxima melhor abordagem seria que os desenvolvedores internos recebessem a opinião dos usuários e criassem scripts “sob medida” para medir o desempenho do aplicativo de uma forma que corresponda às prioridades desses usuários. Essa abordagem pode melhorar a consistência das medições de desempenho e fornecer resultados repetíveis. No entanto, ainda é uma tarefa considerável e pode ser difícil de manter entre diferentes gerações de PCs.
Em vez disso, a maioria das empresas confia nos resultados dos benchmarks de PC padrão da indústria para avaliar o desempenho do sistema. Em vez de usar apenas um benchmark, as empresas podem ter uma visão mais ampla do desempenho construindo uma pontuação composta em vários benchmarks.
A Figura 1 compara três abordagens diferentes para avaliar o desempenho do PC – benchmarks, scripts de aplicativos e avaliações do usuário – e mostra como os resultados têm diferentes níveis de relevância para os negócios.
O que faz um bom benchmark?
Dois tipos de benchmarks são comumente usados para avaliar o desempenho do PC: “sintético” e “baseado em aplicativo”. Ambos os tipos podem ser úteis no processo de decisão, embora benchmarks individuais possam frequentemente ter atributos indesejáveis. Isso pode ser atenuado seguindo o princípio geral de usar vários benchmarks juntos para obter uma imagem mais ampla e confiável do desempenho.
Um bom benchmark deve ser o mais transparente possível, com uma descrição clara do que o benchmark está testando e seus métodos de teste. No caso de benchmarks baseados em aplicativos, isso permite que os compradores entendam se as cargas de trabalho sendo usadas correspondem ao uso de sua organização. Sem transparência suficiente, também pode surgir a questão de saber se os testes são selecionados para destacar uma arquitetura particular em detrimento de outra.
Nem todos os benchmarks baseados em aplicativos são iguais
Os testes em benchmarks baseados em aplicativos devem representar as cargas de trabalho que são mais relevantes para a organização. Por exemplo, se 30-50% de um benchmark vem de aplicativos que raramente são usados em um ambiente comercial, então essa pontuação provavelmente não é relevante. Considere o benchmark na Figura 2, que se baseia principalmente em cargas de trabalho do tipo consumidor e tem uma baixa porcentagem de uso de aplicativos de escritório. Portanto, esse benchmark provavelmente não seria útil para a maioria das organizações comerciais.
Alguns benchmarks baseados em aplicativos medem o desempenho de aplicativos de prateleira, mas podem não representar a versão do aplicativo implantado na organização ou incluir as otimizações de desempenho mais recentes dos fornecedores de software. É aqui que entram os benchmarks sintéticos.
Avaliando o potencial de desempenho de uma plataforma
Ao contrário dos benchmarks baseados em aplicativos, benchmarks sintéticos medem o desempenho geral potencial de uma plataforma específica. Embora os benchmarks de aplicativos mostrem o quão bem uma plataforma é otimizada para certas versões de certos aplicativos, eles nem sempre são um bom indicador do desempenho de novos aplicativos. Por exemplo, muitas soluções de videoconferência usam vários núcleos de CPU para executar funções, como o uso de fundos virtuais. Benchmarks sintéticos que medem a capacidade multithread de uma plataforma podem ser usados para prever quão bem uma plataforma pode entregar esta nova funcionalidade.
Com benchmarks sintéticos, é importante evitar o uso de uma medida estreita de desempenho. Processadores individuais, mesmo na mesma família, podem variar em como lidam com até mesmo um pequeno trecho de código. Uma pontuação de benchmark sintética deve incluir vários testes individuais, executando mais linhas de código que exercem diferentes cargas de trabalho. Isso fornece uma visão muito mais ampla do desempenho da plataforma.
A multitarefa é difícil de comparar
Os benchmarks de aplicativos têm dificuldade em simular a carga de trabalho do desktop de um funcionário de escritório multitarefa moderno. A razão para isso é que a execução de vários aplicativos simultaneamente pode adicionar uma margem maior de erro de teste do que simplesmente testar um aplicativo por vez. Os aplicativos sintéticos que medem o poder de processamento multitarefa bruto de uma plataforma são um bom proxy para as demandas dos usuários multitarefas de hoje.
Uma prática recomendada é considerar as pontuações de benchmark baseadas em aplicativo e sintéticas juntas. Combinando pontuações usando uma média geométrica, você pode levar em conta as diferentes escalas de pontuação de diferentes benchmarks. Isso fornece a melhor imagem de desempenho para uma plataforma específica, considerando os aplicativos usados hoje e prevendo o futuro.
Outras Considerações Importantes
Os benchmarks são uma parte importante da avaliação do sistema. No entanto, essas ferramentas poderosas podem ter algumas limitações importantes:
- O desempenho de benchmark medido pode variar de acordo com o sistema operacional (SO) e a versão do aplicativo – certifique-se de que essas versões correspondam ao que está em uso em seu ambiente.
- Outras condições podem afetar as pontuações, como tarefas em segundo plano, temperatura ambiente e recursos do sistema operacional, como habilitação de segurança baseada em virtualização (VBS). Novamente, certifique-se de que as condições sejam as mesmas e correspondam às suas implantações.
- Alguns usuários podem usar aplicativos e funções de nicho relativamente não cobertos pelos benchmarks. Considere aumentar as pontuações de benchmark com medições do usuário e correlacioná-las com pontuações de benchmark sintéticas.
Cuidado com o erro de medição
Qualquer medição terá uma margem de “erro de medição”, ou seja, quanto pode variar de um teste para outro. A maioria dos benchmarks tem um erro de medição geral na faixa de 3-5%, causado por uma variedade de fatores, incluindo as limitações de tempo de medição, o “efeito borboleta” de pequenas mudanças nas tarefas de fundo do sistema operacional, etc. Uma maneira de superar esse erro seria será medir os resultados cinco vezes, descartar as pontuações mais altas e mais baixas e obter a média das três pontuações restantes.
É importante considerar o erro de medição ao definir os requisitos nas requisições de compra. Se uma pontuação de X se correlaciona bem com a satisfação do usuário, a requisição deve estipular que as pontuações devem estar dentro [X-Epsilon, Epsilon] onde épsilon é o erro de medição conhecido. Quando o epsilon não é conhecido, é razoável supor que esteja na faixa de 3-5% da pontuação desejada.
Conclusão
Avaliar corretamente o desempenho não é uma tarefa unidimensional. Existem várias técnicas que podem ser usadas por uma organização para determinar qual sistema atenderia melhor às suas necessidades. Usar uma pontuação de benchmark estreita pode levar a conclusões incorretas, enquanto o melhor quadro geral de desempenho vem da observação de uma ampla gama de benchmarks baseados em aplicativos e sintéticos.
A última e melhor etapa em qualquer avaliação é permitir que grupos de usuários “testem” os sistemas em seu ambiente de trabalho real. Não importa quão bem um sistema pontue em benchmarks ou em scripts de aplicativo, os usuários devem estar satisfeitos com sua experiência. Quer você use benchmarks, scripts de aplicativos ou testes organizacionais para medir o desempenho, a série de processadores AMD Ryzen PRO 4000 oferece novos níveis de velocidade e eficiência para encantar os usuários de hoje. Aprenda como obter o desempenho do notebook para atender aos requisitos de computação de hoje, junto com a capacidade de atender às futuras demandas de negócios.
Para obter mais informações sobre como os processadores AMD Ryzen PRO podem atender às necessidades de desempenho de sua organização, visite: https://www.amd.com/en/processors/laptop-processors-for-business ou https: //www.amd. com / en / ryzen-pro