Enviar mensagem
Contacte-nos
LEO

Número de telefone : 13486085502

Uma semana enorme para o braço – em Data Center demasiado

June 29, 2020

Foi uma semana enorme para o braço, e não somente porque Apple anunciou o começo do interruptor dos processadores de Intel x86 a suas próprias microplaquetas Braço-baseadas em seus computadores do Mac. A organização não lucrativa Top500 da classificação do informática de alto rendimento igualmente anunciou esta semana que pela primeira vez na história, o super-computador o mais rápido do mundo está posto por microplaquetas do braço.

Adicione dois desenvolvimentos mais grandes para o braço no centro de dados anunciou esta semana. Como você sabe provavelmente até agora, a raça para produzir o refrigerador, uns servidores mais eficientes tomou uma volta longe da lei de Gordon Moore do cofundador de Intel e para o sonho de Sophie Wilson. Santa Clara-baseou o ampère que computa, a partida da microplaqueta do servidor do braço formada pelo presidente Renee James de ex-Intel que apenas lançou em março seu processador central do braço de Altra de 80 núcleos, anunciou que a amostra de um processador máximo de Altra de 128 núcleos começará no quarto trimestre. Focalizado em quadrado em fornecedores da nuvem do hyperscale, o ampère projetou a peça competir com a platina 8160 do Xeon de Intel (lista sugerida $9.899) e o Epyc 7742 de AMD ($6.950) no desempenho.

Igualmente esta semana, o Cambridge, empresa com sede no Reino Unido conhecida acima até o ano passado como Kaleao e reestruturada em dezembro passado como os sistemas de bambu, disse que liberaria seu primeiro servidor do braço 1U, a série de B1000N, no terceiro quarto. O servidor é projetado para ambientes da baixa potência, tais como centros de dados da borda.

De repente o líder do desempenho

A “emergência” da arquitetura do processador do braço em centros de dados por nossa própria contagem realiza-se já bem em seu quinto ano. Tanto sobre a arquitetura e a construção de centros de dados modernos tem diretamente ou derivado indiretamente da arquitetura do processador x86 criou originalmente para PCes. Mas a evolução do braço neste espaço foi lenta mas constante.

O desempenho do núcleo 128 Altra novo do ampère máximo está apontando para o território do super-computador. Lá, platina do Xeon de Intel 8160 poderes nove sistemas no Top500 o mais atrasado.

“Em um nível elevado, nós estamos entregando tanto mais desempenho do que Intel está em uma base por-processador central,” Jeff Wittich, o VP superior do ampère para produtos, disse. Os números crus não estão para fora ainda, mas Wittich está reivindicando o ganho do desempenho 2.2x contra os processadores x86 similares, e a microplaqueta de Intel do ampère da escolha para comparar sua parte nova contra foi os 8160.

Altra máximo será soquete-compatível com 80 o núcleo Altra, que reivindicou a contagem a mais alta do núcleo do braço. Wittich afirmou que o processador de 128 núcleos manterá a escalabilidade linear, significando que o desempenho-por-núcleo não deixará cair fora gradualmente como aumentos da contagem do núcleo.

Computação do ampèrebraço chip.jpg do altra do ampère

Se sua reivindicação guarda verdadeiro, que seria um desenvolvimento bem-vindo desde maio de 2019. Em um estudo publicou que o mês [pdf], uma universidade do desempenho comparado equipe de Bristol do que era então o primeiro super-computador Braço-baseado, um escuteiro Isambard dublado sistema de Cray XC50 e posto por processadores do braço de Marvell ThunderX2, contra as máquinas de Cray com as especificações similares, incluindo um construídas na platina de Xeon de 28 núcleos 8176 processadores.

A equipe de Bristol encontrou que a microplaqueta de Marvell sofreu de escalar o declive da eficiência, especialmente após uma contagem do nó de 16. Em 64 nós do servidor, escalar a eficiência para o processador Braço-baseado deixou cair abaixo de 80 por cento, quando as microplaquetas de Intel ficaram toda acima de 100 por cento.

Os testes do ampère são baseados ao contrário em contagens do núcleo e da linha, não contagens do nó. Ainda, se que Wittich disse provou verdadeiro, significaria que que arma-se os coordenadores do processador superaram um pulso aleatório sério que poderia ter tornado seus produtos não-competitivos no espaço da HPC.

“Nosso foco foi nuvem, assim que nós estamos aperfeiçoando tudo para nosso ambiente da nuvem,” Wittich disse o DCK. “Mas muitas coisas que nós estamos fazendo lá seriam ingualmente aplicáveis a um super-computador altamente escalável. Assim nós veremos o interesse lá certamente. Não há nada que o impossibilita.”

O ampère aponta trazer Altra máximo na produção de volume geral em meados de 2021.

Panda do discrição

“Muitas empresas lá fora já estão pondo processadores do braço em seus servidores. HPE, Supermicro, Lenovo têm tudo obtido,” Tony Craythorne, CEO dos sistemas de bambu, observou. “Mas tudo que fez é obstruído literalmente uma microplaqueta do braço na arquitetura x86. Isso pode dar-lhe alguns dos benefícios do braço — reduzirá o poder e refrigerar — mas não o dará algum dos benefícios do processamento, do I/O, e da capacidade da taxa de transferência, onde o braço tem uma vantagem maciça.”

Seu ponto era que o bambu introduzia não apenas um servidor com Intel ou um processador de AMD substituído com braço, mas uma arquitetura completamente nova construído em torno deste estilo do processador. Mostrando algum do esforço com que seu nome crafted, chama o arquitetura projetada do braço nó paralelo, ou a PANDA.

“Nosso produto hoje pode salvar um cliente até 50 por cento de seus custos de aquisição em um mínimo (e nele poderia ir mesmo mais alto), 75 por cento de seu consumo de energia, e aproximadamente 80 por cento de seu espaço da cremalheira devido à densidade que nós podemos obter em um fatora de formulários muito pequeno,” Craythorne disse o DCK.

Embora a arquitetura de bambu esteja sendo projetada para o que chamou escalabilidade do “mini-super-computador”, pelo menos nesta fase inicial que escala começos da parte inferior acima. Cada nó de bambu do servidor pode conter uma ou dois lâminas, com cada lâmina que contém quatro unidades de processamento completas. Uma caixa 1U contém oito servidores de Linux, cada um com memória dedicada e armazenamento. Planos de bambu para produzir no fim deste ano um produto 4U.

“Parte da razão nós estamos lançando-a como um 1U [é] que nós compreendemos que esta tecnologia é nova,” Craythorne disse. “Todos tem um sistema de legado de Intel. Ninguém apenas que vai jogar para fora isso e ir gastar $150-200,000 em um sistema 4U. Podem querer tentá-lo apenas. Querem algo que é fácil de comprar, fácil vender, barato para tentar, assim que podem então ver se está indo trabalhar para eles.”

Pelo “baixo custo” Craythorne significou $9.995. Quando 1U um servidor típico da baixa potência x86 puder vender para abaixo $1.500, cada um “nó” pode somente conter um único processador central do quadrilátero-núcleo. O CEO de bambu disse-nos que sua equipe usou a calculadora dos custos totais de propriedade de AWS para calcular o custo de três anos de operar uma cremalheira de oito servidores de 2U Dell PowerEdge R740XD que totalizam 16kW da capacidade. A avaliação de três anos de TCO de AWS era aproximadamente $560.000.

Embora o bambu tenha para sustentar ainda um período de experiência de três anos real, a empresa reivindica uma cremalheira similarmente de execução de servidores de B1008N incorreria aproximadamente $200.000 durante o mesmo período.

Há poucos estudos de TCO para os servidores do braço com que para comparar as projeções do bambu. Uma análise 2014 cartucho 64-bit do servidor ARMv8 de Hewlett-Packard (agora HPE) do primeiro, o ProLiant M400, pelo analista Patrick Moorhead [pdf] pode ter ajustado pelo menos algum precedente. Embora o M400 fosse um “cartucho” um pouco do que um 1U, quando usado em uma encenação do servidor da web, Moorhead projetou-se que TCO de três anos do M400 seria 35 por cento mais baixo do que TCO de um servidor similarmente de execução de 1U x86. A pesquisa de Moorhead incluiu a entrada dos laboratórios nacionais de Sandia.

Craythorne afirmou que um B1008N poderia salvar clientes até 50 por cento em custos de aquisição, pelo menos 75 por cento no consumo de energia, e 80 por cento do espaço da cremalheira por causa de uma densidade mais alta do servidor. Embora dissesse sua empresa tinha conduzido testes internos e os gráficos produzidos para indicar aqueles testes envolveram avaliações de desempenho publicamente conhecidas, o bambu tem para liberar ainda números duros, mas Craythorne disse que faria tão em um futuro próximo.

Igualmente admitiu que essa parte de TCO de bambu poderia ser gastada em recompiling algumas aplicações projetadas originalmente para que x86 corra no braço.

Cada processador do braço é uma aplicação de processar a arquitetura que contém a propriedade intelectual licenciada de Softbank Grupo-possuiu terras arrendadas de braço e fabrica geralmente por um fabricante da terceira. Em consequência, quase cada processador do braço pode ser dito ter sua própria arquitetura, pelo menos tanto que a parte não-licenciada é referida. O bambu chama sua própria panda da versão. Naturalmente, sendo um PC em seu passado distante, omite os portos frequentemente necessários da expansão, saindo atrás de dois pares das portas ethernet de QSFP (uma para cada lâmina).

Sistemas de bambuservidor de bambu inside.jpg da panda

“Esta é a parte fundamental que muitos povos se esforçam para compreender sobre nosso produto,” admitiu Craythorne. Na panda, o processador central é limitado a controlar e a executar a aplicação, com acesso à GOLE e à memória permanente (NVMe). Mas as tarefas dos trabalhos em rede e do armazenamento são seguradas exclusivamente por um co-processador, e o interruptor de rede incorporado substitui um interruptor da parte--cremalheira.

“Nós obtivemos um interruptor L3 deobstrução dentro de cada única lâmina com um pedaço dos trabalhos em rede dentro da lâmina, “notamos Siobhan Ellis, o diretor do bambu da gestão de produtos. Tão até certo ponto nós não precisamos de enviar o tráfego de rede fora da lâmina.” Opcionalmente, ambos os portos de QSFP em uma lâmina podem ser conectados a um interruptor, ou um porto pode ser conectado a um interruptor e ao outro ao ao lado da lâmina. “Que reduz no número de interruptores externos que você precisa na cremalheira.”