当前位置：首页 > 其他 > 正文内容

LS-DYNA及高性能核算评测

邻居的猫1个月前 (12-09)其他637

LS-DYNA x86_64 二进制文件

大多数版别 - ifort + MKL

可在 Intel Xeon 和 AMD EPYC 芯片上运转
在两种芯片上经过相同的输入发生相同的显式成果 (关于隐式，MKL 需求特别的环境变量）

附加版别

AOCC + AOCL - 可在英特尔至强和 AMD EPYC 芯片上运转
在两种芯片上经过相同的输入生成完全相同的显式成果 (隐式 AOCL 需求特别的环境变量）

4 种不同构建的功能比较、 ifort（AVX2、AVX512）和 aocc（AVX2、AVX512）

显式 - car2car（240 万元素，30 毫秒）

LS-DYNA 二进制

运用英特尔 MPI 测验
无硬件相关选项，但有指令集相关选项
不一起代/品牌的 CPU 可发生相同的数值成果

AMD EPYC 9654 (Zen4/192 内核) : car2car

AOCC AVX2 在二进制文件中功能最佳，比 ifort AVX2 快约 5%。
ifort AVX512 略快于 ifort AVX2
Zen4 是首款支撑 AVX512 的 AMD 芯片。

英特尔至强 Gold 1642（48 核）：car2car

在 4 个二进制文件中，ifort AVX2 的功能最好，比 AOCC AVX2 快约 1%。
关于两种编译器，AVX512 的功能均低于 AVX2
AOCC AVX512 在英特尔芯片上功能欠安。

AMD Zen 和英特尔至强可扩展处理器之间的数值一致性

显式剖析成果相同

分化相同
敞开 lstc_reduce

隐式 - Cycl1e6（100 万元素）

Ifort/MKL 在两种硬件上的功能最佳（环境变量设置不同）
假如没有恰当的环境变量，MKL 和 AOCL 的功能很差。
将发布 AOCC/AOCL 和 IFORT/MKL（AOCC/MKL 仅用于内部测验）
AMD 说到 AOCL 在未来的版别中不需求标志。

架构的抵触： CISC 与 RISC

CISC - 杂乱指令集核算机（x86_64 架构）

英特尔至强、AMD EPYC 等
广泛的指令集 - 强壮的核算才干

RISC - 精简指令集核算机（ARM64 架构）

ARM64、RISC-V、IBM power、MIPS、SPARC、PA 等。
底层简略指令
需求多条指令才干完结杂乱使命
下降功耗

X86_64 在数据中心/云中的主导地位

“潜在用户在看到这款 ARM CPU 的单线程速度并不比英特尔快，并且与 X86-64 不兼容时，就会不以为然。不兼容 x86-64，就会耸耸肩走开。关于一台完好的服务器来说，细小的价格差异不足以从 x86-64 转向 ARM"。

已评价的 ARM 处理器

Neon

500,000 个元素
最多运转 8 个内核 - 在单插槽和 NUMA 节点上运转

LS-DYNA 开发源

MPP 单精度
OpenMPI 4.x
ARM64 - armflang22.0.2 和 gcc
x86_64 - avx2, ifort190 和 gcc

Neon - 各中心功能

70285.png)

Apple M1 max 完成了杰出的单核和双核功能
今世 ARM 处理器功能杰出，但核算才干或许仍落后于最新的第四代 EPYC 和 Xeon 处理器。

参考资料

软件测验精品书本文档下载持续更新 https://github.com/china-testing/python-testing-examples 请点赞，谢谢！
本文触及的python测验开发库谢谢点赞！ https://github.com/china-testing/python_cn_resouce
python精品书本下载 https://github.com/china-testing/python_cn_resouce/blob/main/python_good_books.md
Linux精品书本下载 https://www.cnblogs.com/testing-/p/17438558.html

ODB-10M

1000 万元素
最多运转 8 个节点

LS-DYNA R12.1.0

MPP 单精度
禁用多线程
OpenMPI 4.x
运用 EFA 运转 Amazon 实例

ODB-10M - 按节点核算的功能

大多数轿车用户运用少于 384 个内核/使命（2-4 个节点）。
X86-64 具有双插槽
内存带宽/内核高于 arm64

ODB-10M - 价格功能

ARM V1 渠道（Graviton3）优先考虑核算才干，而不是面积和能效。

ARM 未来

火烧眉毛处理器

Ampere One - ARMv8.6，192 个内核。
Nvidia Grace - ARMv9，144 个 Neoverse-V2 内核。
Nvidia Grace Hopper - CPU + GPU 相干内存

进一步立异

TSMC 3nm 渠道 - 风闻用于 Apple M3、Graviton4
OpenMPI 5.0
扩展 arm64 的软件库

版别之间的功能

类型： ODB-10M
AMD EPYC 7V73X 64 核处理器（2 个插槽，共 120 个内核）
运用 AVX2 二进制文件
相关于 R11.2.2 单节点的功能（越高越好）

版别之间的功能

类型： ODB-10M
Intel Xeon Platinum 8168 CPU（2 个插槽，共 44 个内核）
运用 AVX2 二进制文件
相关于 R11.2.2 单节点的功能（越高越好）

定论

在未来版别中一起支撑 ifort/MKL 和 aocc/AOCL 二进制文件，以取得方针硬件的最佳功能
与 ifort 和 aocc 开发团队协作，以避免与硬件相关的数值噪声
X86_64 的核算功能依然优于 arm64。Arm64 的价格和功耗功能优于 x86-64。
现在有几种下一代 arm64 CPU，咱们将持续支撑这些硬件
现在有几种新的 CPU/GPU 同享内存体系，咱们正在探究适用于这些新硬件的新数值计划

扫描二维码推送至手机访问。

本文链接：https://www.51blog.vip/?id=650

分享给朋友：

返回列表

上一篇：LeetCode题集-5 - 最长回文子串（一）

下一篇：三着急教你爆改烂大街项目

“LS-DYNA及高性能核算评测” 的相关文章

全球 IPv4 耗尽，下个月开端收费！

哈喽咱们好，我是咸鱼 IPv4（Internet Protocol version 4）是互联网上运用最广泛的网络层协议之一，于1981年在 RFC 791 中发布，它界说了 32 位的IP地址结构和底子的协议操作。由于 IPv4 运用 32 位的地址，因而只要四十亿（4,294,967,296，...

《DNK210使用指南 -CanMV版 V1.0》第四十二章人脸口罩佩带检测试验

第四十二章人脸口罩佩带检测试验 1）试验渠道：正点原子DNK210开发板 2）章节摘自【正点原子】DNK210运用指南 - CanMV版 V1.0 3）购买链接：https://detail.tmall.com/item.htm?&id=782801398750 4）全套试验源码+手册+视...

数证杯2024-网络流量剖析

数证杯2024-网络流量剖析学习：2024数证杯初赛 - WXjzc - 博客园 1. [填空题]剖析网络流量包检材，写出抓取该流量包时所花费的秒数？（填写数字，答案格局：10） (2分) 思路：计算 --> 捕获文件特点答案：3504 2. [填空题]剖析网络流量包检材，抓取该...

云计算的应用场景,云计算的应用场景概述

云计算的应用车：云计算平台支持医疗健康数据的存储、分析和共享，推动医疗健康服务的智能化和个性化。13. 金融服务：云计算平台支持金融服务的数字化转型，提供在线银行、移动支付、保险服务等应用。14. 政府服务：云计算平台支持政府服务的数字化转型，提供在线政务、电子政务等应用。15. 智慧城市：云计算平...

区块链数据存储,技术原理与应用前景

区块链技术是一种分布式数据存储技术，其特点包括去中心化、不可篡改、透明性和安全性。在区块链中，数据被存储在一系列的“区块”中，每个区块都包含一定数量的交易记录，这些区块按照时间顺序链接在一起，形成一个连续的链式结构。以下是区块链数据存储的主要特点：1. 去中心化：区块链上的数据不是存储在一个中心化的...

区块链微信群,交流、学习与投资的桥梁

如果你想加入区块链相关的微信群，可以参考以下推荐：1. 磨链mochain社区这是一个专注于区块链技术讨论和交流的社区，不定期进行线上技术交流学习和技术分享。群内成员主要分布在北京、上海、浙江、广东等地。加入方式：扫码加微信xiongda_do，暗号：学习2. 区块链技术交流群...

LS-DYNA及高性能核算评测

LS-DYNA x86_64 二进制文件

显式 - car2car（240 万元素，30 毫秒）

AMD EPYC 9654 (Zen4/192 内核) : car2car

英特尔至强 Gold 1642（48 核）：car2car

AMD Zen 和英特尔至强可扩展处理器之间的数值一致性

隐式 - Cycl1e6（100 万元素）

架构的抵触： CISC 与 RISC

X86_64 在数据中心/云中的主导地位

已评价的 ARM 处理器

Neon

Neon - 各中心功能

参考资料

ODB-10M

ODB-10M - 按节点核算的功能

ODB-10M - 价格 功能

ARM 未来

版别之间的功能

版别之间的功能

定论

“LS-DYNA及高性能核算评测” 的相关文章

全球 IPv4 耗尽，下个月开端收费！

《DNK210使用指南 -CanMV版 V1.0》第四十二章 人脸口罩佩带检测试验

数证杯2024-网络流量剖析

云计算的应用场景,云计算的应用场景概述

区块链数据存储,技术原理与应用前景

区块链 微信群,交流、学习与投资的桥梁

Copyright © 2024-2028 51blog All Rights Reserved

ODB-10M - 价格功能

《DNK210使用指南 -CanMV版 V1.0》第四十二章人脸口罩佩带检测试验

区块链微信群,交流、学习与投资的桥梁