CCF HPC China 2021论文集电子版(下载)
共 3608字,需浏览 8分钟
·
2022-01-01 08:36
来源:hpcchina 2021
Beacon+:面向 E 级超级计算机的轻量级端到端 I/O 性能监控与分析诊断系统 1 有限体积近岸海洋模式 FVCOM 的并行 I/O 优化 13 面向航空航天领域的多租户高性能集群调度器设计 21 带权图的网络能量研究与应用 29 基于深度神经网络的 Eikonal 方程计算加速技术 37 Aware:计算通信和位置感知的深度学习自适应分布式并行训练方法 50 基于性能预测的混部集群负载调度策略 61 一种面向大规模并发的 Gatherv 优化方法 (An optimization method of Gatherv for large scale concurrency) 77 基于 LSTM 时间预测网络和遗传算法的集群资源优化分配策略研究 85 数据密集型超算现状、挑战以及未来发展趋势 96 基于“AI+HPC”的第一原理计算时间预测及其在社区平台和并行计算中的应用 113 非结构有限体积 CFD 计算的网格重排序优化 123 L2shaping:一个流量整形转发工具 132 面向 CFD 的 GPU 资源管理 141 面向 Lustre 集群存储的错误日志分析及系统优化 151 基于深度学习的硬件计数器复用估计算法 166 基于包络面重构的大规模粒子并行绘制算法 176 基于 Spark 平台的网络游戏用户流失预测方法 183 GLEX-Allreduce:针对天河系统上中、小消息 Allreduce 的性能优化 191 基于新一代神威超算的计算流体力学 Palabos 软件的并行优化 199 Dynamic Metadata Network Sparse PCA for Cancer Subtype Biomarkers Screening 209 基于位图的度量空间索引支撑点穷举选择算法并行加速研究 217 异构高性能计算机上的路径依赖期权的 Monte Carlo 并行定价算法 226 并行程序中同步瓶颈的检测和优化方法 238 MSV-Net:面向科学模拟体面混合数据的超分辨率重建方法 249 面向 CFD 应用的 Intel 持久内存性能评估 258 基于静态分析的 Go 语言并发缺陷检测 266 Select-Baseline for Few-Shot Disease Subtype Prediction 278 基于作业名层次化聚类的作业运行时间预测方法 287 面向飞腾处理器的多线程 dgemv 可复现设计与实现 298 面向高校校级高性能计算系统的应用软件容器化管理规范 310 SlurmX:基于 Slurm 使用面向对象设计方法重构的任务调度系统 317 基于 Linux 的超算系统中 Windows 应用程序运行环境探究 329 一种基于作业记账日志的并行作业特征分析工具 JobCAT 334 基于神经网络模型的 stencil 循环最优分块大小预测 346 并行规约与扫描原语在 ReRAM 架构上的性能优化 359 基于 Langevin 动力系统的组合优化求解系统研究 371 基于 ARMv8 处理器的高性能图像处理算法实现与优化研究 380 基于 ARM 的图像几何变换算法库实现和优化技术研究 389 基于 ARM 架构的中值滤波算法优化 398 A Systematic Study on Benchmarking AI Inference Accelerators 406 大规模海洋数据同化的并行优化 422 基于图结构的强化学习拥塞控制方案 432 UltraAcc:基于 FPGA 流水架构的低功耗高性能 CNN 加速器定制设计 441 并行可视化中的通信方法研究 451 针对冗余零的跨平台细粒度性能分析工具 462Research on Chinese Herbal Medicine Plant Image Retrieval Based on Deep Learning and Hashing Learning 472 三维非定常脉冲真空弧等离子体羽流 DSMC/PIC 混合数值模拟的并行计算 483 一种基于负载感知的自适应的纠删码编解码加速方法 491 MP-DPS:基于节点归并和路径预测的深度学习自适应分布式并行方法 505 使用机器学习方法预测作业运行时间:以高斯程序为例 519 基于相关性感知的结构网格数据统计可视分析方法 529 非结构高精度 DG 应用的 CPU/GPU 异构并行计算 539 ARMv8 多核处理器上 OpenMP 结构实现开销评估 548 基于 ARMv8 处理器的实数 FFT 实现与优化研究 558
1、《如何实现HPC“低”碳计算》 2、《地球系统模式CAS-ESM2主要进展》 3、《2021边缘计算与混合云技术赋能人工智能》 4、《多架构大规模并行保辛结构电磁全动理学等离子体模拟》 5、《基于存算融合的科研创新计算基础设施构建中的若干问题》 6、《不确定性量化与科学计算》
3、《CCF HPC China 2021大会论坛资料》
下载链接:
4、《英特尔HPC China 2021 AI实践日》
下载链接:
1-英特尔-HPCAI 的融合趋势及基于英特尔® 架构的应用实践.pdf
2-第四范式-基于现代存储架构的新型数据库 OpenMLDB 优化实践.pdf
3-联想-联想人工智能开放创新平台.pdf
5-宝德-中科院空天院HPC&AI 集群案例分享.pdf
6-烽火超微-烽火聚焦算力,释放潜能——烽火超微AI超算解决方案.pptx
5、《2021 Intel HPC China论坛:oneAPI实践》
下载链接:
1、英特尔-英特尔® oneAPI DPC++.pdf 2、超集-基于容器云平台的oneAPI实践.pdf 3、景派科技-初探利用oneAPI进行加速.pdf 4、oneAPI 提供跨架构性能的单一编程模式.pdf
6、《2021 HPC China论坛:HPC大咖说(上)》
下载链接:
2021 Intel HPC China:HPC大咖说(上)
1、H3C-H3C 服务器液冷技术发展.pdf
2、宝德-宝德HPC&AI 解决方案.pdf
3、并行-超算云加速科研创新.pdf
4、超集-容器云技术下的oneAPI应用.pdf
5、景派-利用英特尔® intrinsic函数做加速.pdf
6、坤前-基于第三代英特尔® 至强® 可扩展处理器的高性能计算解决方案.pdf
7、浪潮-气象气候应用在第三代英特尔® 至强® 可扩展处理器上的性能测评.pdf
7、《2021 HPC China论坛:HPC大咖说(下)》
下载链接:
2021 Intel HPC China:HPC大咖说(下)
1、联想-联想温水水冷系统及案例.pdf
2、英特尔-DPC++ 编程模型.pdf
3、英特尔-聊聊基准测试,英特尔帮你算.pdf
4、英特尔-英特尔® 架构AI优化方案及Demo实战分享.pdf
5、英特尔-运用第三代英特尔® 至强® 架构,测试Alphafold2最大吞吐量.pdf
7、优刻得-英特尔助力UCloud快杰云主机实现.pdf
下载链接:
1、AMD Zen3处理器架构详解
2、英特尔CPU Alder Lake架构解读
3、IBM处理器Telum架构详解
本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
电子书<服务器基础知识全解(终极版)>更新完毕,知识点深度讲解,提供182页完整版下载。
获取方式:点击“阅读原文”即可查看PPT可编辑版本和PDF阅读版本详情。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。