AMD Hadirkan Akselerator HPC Untuk Riset Ilmiah

AMD Hadirkan Akselerator HPC Untuk Riset Ilmiah 1

Surabaya, (bisnisnasional.com) – AMD kembali mengumumkan akselerator AMD Instinct MI100 baru, GPU HPC terkencang di dunia dan GPU server x86 pertama yang melampaui hambatan performa 10 teraflop (FP64 ).

Didukung oleh platform komputasi akselerasi baru dari Dell, Gigabyte, HPE, dan Supermicro, MI100, dikombinasikan dengan CPU AMD EPYC dan platform software terbuka ROCm 4.0, dirancang untuk mendorong penemuan baru menjelang era exascale.

Dibuat dari AMD CDNA baru, Instinct MI100 memungkinkan kelas sistem akselerasi baru untuk HPC dan AI ketika dipasangkan dengan prosesor AMD EPYC Generasi Kedua. MI100 menawarkan performa puncak FP64 hingga 11,5 TFLOPS untuk HPC dan hingga 46,1 TFLOPS performa Matriks FP32 puncak untuk beban kerja AI dan machine learning.

Dengan teknologi AMD Matrix Core baru, MI100 juga memberikan peningkatan hampir 7x dalam performa titik mengambang puncak teoritis FP16 untuk beban kerja pelatihan AI dibandingkan dengan akselerator generasi sebelumnya dari AMD.

Corporate vice president, Data Center GPU and Accelerated Processing AMD, Brad McCredie menyampaikan, saat ini pihaknya mengambil langkah besar dalam perjalanan menuju komputasi exascale saat menghadirkan AMD Instinct MI100 – GPU HPC.

“Dengan target tepat pada beban kerja dalam komputasi ilmiah, akselerator terbaru kami, bila dikombinasikan dengan platform software terbuka AMD ROCm, dirancang untuk memberikan daya unggul bagi para ilmuwan dan peneliti untuk pekerjaan mereka di HPC,” katanya.

Pengembang software AMD ROCm menyediakan dasar untuk komputasi exascale. Sebagai sebuah perangkat open source yang terdiri dari compilers, programming APIs dan libraries, ROCm digunakan oleh pengembang software exascale untuk membuat aplikasi performa tinggi.

ROCm 4.0 telah ditingkatkan untuk memberikan performa pada skala untuk sistem berbasis MI100. ROCm 4.0 mengupgrade compiler menjadi open source dan menyatu untuk mendukung OpenMP 5.0 dan HIP.

Framework PyTorch dan Tensorflow, yang telah dioptimalkan dengan ROCm 4.0, kini dapat mencapai performa yang lebih tinggi dengan MI100. ROCm 4.0 adalah penawaran terbaru untuk pengembang aplikasi HPC, ML dan AI yang memungkinkan mereka membuat performa software portabel.

Sementara itu, director of science, Oak Ridge Leadership Computing Facility, Bronson Messer menjelaskan bahwa pihaknya menerima akses awal ke akselerator MI100, dan hasil awalnya sangat menggembirakan. Pihaknya melihat peningkatan performa yang signifikan, hingga 2-3x dibandingkan dengan GPU lainnya.

“Yang juga penting untuk diketahui adalah pengaruh software terhadap performa. Fakta bahwa platform software terbuka ROCm dan alat pengembang HIP adalah open source dan bekerja pada beragam platform, itu adalah sesuatu yang hampir membuat kami terobsesi sejak kami meluncurkan sistem CPU / GPU hybrid pertama,” ujarnya.

Kemampuan dan fitur utama akselerator AMD Instinct MI100 meliputi All-New AMD CDNA Architecture, dirancang untuk memberi daya pada AMD GPU untuk era exascale dan akselerator MI100, arsitektur AMD CDNA menawarkan performa dan efisiensi daya yang luar biasa.

Leading FP64 and FP32 Performance for HPC Workloads, menghadirkan 11,5 FP64 TFLOPS performa puncak dan 23,1 FP32 TFLOPS, memungkinkan ilmuwan dan peneliti di seluruh dunia untuk mempercepat penemuan dalam industri termasuk ilmu hayat, energi, keuangan, akademisi, pemerintah, pertahanan, dan lainnya.

All-New Matrix Core Technology for HPC and AI, memiliki performa supercharged untuk berbagai operasi matriks presisi tunggal dan campuran, seperti FP32, FP16, bFloat16, Int8 dan Int4, yang dirancang untuk meningkatkan konvergensi HPC dan AI.

2 Gen AMD Infinity Fabric Technology, Instinct MI100 menyediakan 2x bandwidth I/O puncak peer-to-peer (P2P) melalui PCIe® 4.0 dengan hingga 340 GB/dtk bandwidth agregat per kartu dengan tiga AMD Infinity Fabric Links.

Dalam sebuah server, GPU MI100 dapat dikonfigurasi dengan hingga dua kumpulan GPU quad yang terhubung sepenuhnya, masing-masing menyediakan hingga 552 GB/dtk bandwidth I/O P2P untuk berbagi data dengan cepat.

Ultra-Fast HBM2 Memory, menampilkan memori HBM2 bandwidth tinggi 32 GB dengan kecepatan rate clock 1.2 GHz dan memberikan bandwidth memori sangat tinggi 1,23 TB/dtk untuk mendukung kumpulan data besar dan membantu menghilangkan hambatan dalam memindahkan data masuk dan keluar dari memori.

Support for Industry’s Latest PCIe Gen 4.0 didesain dengan dukungan teknologi PCIe Gen 4.0 terbaru yang menyediakan bandwidth data transportasi teoretis puncak hingga 64 GB/dtk dari CPU ke GPU.

Akselerator AMD Instinct MI100 diharapkan pada akhir tahun dalam sistem dari mitra OEM dan ODM utama di pasar enterprise, termasuk Dell, Gigabyte, Hewlett Packard Enterprise (HPE), serta Supermicro. (indra)

Check Also

Komputasi Adaptif Dorong Evolusi Otomasi Otomotif 5

Komputasi Adaptif Dorong Evolusi Otomasi Otomotif

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Situs ini menggunakan Akismet untuk mengurangi spam. Pelajari bagaimana data komentar Anda diproses