Dengan pesatnya peningkatan aplikasi AI, yang dipimpin oleh model seperti ChatGPT, permintaan akan daya komputasi pun meroket. Untuk memenuhi tuntutan komputasi yang semakin meningkat di era AI, H3C Group, di bawah payung Tsinghua Unigroup, baru-baru ini meluncurkan 11 produk baru dalam seri H3C UniServer G6 dan HPE Gen11 di NAVIGATE Leader Summit 2023. Produk server baru ini menciptakan matriks komprehensif untuk AI di berbagai skenario, menyediakan platform dasar yang kuat untuk menangani data besar dan algoritma model, serta memastikan pasokan sumber daya komputasi AI yang memadai.
Matriks Produk yang Beragam untuk Mengatasi Berbagai Kebutuhan Komputasi AI
Sebagai pemimpin dalam komputasi cerdas, H3C Group telah terlibat secara mendalam di bidang AI selama bertahun-tahun. Pada tahun 2022, H3C mencapai tingkat pertumbuhan tertinggi di pasar akselerasi komputasi Tiongkok dan mengumpulkan total 132 peringkat pertama di dunia dalam tolok ukur AI MLPerf yang terkenal secara internasional, yang menunjukkan keahlian dan kemampuan teknisnya yang kuat.
Memanfaatkan arsitektur komputasi canggih dan kemampuan manajemen daya komputasi cerdas yang dibangun di atas fondasi komputasi cerdas, H3C telah mengembangkan komputasi cerdas andalan H3C UniServer R5500 G6, yang dirancang khusus untuk pelatihan model skala besar. Mereka juga memperkenalkan H3C UniServer R5300 G6, mesin komputasi hibrid yang cocok untuk skenario inferensi/pelatihan skala besar. Produk-produk ini semakin memenuhi beragam kebutuhan komputasi dalam berbagai skenario AI, sehingga memberikan cakupan komputasi AI yang komprehensif.
Komputasi Cerdas Unggulan Dirancang untuk Pelatihan Model Skala Besar
H3C UniServer R5500 G6 memadukan kekuatan, konsumsi daya rendah, dan kecerdasan. Dibandingkan dengan generasi sebelumnya, ia menawarkan kekuatan komputasi tiga kali lipat, mengurangi waktu pelatihan sebesar 70% untuk skenario pelatihan model skala besar GPT-4. Hal ini berlaku untuk berbagai skenario bisnis AI, seperti pelatihan skala besar, pengenalan suara, klasifikasi gambar, dan terjemahan mesin.
Kekuatan: R5500 G6 mendukung hingga 96 inti CPU, memberikan peningkatan kinerja inti sebesar 150%. Dilengkapi dengan modul 8-GPU NVIDIA HGX H800 baru, yang memberikan daya komputasi 32 PFLOPS, menghasilkan peningkatan 9x dalam kecepatan pelatihan model AI skala besar dan peningkatan 30x dalam kinerja inferensi AI model skala besar. Selain itu, dengan dukungan jaringan PCIe 5.0 dan 400G, pengguna dapat menerapkan cluster komputasi AI berperforma lebih tinggi, sehingga mempercepat adopsi dan penerapan AI di perusahaan.
Intelijen: R5500 G6 mendukung dua konfigurasi topologi, secara cerdas beradaptasi dengan berbagai skenario aplikasi AI dan mempercepat pembelajaran mendalam dan aplikasi komputasi ilmiah, sehingga sangat meningkatkan pemanfaatan sumber daya GPU. Berkat fitur GPU multi-instance pada modul H800, satu H800 dapat dibagi menjadi 7 instance GPU, dengan kemungkinan hingga 56 instance GPU, masing-masing memiliki sumber daya komputasi dan memori independen. Hal ini secara signifikan meningkatkan fleksibilitas sumber daya AI.
Jejak Karbon Rendah: R5500 G6 sepenuhnya mendukung pendinginan cair, termasuk pendinginan cair untuk CPU dan GPU. Dengan PUE (Power Usage Effectiveness) di bawah 1,1, ini memungkinkan “komputasi keren” di tengah lonjakan komputasi.
Perlu disebutkan bahwa R5500 G6 diakui sebagai salah satu dari “10 Server Berkinerja Tinggi Luar Biasa tahun 2023″ dalam “Peringkat Kekuatan 2023 untuk Kinerja Komputasi” setelah dirilis.
Mesin Komputasi Hibrid untuk Pencocokan Fleksibel antara Permintaan Pelatihan dan Inferensi
H3C UniServer R5300 G6, sebagai server AI generasi berikutnya, menawarkan peningkatan signifikan pada spesifikasi CPU dan GPU dibandingkan pendahulunya. Ini membanggakan kinerja luar biasa, topologi cerdas, serta kemampuan komputasi dan penyimpanan terintegrasi, sehingga cocok untuk pelatihan model pembelajaran mendalam, inferensi pembelajaran mendalam, dan skenario aplikasi AI lainnya, yang secara fleksibel menyesuaikan kebutuhan pelatihan dan komputasi inferensi.
Kinerja Luar Biasa: R5300 G6 kompatibel dengan GPU kelas perusahaan NVIDIA generasi terbaru, memberikan peningkatan kinerja 4,85x dibandingkan generasi sebelumnya. Ini mendukung berbagai jenis kartu akselerasi AI, seperti GPU, DPU, dan NPU, untuk memenuhi kebutuhan daya komputasi AI yang heterogen dalam berbagai skenario, sehingga memberdayakan era kecerdasan.
Topologi Cerdas: R5300 G6 menawarkan lima pengaturan topologi GPU, termasuk HPC, AI paralel, AI serial, akses langsung 4 kartu, dan akses langsung 8 kartu. Fleksibilitas yang belum pernah ada sebelumnya ini sangat meningkatkan kemampuan adaptasi terhadap berbagai skenario aplikasi pengguna, mengalokasikan sumber daya secara cerdas, dan mendorong pengoperasian daya komputasi yang efisien.
Komputasi dan Penyimpanan Terintegrasi: R5300 G6 secara fleksibel mengakomodasi kartu akselerasi AI dan NIC cerdas, yang menggabungkan kemampuan pelatihan dan inferensi. Mendukung hingga 10 GPU berukuran ganda dan 24 slot hard drive LFF (Large Form Factor), memungkinkan pelatihan dan inferensi simultan pada satu server dan menyediakan mesin komputasi hemat biaya untuk lingkungan pengembangan dan pengujian. Dengan kapasitas penyimpanan hingga 400TB, sepenuhnya memenuhi kebutuhan ruang penyimpanan data AI.
Dengan pesatnya perkembangan AI, kekuatan komputasi terus-menerus dibentuk ulang dan ditantang. Peluncuran server AI generasi berikutnya menandai tonggak sejarah lain dalam komitmen H3C Group terhadap teknologi “kecerdasan inheren” dan upaya berkelanjutannya untuk evolusi komputasi cerdas.
Melihat ke masa depan, dengan dipandu oleh strategi “Cloud-Native Intelligence”, H3C Group menganut konsep “pragmatisme yang teliti, memberikan era dengan kecerdasan.” Mereka akan terus mengembangkan lahan subur bagi komputasi cerdas, mengeksplorasi skenario penerapan AI tingkat mendalam, dan mempercepat hadirnya dunia cerdas dengan daya komputasi yang siap menghadapi masa depan dan dapat beradaptasi.
Waktu posting: 04-Juli-2023