Đầu tiên là Ryzen 9 5900XT, 16 nhân 32 luồng dựa trên kiến trúc Zen 3, nâng cấp mạnh so với Ryzen 9 5900X, vốn chỉ có 12 nhân 24 luồng. Bên cạnh việc có thêm hẳn 4 nhân xử lý game, xung nhịp boost tối đa của nhân CPU cũng tăng lên 4.8 GHz, bộ nhớ đệm tổng cộng lên tới 72MB, TDP 105W.
Con chip socket AM4 thứ hai được giới thiệu là Ryzen 7 5800XT 8 nhân 16 luồng CPU, xung boost tối đa 4.8 GHz, 36MB cache và TDP 105W. Hai con chip này được tạo ra để phục vụ nhu cầu nâng cấp đơn giản, không phải sắm cả dàn mainboard và nâng cấp RAM DDR5 như thế hệ chip Zen 4 và Zen 5, với socket AM5, nhưng hiệu năng không hề thua kém Intel Core i7-13700K và Core i5-13600K.
Cả hai chip xử lý này sẽ được bán ra thị trường trong tháng 7 tới, hiện tại AMD chưa công bố giá bán chính thức.
CPU máy chủ EPYC Turin, nhân CPU Zen 5
Những sản phẩm chip xử lý dành cho máy chủ tên mã Turin dự kiến sẽ được bán ra thị trường vào nửa sau năm 2024. Sản phẩm cao cấp nhất sẽ sở hữu tới 192 nhân CPU kiến trúc Zen 5, tức là tổng cộng lên tới 384 luồng xử lý, lắp trên socket SP5.
So sánh hiệu năng xử lý, AMD đem sản phẩm thế hệ Turin với chỉ 128 nhân CPU, không phải sản phẩm mạnh, cao cấp và đắt tiền nhất, đem ra so sánh với sản phẩm cao cấp nhất của thế hệ CPU Xeon Sapphire Rapids, là Xeon Platinum 8592+. Việc chỉ có 64 nhân CPU trên con chip của Intel khiến sức mạnh của nó thực sự khó có thể so sánh được với EPYC Turin. Bản thân EPYC Turin sẽ tạo ra hiệu năng xử lý tăng từ 2.5 đến 5.4 lần so với Sapphire Rapids.
Những chip EPYC thế hệ 5 theo cách gọi của AMD sẽ có ít nhất 20 sản phẩm khác nhau, dựa trên cả những kiến trúc nhân CPU Zen 5 và Zen 5C. Những chip CPU máy chủ này sẽ hỗ trợ cả tốc độ RAM DDR5 6000 MT/s ECC:
- 100-000000976-09 – 12 CCD + 1 IOD (192 Zen 5C Cores / 384 Thread / 384 MB Cache / 500W)
- 100-000001152-05 – 10 CCD + 1 IOD (160 Zen 5C Cores / 320 Thread / 320 MB Cache / 360W)
- 100-000001153-09 – 8 CCD + 1 IOD (128 Zen 5C Cores / 256 Thread / 256 MB Cache)
- 100-000001249 -XX – 2 CCD + 1 IOD (32 Zen 5C Cores / 64 Threads / 64 MB Cache)
- 100-000001538-03 – 16 CCD + 1 IOD (128 Zen 5 Cores / 256 Thread / 512 MB Cache)
- 100-000001245-XX – 16 CCD + 1 IOD (128 Zen 5 Core / 256 Thread / 512 MB Cache)
- 100-000001246-02 – 12 CCD + 1 IOD (96 Zen 5 Cores / 192 Thread / 384 MB Cache)
- 100-000001341-XX – 12 CCD + 1 IOD (96 Zen 5 Cores / 192 Threads / 384 MB Cache)
- 100-000001247-12 – 8 CCD + 1 IOD (64 Zen 5 Cores / 128 Threads / 256 MB Cache)
- 100-000001247-04 – 8 CCD + 1 IOD (64 Zen 5 Cores / 128 Threads / TBD MB Cache)
- 100-000001342-XX – 8 CCD + 1 IOD (64 Zen 5 Cores / 128 Threads / 256 MB Cache)
- 100-000001538-03 – 4 CCD + 1 IOD (32 Zen 5 Cores / 64 Threads / 128 MB Cache)
- 100-000001249-02 – 2 CCD + 1 IOD (16 Zen 5 Cores / 32 Thread / 64 MB Cache)
Khi ra mắt, EPYC Turin sẽ cạnh tranh với những chip Xeon thế hệ mới, trang bị cả những nhân P-core kiến trúc Granite Rapids và E-core Sierra Forest 288 nhân của Intel.
Chip laptop Ryzen AI 300 “Strix Point”: Mạnh hơn Snapdragon X
Đương nhiên với xu hướng chip xử lý máy tính xách tay với cụm NPU tăng tốc xử lý thuật toán AI, cùng tiêu chuẩn Copilot+ PC của Microsoft với phiên bản Windows 11 24H2 sắp ra mắt nửa cuối năm nay, AMD cũng đón đầu xu hướng với thế hệ chip APU Ryzen AI 300, tên mã Strix Point. Tại sao lại là 300? Đơn giản vì thế hệ chip xử lý Lunar Lake của Intel sẽ có tên thương mại là Core Ultra 200 series, và đơn giản là 300 lớn hơn 200, vậy thôi.
Trước cả khi có Strix Point, AMD đã có những thế hệ chip xử lý laptop với nhân NPU Phoenix năm 2023, rồi kế đến là Hawk Point năm 2024 với tốc độ TOPS của NPU được cải thiện.
Với việc nền tảng Microsoft Copilot+ PC sắp ra mắt, Strix được AMD giới thiệu, với mục tiêu vô cùng rõ ràng, tối ưu sức mạnh NPU và tổng thể hiệu năng của toàn bộ con chip, tối ưu hiệu năng xử lý AI on device, nhất là những tính năng AI trong các phần mềm hay trợ lý ảo Copilot của Windows 11.
Ryzen AI 300 là thế hệ thứ 3 của những APU AI. Giờ sẽ không có những phiên bản chip U/H/HS để mô tả tiêu thụ điện năng nữa. Sẽ chỉ có hai phiên bản HX và non-HX, với TDP dao động từ 15 đến tối đa 54W, cho phép các hãng sản xuất laptop tùy chỉnh mức TDP cho phù hợp để tạo ra hiệu năng và thời lượng pin cân bằng nhất.
Bên trong một package chip Ryzen AI 300, sẽ là ba cụm nhân xử lý, ba kiến trúc:
- Nhân CPU Zen 5
- Nhân GPU RDNA 3.5
- Nhân NPU XDNA 2
Đối với nhân CPU, sản phẩm Ryzen AI 300 cao cấp nhất sẽ sở hữu tối đa 12 nhân 24 luồng CPU Zen 5 và Zen 5C, hai dạng nhân hiệu năng cao và nhân tiết kiệm điện. Nhân GPU tích hợp RDNA 3.5 tăng số lượng compute unit, phục vụ xử lý các tác vụ hay thậm chí là chơi game ổn hơn. Cuối cùng là nhân NPU XDNA thế hệ 2, với tốc độ tối đa lên tới 50 TOPS, vượt qua yêu cầu tối thiểu 40 TOPS mà Microsoft đưa ra đối với chuẩn máy tính AI Copilot+ PC.
Như anh em có thể thấy trong hình trên, trước mắt AMD mới chỉ giới thiệu hai sản phẩm cao cấp nhất của thế hệ sản phẩm AMD Ryzen AI 300: Ryzen AI 9 HX 370 và Ryzen AI 9 365.
- Phiên bản chip HX có 12 nhân 24 luông xử lý, 4 nhân Zen 5, 8 nhân Zen 5C, xung boost tối đa 5.1 GHz, 24MB L3 + 12MB L2, iGPU mới toanh Radeon 890M 16 CU, tức 1024 nhân.
- Phiên bản chip non-HX có 10 nhân 20 luồng xử lý, 4 nhân Zen 5, 6 nhân Zen 5C, xung boost tối đa 5.0 GHz, 34MB bộ nhớ đệm L2+L3, iGPU Radeon 880M 12 CU.
AMD cho biết, NPU kiến trúc XDNA 2 sở hữu những cụm nhân vận hành thuật toán AI với khả năng đa nhiệm mạnh hơn gấp đôi, phục vụ vận hành những giải pháp AI tạo sinh, vận hành mô hình ngôn ngữ nhanh hơn 5 lần so với thế hệ AI APU trước đó, Hawk Point.
Nếu như những chip Ryzen 9000 Series sẽ chỉ phải cạnh tranh với những chip Intel Ice Lake trên máy tính để bàn, thì Ryzen AI 300 Strix Point sẽ phải cạnh tranh với cùng lúc cả ba đối thủ: Intel Lunar Lake, Apple M3/M4 và Qualcomm Snapdragon X:
Những số liệu được AMD công bố, so sánh AMD Ryzen AI thế hệ 3 so với sản phẩm của Apple, của Qualcomm và Intel:
Dự kiến, AMD Ryzen AI 300 sẽ ra mắt vào tháng 7 năm nay, với những sản phẩm từ các OEM lớn:
- ASUS Zenbook S16
- ASUS Vivobook S14/15/16
- ASUS ProArt P16/X13
- ASUS ROG Zephyrus G16
- ASUS TUF Gaming A14/A16
- MSI Summit A16 AI+
- MSI Stealth A16 AI+
- MSI Prestige A16 AI+
GPU AI Instinct có bản nâng cấp MI325X, 2025 sẽ có MI350 3nm
Với chi phí rẻ hơn hẳn so với H200 và hiệu năng cao hơn H100 ở nhiều tác vụ vận hành mô hình AI, MI300X đang là lựa chọn của nhiều đơn vị cung cấp dịch vụ data center và nhiều đơn vị nghiên cứu phát triển AI, thay thế cho những GPU trị giá hàng chục nghìn USD của Nvidia. Roadmap của những kiến trúc chip xử lý data center chuyên trách vận hành mô hình AI của AMD cũng đã được hé lộ tại Computex 2024.
Đầu tiên, trong năm nay, MI325X với bộ nhớ HBM3E, giải quyết vấn đề tồn đọng lớn nhất của MI300X là công nghệ bộ nhớ sẽ được ra mắt thị trường. GPU dành cho data center này vẫn sẽ ứng dụng kiến trúc CDNA 3. Trên bề mặt package silicon sẽ là 288GB HBM3E, băng thông bộ nhớ 6TB/s, sức mạnh xử lý 1.3 petaflop FP16, 2.6 petaflop FP8, mỗi cụm máy chủ 8 GPU MI325X đủ sức vận hành mô hình AI với 1 nghìn tỷ tham số.
Tới năm 2025, kiến trúc CDNA 4 sẽ được ra mắt, cùng thời điểm Nvidia ra mắt những chip xử lý AI Rubin R100 kiến trúc mới. Tên sản phẩm thương mại sẽ là Instinct MI350 Series. Gia công dựa trên tiến trình 3nm TSMC, vẫn ứng dụng bộ nhớ 288GB HBM3E, Instinct MI350 sẽ hỗ trợ xử lý số thực dấu phẩy động FP4 và FP6.
Điều ấn tượng mà AMD khẳng định, là nếu như CDNA 3 chỉ có hiệu năng xử lý mạnh hơn CDNA 2 khoảng 8 lần, thì CDNA 4 sẽ mạnh hơn CDNA 3 tới 35 lần. AMD cũng không ngần ngại so sánh CDNA 4 với Blackwell B200, vốn là hai die chip ghép lại với nhau:
Đến năm 2026, khi Nvidia ra mắt Rubin Ultra, thì AMD sẽ ra mắt Instinct MI400 Series, với kiến trúc nhân GPU mới, CDNA Next.
Radeon PRO W7900: 48GB bộ nhớ cho workstation vận hành AI
Công bố đáng chú ý cuối cùng mà mình muốn chia sẻ với anh em, là GPU dành cho nhu cầu máy workstation phục vụ doanh nghiệp vừa và nhỏ nghiên cứu AI local, không cần thuê máy chủ đám mây. Điều đáng chú ý nhất ở sản phẩm mới này chính là những card Radeon PRO W7900 Dual Slot, đúng như tên gọi, chỉ chiếm 2 slot PCIe, tức là trong thùng máy tính cá nhân có thể trang bị tối đa 4 card Radeon PRO W7900 để vận hành, huấn luyện và nghiên cứu mô hình AI local.
Bên trong bo mạch của Radeon PRO W7900 là chip GPU Navi 31, 96 compute unit, 6144 nhân kiến trúc RDNA 3, bộ nhớ tối đa 48GB GDDR6, memory bus interface 384-bit, tạo ra băng thông 864 GB/s. Sức mạnh xử lý số thực dấu phẩy động của một card Radeon PRO W7900 ở ngưỡng 61.3 teraflop FP32, tối đa 123 teraflop FP16, kết hợp với 192 nhân tăng tốc AI, TDP 295W.
So sánh với giải pháp tương tự cao cấp nhất của Nvidia là Ada 6000, Radeon PRO W7900 có hiệu năng so với chi phí ấn tượng hơn gấp đôi. Với 48GB GDDR6, Radeon PRO W7900 đủ sức xử lý những mô hình ngôn ngữ với 70 tỷ tham số, như Llama3 70B-Q4.
Củng với đó, câu trả lời trước API CUDA của Nvidia cũng được AMD công bố: ROCm phiên bản 6.1, với nhiều lựa chọn hơn cho các nhà phát triển ứng dụng và AI.