Zyphra、AMD専用訓練の推論特化モデル「ZAYA1-8B」をリリース – Claude Sonnetを上回る数学性能

📌 概要

2026年5月6日、サンフランシスコのAIスタートアップZyphraが、完全にAMDハードウェアで訓練された推論特化言語モデル「ZAYA1-8B」を発表した。このMixture-of-Experts(MoE)モデルは、総パラメータ84億、アクティブパラメータ7.6億という小規模ながら、大規模モデルに匹敵する数学・コーディング・推論性能を実現している。特筆すべきは、1024基のAMD Instinct MI300X GPUクラスターで完全に訓練された初のフロンティアクラスモデルである点で、NVIDIA独占に風穴を開ける存在として注目を集めている。HMMT 2025ベンチマークでClaude 4.5 Sonnetの88.3を上回る89.6を記録した。

🔄 何が変わったか

① 結論:AI訓練におけるNVIDIAの独占体制に初の実用的な代替手段が登場した。

② Before:フロンティアクラスのAI訓練は事実上NVIDIA GPU独占で、企業は選択肢なく高額なH100クラスターを使用していた。

③ After:AMD MI300Xクラスターでも競合性能を実現でき、企業の調達選択肢とコスト交渉力が向上する。

④ 影響の大きさ:大(AI業界の数兆円規模のハードウェア調達構造に影響)

💡 何に使える?どんな影響がある?

① 活用方法:企業の数学計算・コード生成・論理推論タスクに効率的なオープンモデルとして活用、研究機関がApache 2.0ライセンスで商用利用・改変可能。

② ビジネス機会:AMD GPU調達コストがNVIDIA比20-30%削減可能、中小企業の独自モデル訓練参入障壁が低下。

③ 短期の影響(3ヶ月以内):AMD株価上昇、大手クラウドプロバイダーのAMD採用検討加速。

④ 中期の影響(6〜12ヶ月):企業AI インフラ投資のマルチベンダー化、NVIDIA価格競争圧力増加。

⑤ 既存業務への影響:新規(効率的な推論モデルとして新たな活用分野を開拓)

🗞️ 原文より

ZAYA1-8B was pretrained entirely on AMD hardware using a cluster of 1,024 MI300x nodes with AMD Pensando Pollara interconnect on a custom training cluster built with IBM.

📰 情報ソース

PR Newswire
Zyphra公式ブログ

※ この記事はAIによる情報集約・編集で作成されています。内容に誤りが含まれる場合がありますので、出典・引用元を必ずご確認ください。

出典:PR Newswire

おすすめ

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です