Main | 700ドルの安価なサイバー犯罪用ツール登場で攻撃が容易に--脅威レポート(シマンテック) »
“Magny-Cours”Opteronで4ソケットサーバに価格破壊を! / 2010年05月09日(日)
 インテルとAMDが新世代のサーバ向けCPUを続けて発表した。しかし、両社が新製品で目指すのは逆方向。まずはAMDが“12コア”CPUに託したメッセージを読み解こう。

【拡大画像や他の画像解説を含む記事】

 2010年3月、インテルとAMDからハイエンドサーバ向けCPUのリリースが相次いだ。3月29日には、インテルに先立ってAMDがOpteron 6100番台を発表した。これまで“Magny-Cours”という開発コード名で知られてきたモデルで、AMDによる“サーバプラットフォーム再構築”の第1弾となる「Opteron 6000プラットフォーム」(プラットフォームとしての開発コード名は“Maranello”)だ。

 従来、AMDのサーバ向けCPUは、シングルソケットの1000番台、デュアルソケット向けの2000番台、そして4〜8ソケット対応の8000番台に分かれていた。それを1〜2ソケットのOpteron 4100番台と2〜4ソケットのOpteron 6100といった2つのプラットフォームに集約するのが、AMDの新しい戦略だ。

 AMDによると、Opteron 8000番台が受け持っていた4〜8ソケットサーバの市場は、単価や利益は高いものの、市場規模としてはIAサーバ全体の5%未満に過ぎない。しかも、CPU単体の高性能化とマルチコア化が今後も進むと、4〜8ソケットサーバの適用分野を2ソケットサーバで置き換えることも現実となってくる。加えて、仮想化技術の発展と普及は、ソケット数を増すスケールアップ型の拡張より、安価な2ソケットサーバによるスケールアウト型の拡張を後押しする。

 こうした事情を考えると、従来のCPUとプラットフォームのまま将来的に4〜8ソケットサーバが数量面で大幅に成長するのは難しい。Opteron 6100番台には、4ソケットサーバの価格帯を従来の2ソケットサーバのハイエンドモデルまで下げることで、4ソケットサーバのボリュームを大きくしたいAMDの狙いが込められている。

 これは、インテルがXeon 7500番台で4〜8ソケットサーバ分野を強化するのと逆の動きに見える。しかし、インテルは、Xeon 7500番台で従来のIAサーバがカバーできなかった上位分野、ミッションクリティカル市場に進出することで市場を拡大したいので性能だけでなく拡張性やRAS機能を大幅に強化していき、ボリュームゾーンに対しては、今後もマルチコア、そしてメニーコア化が進む2ソケットサーバが主流であり続ける、と考えているようだ。

 インテルとAMDで戦略が異なる原因は、4〜8ソケットサーバ市場におけるシェアの拡大がAMDの急務であることだ。追いかける(=シェアを奪う)立場のAMDにとって、低価格化による市場拡大は大きな意味を持つ。さらに、AMDの“社内的な都合”も影響する。AMDは自社の製造部門を「GLOBALFOUNDARIES」として分社化した。会社を2分するような大規模な再構成であり、そちらにも多くのリソースを割かねばならない。いま、限られたリソースの中で何ができるかを考えつつ、将来への発展を想定した準備が、Opteron 6100番台とOpteron 4100番台の2つへ集約を図るAMDのサーバプラットフォーム戦略の要といえるだろう。

●[Istanbul|Shanghai]×2=Magny-Cours

 この新戦略の第1弾となるOpteron 6100番台のCPUには12コア版と8コア版がある。12コア版は従来の6コアCPU“Istanbul”に相当するダイを2基、8コア版は従来のクアッドコアCPU“Shanghai”に相当するダイを2基、それぞれ1つのパッケージに封入したMCM(マルチチップモジュール)だ。既存のCPUコアを流用することで、開発期間を短縮してコア数を増したモデルを投入できるメリットがMCMにはある。

 もちろん、単純に2つのコアを1つのパッケージに封入するだけでは、消費電力が2倍になってサーバの熱設計を大幅に見直さなければならない。プロセスの細かい改良によって消費電力を削減し、かつ、歩留まりを向上させ、さらにCPUの動作クロックを12コア版で最高2.3GHz(Opteron 6176 SE)に、8コア版では2.4GHz(Opteron 6136)に抑えることで、従来のプラットフォームと同程度の消費電力を維持している。ちなみに6コアの“Istanbul”世代Opteronで最高クロックは2.8GHz(Opteron 8439SE、Opteron 2439SE)、クアッドコアの“Shanghai”世代Opteronで最高クロックは3.1GHz(Opteron 8393SE、Opteron 2393SE)だった。

 ダイを2基封入すると、CPUのコア数が2倍になるだけでなく、メモリコントローラも2倍になる。Opteron 6100番台がクアッドチャネルのメモリインタフェースを備えるのは、2つのダイに統合されたメモリコントローラが両方とも有効になっているからだ。ただ、“Istanbul”と“Shanghai”のメモリコントローラはDDR2に対応して1つのメモリチャネルで3枚のDIMMをサポートしていたが、“Magny-Cours”のメモリコントローラはDDR3対応に改められ、最大DDR3-1333をサポートする(Registered および Unbuffered)。チャネルあたり3枚というDIMMの数は変わらないが、メモリクロックには制限が加わるだろう。

 コア数が2倍でメモリチャネルも2倍と、2基のダイを封入することはいいことだけに思えるが、必ずしもそうとは限らない。すぐに思い付く問題点はピン数の増加だ。Opteron 6000シリーズプラットフォームは、“G34 Socket”プラットフォームといい換えることもできるが、ピン数が1944本と非常に多い。8ソケットをサポートしたインテルのXeon 7500番台のピン数が1567本であることを考えてもその多さは際立つ。これは、CPUのコストや不良率に影響を与えるだけでなく、マザーボードのコストにも影響する。

●4ソケット接続は結構面倒

 もう1つの問題は、CPU間の接続問題だ。AMDのCPUでは外部インタフェースに、Point-to-Point接続を基本とするHyper Transportを採用する。Hyper Transportは、CPU間の接続以外にCPUパッケージ内部でダイの接続にも使われる。

 OpteronのHyper Transport(HT)には、CPUコアの接続に用いる「cHT」(コヒーレントHT)と、入出力インタフェースとの接続に用いるncHT(ノンコヒーレントHT)の2種類がある。なお、この段落の下に掲載している「“Magny-Cours”世代のOpteronの内部でCPUコアの接続にHyper Transportが使われている」の図には誤りがあり、図の右側で「P1」から伸びる緑色で示されている線はncHTを示す。グレーと青で示されているのがcHT、赤い点線がメモリチャネルになる。グレーや青の細い線は半分の帯域(x8)のcHTで、Hyper Transport 3.0のLink Splitting機能を使って、1本のx16リンクをx8リンク2本として機能している。

 Magny-Coursで用いられているダイには、x16のHTが4本あるが、そのうちの1本はチップセット接続用のncHTで、CPU間の接続に使えるのは3本、そのうちの1本をx8リンク2本として使っている。x8リンクの1本とx16リンクをパッケージ内でのダイ間の接続に使い(青い線)、パッケージ間での接続に同じくx8リンク1本とx16リンク1本を用いる。

 x16換算で計4本のHTリンクを2ソケットの場合と4ソケットの場合に分けて考えてみよう。2ソケット構成時ではx16リンクを隣接するダイ間の接続に使い、対角にあるダイとの接続にx8リンクを用いる(P0とP2にあるダイのncHTは使われない)。Socket Fプラットフォームにおける4ソケット構成に似ているが、Socket Fでは対角の接続がなかった。G34 Socketの2ソケット構成は、どのメモリコントローラへも1ホップで到達できるため、メモリアクセスのレイテンシで有利になる。

 4ソケット構成ではかなり複雑な接続になる。この場合、Opteron 6100番台が持つ1パッケージ当たり3本あるいx16リンク(cHT)をすべてx8リンクにスプリットして、計6本の外部リンクとして使っている。しかし、各パッケージに2つのダイが封入されているため、すべてのダイ間を接続するには6本では足りない。例えば、P0とP3、P6、P7を直接接続するリンクはなく2ホップ必要になる。Opteron 6100番台の場合、4ソケット構成はダイ間の接続という観点からは、シングルダイCPUの8ソケット構成に相当する。Opteron 6100番台でAMDはマーケティング上の理由から8ソケット構成をサポートしないと述べているが、HTのリンク数やピン数という観点からも8ソケットは現実的ではなかったと思われる。

●AMDのメリットはユーザーのメリットにつながる

 製造部門の分離という大きな変革を進めているAMDは、2010年に登場する製品に対して大きな開発リソースを割くことが難しいと分かっていたはずだ。その中で、1つのパッケージに2つのダイを封入することで性能を向上させる代わりに8ソケット構成は放棄するというトレードオフを選び、さらには、既存の4コア、および、8コアダイの歩留まりと生産能力などのパラメータを総合的に考えた上で、Opteron 6100番台で採用した戦略を選んだのだろう。

 リリースから1年近くを経過して、“Shanghai”/“Istanbul”世代Opteronの歩留まりは十分向上しているだろうし、GLOBALFOUNDRIESは、かつて生産パートナーでもあったシンガポールのChartered Semiconductorを傘下に収めたことで、十分な生産能力があると考えられる。今できることを踏まえた上での、極めて現実的な戦略だ。AMDは、新しい“Bulldozer”アーキテクチャを用いた次世代の“Interlagos”(Opteron 6100番台の後継になる)でもG34 Socketを使うと述べている。そうなると、Interlagosでも2つのダイを1つのパッケージに封入する可能性が高く、Interlagosでスケールアップ型の8ソケットサーバを構成するのも難しいだろう。

 既存のダイを2基封入することでCPUとしての性能向上を図ったOpteron 6100番台だが、従来のダイと完全に同じというわけではない。すでに述べたように、メモリコントローラの仕様がDDR3対応になり、HTはスプリティング(x16を2つのx8に分けられる)が可能な3.0になった。さらに、HTのクロックは6.4GT/秒に引き上げられた。CPUコアには手を付けず、インテルがいうところの「Uncore」部分を改善させたのが、“Magny-Cours”世代のOpteronということになる。

 1つ気になるのは、HTのリンク数がIstanbulの3本から、Magny-Coursで4本に増えていることだ。Magny-Coursのダイ写真には「HT0」から「HT3」まで、計4本のHTが用意されている。ところが、Istanbulの発表時に公開されたダイ写真と比べて何ら変わりがない。ということは、IstanbulではHTの1本を使っていなかった可能性がある。Istanbulの設計時点で、これを流用してMagny-Coursを作ることまで決まっていたかもしれない。

 Opteron 6100番台として現時点で発表されているラインアップは10モデルになる。新しいプラットフォームだが、消費電力(ACP)は従来世代を維持している。価格は266ドルから1386ドルで、2ソケット対応のIstanbul世代Opteron 2300番台の174ドルから1165ドルに対して若干の値上げで済んだ。ダイの数が倍になったことを考えれば、極めてリーズナブルだ。4ソケット構成に必要だったIstanbul世代Opteron 8300番台の価格が、873ドルから2649ドルだったことを思えば「大バーゲン価格」といってもいい。「4ソケットサーバを2ソケットサーバの価格帯で」というAMDのセールストークに偽りはない。

 インテルとの違いは、モデルによるスペックの違いが少ないことだ。基本的にダイ(コア数)が異なる2モデルに分かれるだけで、消費電力と動作クロックが違うほかに機能差はない。メモリやHTのクロックもすべて共通だ。CPUコアの動作クロックが100MHz単位で変わることでモデルが分けられているのは、小刻みであるものの分かりやすい。

 このことは、組み合わせるチップセットにもいえる。Opteron 6100番台のチップセットとして「SR5690」、「SR5670」、「SR5650」と3種類が用意されるが、基本的には利用できるPCI Express Gen.2のレーン数が異なるだけで、共通のBIOS/ファームウェアで動作可能だ。また、このチップセットは、今後発表される1〜2ソケット対応のOpteron 4100番台でも用いられる。プラットフォームのバリエーションを減らせるということは、それだけ検証作業に必要な時間と労力を節約できる。それはAMDの利益になるばかりか、OEMにとっても、さらにはユーザーにとってもメリットになる、とAMDは力説している。【元麻布春男】

【5月8日18時47分配信 +D PC USER
http://headlines.yahoo.co.jp/hl?a=20100508-00000020-zdn_pc-sci

Posted at 01:56/ この記事のURL
この記事のURL
http://yaplog.jp/gsxmnihdvecilc/archive/3910
P R
カテゴリアーカイブ
   
Powered by yaplog!