ACROFAN

クアルコムアドレノ530が提示した次世代SoCの課題

記事公開日時 : August 16, 2015, 11:16 pm
ACROFAN=權 容滿 | yongman.kwon@acrofan.com | SNS
今回のシーグラフ2015に参加した企業の中で「意外性」を挙げるならば、クアルコムはおそらく最初の手に入るだろう。クアルコムは今回のシーグラフ2015に展示ブースでは、全世界のメディアに次世代スナップドラゴンSoCに入るアドレノ530、510 GPUとISPなどについて紹介した。もちろんGPU情報のみ紹介したのは、まだ発売が多少残った部分もあるだろうが、「シーグラフ(SIGGRAPH 2015)」の性格を考慮した面もあるだろう見る。

スナップドラゴン820 SoCは、クアルコムの次世代フラッグシップSoCで、来年にリリース次世代フラッグシップスマートフォンの性能の基準点となる。そしてアドレノ530 GPUの主な特徴は、次世代のスマートフォンのグラフィックス性能と電力効率の側面を見積ることができず、ディスプレイやカメラなどのスマートフォンでの差別化要素となる部分の動向を推測できるようにする側面もある。そして、このような変化は、モバイルプラットフォームが非常に重要なコンテンツ消費のプラットフォームがされただけの産業を動かす動力源でもある。

次世代SoCに要求される価値観の中には、高い性能と優れた電力効率、小型サイズで出てくる様々な機能など両立させることは困難、相反する位置にあるものが多い。しかし、工程の改善とアーキテクチャ、プラットフォームの最適化、最新のプラットフォームに合わせたソフトウェアの最適化などは相反位置にある価値をより高いレベルで満たすことができるようにする。そして、今回のアドレノ530 GPU関連技術情報の公開は、SoCとプラットフォームレベルでのクアルコムの悩みと解決策が軽くうかがえるでもあった。

 
▲このパフォーマンスの向上は、SoCレベルの変化も伴うということを意味します。

クアルコムは、アドレノ530 GPUが既存の430と比較してグラフィックス性能が40%以上向上、同じワークロードレベルでは、40%近くの消費電力削減があると紹介した。テスト条件を確認することはできないが、このようなパフォーマンステストは少なくともFHDや2K級ディスプレイで行われた場合、最初に考えなければならないことはメモリサブシステムの大幅な性能向上がされている。現在のプラットフォームを問わず、メモリ共有型GPUのボトルネックポイントはほぼ例外なく、システムメモリインターフェイスであるためである。

クアルコムは、アドレノ530の設計目標はパフォーマンスと電力効率、単位電力当たりの性能を最大化と紹介している。これグラフィック処理において最大限使用するメモリ帯域幅を削減するために、ハードウェア、ソフトウェア的な様々な技術を既に活用している。すでに他のGPUも活用している技術では、Zバッファベースでは見えないレンダリング面を処理していない技術やテクスチャ圧縮などがあり、これはSoCでいつも不足しているメモリの帯域幅の使用量を削減し、パフォーマンスの向上と消費電力削減を得ることができある。

もちろん、根本的な解決策は使用可能なメモリ帯域幅を上げるので、820も一応は既存の810のようにLPDDR4を使用しますが動作速度はもう少し上げて見ることができるものと期待して、メモリ・コントローラのチャネルを追加することはどうしてもサイズとコストなどそれほど現実的ではないと思われる。これメモリ性能の場合、外部構成の面では、従来よりももう少しよくなるレベルではないかと予想しているが、今でもLPDDR4で25.6GB / s程度の帯域幅であればそれほど少ない水準ではない。

 
▲データ転送量を減らす「圧縮技術」の発展も無視できない部分。

この複雑なGPUのメモリの問題を解決する方法としては既存にもあったが、データバス内部に適用するハードウェア的な圧縮技術もある。個人的には、この部分の効率向上が今回のアドレノ530の性能と効率の向上に非常に大きな貢献をしたと見ている。クアルコムでは、この圧縮率がメモリでは、2:1、VPUやIPUなどでの接続には、3:1のレベルに圧縮が行われて、前の世代比でも効率は50%ほど増加したと述べたことがある。

最新規格の高速メモリを必要最小限のシリアルチャネルに接続して圧縮を使用して効率を高めるという発想は、すべての物理的、論理的なリソースが限られたモバイルプラットフォームの構成において非常に効果的な方法である。手ごわいリソースが必要なFHD解像度のグラフィック、ゲーム環境を実現するための性能を確保しながらも設計を簡素化し、消費電力を削減するための努力のおかげで、比較的劣悪なプラットフォーム構成でも高い性能を期待できるものと考えられる。

もちろん、データ圧縮方式が解決すべき課題も残っている。今までのデータ圧縮方式を使用したデータバスの場合は、データの種類に応じた性能ばらつきの問題などをよく見ていたからである。おかげで、一部のユーザーの場合はこの方法を好むしていない場合もあるが、モバイルプラットフォーム次元であれば利点がはるかに多くの技術である。そして、このような性能ばらつきなどを解決することができる方法としては、SoC資源のQoS管理技術の使用もあり、クアルコムは、この技術はまた820に搭載する予定である。

 
▲今からは高いポテンシャルを持ったGPGPUの「活用」に本格的に乗り出すべき時期。

また、次世代のSoCが解決すべき課題の観点から考えることは、既にSoCの相当部分を占めるGPUをグラフィックス処理以外の機能も活用できるようにする方法である。 GPUは、すでにかなり長い間、統合シェーダ方式のアーキテクチャを使用しており、これらのGPUの多くはOpenCLなどの汎用演算での活用が可能である。しかし、現在のほとんどのSoCは、必要な機能を実装するためにGPUを活用するよりも、別のIPアドレスを内蔵してはするが、これは効率などの理由のためでもある。

クアルコムは、アドレノ530 GPUの性能紹介でグラフィックス性能に加えて、OpenCLベースのGPGPU性能を個別に言及した。新しいGPUではOpenCL 2.0規格と共有仮想メモリをサポートするために、実際にはこのサポート自体は、すでに他の最新のiGPUなどでも行われている。しかし、クアルコムのOpenCLサポートがより大きな意味を持つ理由は、別のIPに処理すべき技術をGPGPUで処理すると提案しているものであり、これはソフトウェアとハードウェアが緊密に接続された携帯電話で、実質的な競争力の向上につながるからである。

モバイル向けにOpenCLを通じたGPGPUを使用したとき、最も簡単パフォーマンスの向上を得ることができる部分は、既存のプロセッサまたは別IPで処理した画像、映像処理部となる。そして、別IPで処理していた部分をGPUを介して処理しながら、電力消費量の側面の負担を解決することができれば、SoCの面積を効率的に活用しながら、システム全体の性能をさらに引き上げることができる余地を作ることができるようになる。また、今後の新たな規格などが登場した場合にも柔軟な対応が可能である。

 
▲一度基本的な機能のためのメーカーの基本エプドゥルから活用に取り組まなければなら。

スマートフォンでカメラの性能とハードウェアモジュールの性能とソフトウェアのパフォーマンスが結合されて出てきて、同じハードウェアでも、カメラアプリに応じて性能は千差万別で変わる。そして基本的なアプリ次元でパノラマ画像合成や各種フィルタ、HDRやノイズの減衰など、様々な前、後の処理にGPGPUを使用する場合、プロセッサのみを使用する他のアプリや競合製品に比べ圧倒的なカメラ処理性能を示すことができるようになるだろう。

そして、これを最も安定的に支えることができるのは、どうしてもデバイスメーカーが提供する基本的なアプリになるだろう。サードパーティアプリの場合、既に分断されたプラットフォームと、多くのデバイス、ソフトウェア環境でGPGPUより汎用的なプロセッサの中心の処理に焦点を当てるしかありませんが、メーカーの基本アプリは、特定のハードウェアとソフトウェアの組み合わせを限定して入ることができるからである。そして、このような専用アプリの完成度はおおむね最初のリリース時に機器の完成度と競争力の面ですぐに反映されるように、メーカーがこの部分を活用するように奨励する必要もある。

一方、GPGPUの活用拡散面でクアルコムなどのメーカーがサードパーティー開発会社の積極的な活用奨励を進行することも必要ではないかと思う。すでにGPUが汎用演算能力を備え、APIもある程度用意された状況であるが、これを活用するアプリケーションが少ない理由は、開発に関連するきっかけを作ることができるサポートなどが原因だからである。これでSoCと製品の競争力を高めるためにGPGPUを積極的に活用するアプリケーションの開発に様々な形の支援を提供するのもどうかと思う。

 
▲クアルコムのシーグラフの参加は、単なる外出程度の意味ではないようだ。

スナップドラゴン820と関連して多くの人々が注目する部分に「製造工程」があるが、現在までに「ピンペト」ベースを利用という情報程度流れ出ている。もちろん、現在このピンペトベース工程で大量生産が可能なメーカーや予定業者は片手で数えるほど減らすことができる程度で、実質的にはよく知られている二つのいずれかになる可能性が大きい。しかし、外部から見る立場では、内部でどのように進行がされている知ることができないので、心証は行くが確信は躊躇したりする。

そして、単に工程のみ変えることによって、物理的な限界が存在する状況でその程度の性能向上が容易に出てもいないだろう。今ARMアーキテクチャも昔のように低消費電力の単純なアーキテクチャではなく、限られた資源で最高のパフォーマンスを出すためには最終的に最新のトレンドに合わせて改良が要求される。それさえも従来の環境対応への負担が少ないおかげで、最新の環境に焦点を合わせた最適化の成果が確実に出てくることができるという点は、x86ベースのプロセッサとの比較でも有利な立場でもある。

今、次世代モバイルプラットフォームでデバイスの競争力を左右するのはSoCでかなりの部分を占める高性能GPUをどのよう多様に活用できるかどうかにかかっていると思われる。これが可能ならば、システムのパフォーマンスの最適化のためのSoCのバランス自体を変えて、ユーザーが体感できる実質的な性能の違いも最も確実に提供することができるからである。そして新しいスナップドラゴン820がこのような方向に変化するきっかけを提示することができるかも興味深いの見どころである。

Copyright ⓒ Acrofan All Right Reserved
 

Acrofan     |     Contact Us : guide@acrofan.com     |     Contents API : RSS

Copyright © Acrofan All Right Reserved