

概要
柔軟性の高いリアルタイムの前処理
AMD のプログラマブル ロジックを使用すると、任意のセンサーへの接続、低レイテンシの処理機能を簡単に構築し、差別化を図ることができます。
効率の高い AI 推論
次世代 AI エンジン アーキテクチャは、前世代と比べて最大 3 倍の TOPS/ワットを達成し、より多くのデータ型をサポートします。1
高性能な後処理
強化されたプロセッシング システムは、複雑な意思決定や同様のワークロードにおいて、第 1 世代の Versal デバイスよりも最大 10 倍のスカラー演算能力2 を実現します。
AI システム全体を強化
計算プロセスのすべての段階を高速化
Versal AI エッジ シリーズ Gen 2 アダプティブ SoC は、柔軟性の高いリアルタイムの前処理、効率の高い AI 推論、高性能な後処理を可能にし、省スペースでシンプルなデザインを実現できます。


システム性能を向上
ヘテロジニアス コンピューティングの可能性を引き出す
Versal AI エッジ シリーズ Gen 2 アダプティブ SoC は、業界最高レベルのプログラマブル ロジック、統合型 CPU、高度な安全性、セキュリティ機能など多数の機能を提供し、推論だけに限らずさまざまな用途で価値をもたらします。
製品の特長
Versal AI エッジ シリーズ Gen 2 の紹介
実績ある Versal アーキテクチャを採用した Versal AI エッジ シリーズ Gen 2 アダプティブ SoC は、業界最高レベルの Versal プログラマブル ロジックと最先端のプロセッシング システム、さらに次世代 AI エンジンを 1 つのデバイスに統合したソリューションであり、優れた安全性とセキュリティ機能を提供します。
主な特長
デバイス/パッケージの各組み合わせで利用可能な機能については、データシートの概要を参照してください。
プロセッシング システム
最大 8 個の Arm® Cortex®-A78AE アプリケーション プロセッサと最大 10 個の Cortex-R52 リアルタイム プロセッサを備え、合計 200k DMIPS を超える計算能力を提供します。また、USB 3.2、DisplayPort™ 1.4、10 GbE、PCIe® Gen5 など、さまざまなペリフェラルをサポートしています。
プログラマブル ロジックと I/O
業界最高レベルの Versal プログラマブル ロジックと MIPI C-PHY 対応の新しい高性能 X5IO は、柔軟性の高いリアルタイム処理を可能にし、将来的な変化にも適応できます。
AI エンジン
新しい AIE-ML v2 タイルは、前世代と比較してタイルあたり 2 倍の演算能力3 と優れた電力効率を提供します。また、スループットやワットあたりの性能を向上させるために新しいネイティブ データ型 (MX6 や MX9 など) をサポートしています。
ハード化された画像/ビデオ処理
ハード化された新しいイメージ シグナル プロセッサ (ISP) IP により、画像処理がさらに高速化されます。また、強化されたビデオ コーデック ユニット (VCU) タイルは、HEVC および AVC の 4K60、4:4:4、12 ビットのエンコード/デコードに対応しています。
DDR5 および LPDDR5X
ハード DDR メモリ コントローラーは、DDR5-6400 と LPDDR5X 8533 および新しいインライン暗号化機能をサポートし、最大 170 GB/s のメモリ帯域幅を提供します。
統合型 GPU
Arm Mali™-G78AE GPU は、最大 268 GFLOPS の演算性能で最大解像度 4K60 のディスプレイ/HMI アプリケーションを実現できます。5 詳細は、ホワイト ペーパーをご覧ください。
その他の Versal アダプティブ SoC の機能
オートモーティブ イノベーション推進
電気自動車、自律走行車テクノロジ、安全およびインフォテイメント システムのイノベーションが台頭していますが、その多くは AI によって推進されており、オートモーティブ業界は大きな変化とチャンスを経験しています。この eBook では、この変化を促進している最新のトレンドと、そのトレンドから生まれる技術的および製造上の課題について説明しています。


アプリケーションと業界

ADAS/自動運転
Versal AI エッジ シリーズ Gen 2 アダプティブ SoC は、先進運転支援システム (ADAS) および自動運転 (AD) のセントラル コンピューティングの要件を満たすように設計されています。これらの SoC には新しい AI エンジンが統合されており、前世代よりもワットあたりの性能を最大 3 倍向上させることができます。1 AI エッジ シリーズ Gen 2 デバイスのヘテロジニアス アーキテクチャは、センサー フュージョンとリアルタイムの意思決定を必要とするマルチセンサーのビジョン認識システムに理想的です。
産業オートメーション、ロボット、マシン ビジョン
産業オートメーション、ロボティクス、およびマシン ビジョン アプリケーションにおいて、生産性の向上は最も重要な目標の 1 つです。Versal AI エッジ シリーズ Gen 2 アダプティブ SoC は、機能安全、レイテンシ、確定性、センサー接続、AI 推論、消費電力、リアルタイム制御、ネットワーキングなどの主要な要件を満たしながら、高負荷のワークロードを効率的に処理するように最適化されています。


航空宇宙および防衛
Versal AI エッジ シリーズ Gen 2 は、自律システムから、AI 推論を使用するミッション コンピューティング、オンボード ネットワーキング、ソフトウェア無線、画像処理、さらには最先端の検出/追跡機能、センサー フュージョン システムに至るまで、さまざまな航空宇宙/防衛アプリケーションの開発に適しています。
医療用画像処理
今日の医療用画像診断装置では、高画質、スキャン深度、AI 処理、およびリアルタイムの結果表示が不可欠な要素となります。Versal AI エッジ シリーズ Gen 2 のようなシステム オン チップ (SoC) デバイスは、特定用途に最適化された演算性能とメモリ性能、統合されたハードウェア アクセラレーション機能、次世代の高速接続、および豊富なソフトウェア開発環境を備えており、医療用画像診断装置の開発に理想的です。


エンベデッド AI Box
リアルタイムのエッジ AI アプリケーションや要求の厳しいシステムが増加する現在では、電力消費、レイテンシ、AI 性能をすべて考慮するデザインが求められています。Versal AI エッジ シリーズ Gen 2 は、AI エンジン タイルとビデオ コーデック ユニットを活用して、AI 性能とレイテンシを最適化するように設計されています。また、適応型の I/O インターフェイスとリファレンス デザインを提供することにより、リアルタイムのデータ同期を容易にし、効率的な設計をサポートしています。
製品仕様
AI パフォーマンス
| 2VE3304 | 2VE3358 | 2VE3504 | 2VE3558 | 2VE3804 | 2VE3858 | |
|---|---|---|---|---|---|---|
| INT8 TOPS (高密度) | 31 | 31 | 123 | 123 | 184 | 184 |
| INT8 TOPS (最大スパース性) | 61 | 61 | 246 | 246 | 369 | 369 |
| MX6 TOPS (高密度) | 61 | 61 | 246 | 246 | 369 | 369 |
AI エンジン
| 2VE3304 | 2VE3358 | 2VE3504 | 2VE3558 | 2VE3804 | 2VE3858 | |
|---|---|---|---|---|---|---|
| AIE-ML v2 タイル | 24 | 24 | 96 | 96 | 144 | 144 |
プロセッシング システム
| 2VE3304 | 2VE3358 | 2VE3504 | 2VE3558 | 2VE3804 | 2VE3858 | |
|---|---|---|---|---|---|---|
| アプリケーション コア/リアルタイム コア | 4/4 | 8/10 | 4/4 | 8/10 | 4/4 | 8/10 |
| アプリケーション プロセッサ | Arm Cortex-A78AE、64 KB I (パリティ付き) & D (ECC 付き) L1 キャッシュ、512 KB L2 キャッシュ、1 MB L3 キャッシュ (2 コア クラスターあたり)、CMN600 (4 MB ラストレベル キャッシュ付き) (共有) | |||||
| リアルタイム プロセッサ | Arm Cortex-R52、32 KB L1 キャッシュ (ECC 付き)、128 KB TCM (ECC 付き) | |||||
| メモリ | 2 MB オンチップ メモリ (ECC 付き) | |||||
| 高速コネクティビティ | PCI Express® Gen5x4、USB 3.2、DisplayPort™ 1.4、10G Ethernet、1G Ethernet、UFS 3.1 | |||||
| 一般的なコネクティビティ | CAN/CAN-FD、SPI、UART、USB 2.0、I2C/I3C、GPIO | |||||
プログラマブル ロジック
| 2VE3304 | 2VE3358 | 2VE3504 | 2VE3558 | 2VE3804 | 2VE3858 | |
|---|---|---|---|---|---|---|
| システム ロジック セル | 206,920 | 206,920 | 492,188 | 492,188 | 1,188,040 | 1,188,040 |
| LUT 数 | 94,592 | 94,592 | 225,000 | 225,000 | 543,104 | 543,104 |
| DSP エンジン | 184 | 184 | 700 | 700 | 2,064 | 2,064 |
メモリ、インターフェイス、I/O、トランシーバー
| 2VE3304 | 2VE3358 | 2VE3504 | 2VE3558 | 2VE3804 | 2VE3858 | |
|---|---|---|---|---|---|---|
| 総 PL メモリ (Mb) | 21.1 | 21.1 | 23.9 | 23.9 | 97.0 | 97.0 |
| 最大メモリ帯域幅 (LPDDR5X) | 102 GB/s | 102 GB/s | 136 GB/s | 136 GB/s | 170 GB/s | 170 GB/s |
| 100G マルチレート イーサネット MAC | 1 | 1 | 1 | 1 | 3 | 3 |
| PL PCIe (Gen5x4) | 1 | 1 | 3 | 3 | 4 | 4 |
| 高性能 I/O | 260 | 260 | 384 | 384 | 512 | 512 |
| GTYP トランシーバー (PL のみ) | 4 | 4 | 12 | 12 | 20 | 20 |
画像/ビデオ処理
| 2VE3304 | 2VE3358 | 2VE3504 | 2VE3558 | 2VE3804 | 2VE3858 | |
|---|---|---|---|---|---|---|
| ビデオ コーデック ユニット (VCU) タイル | 0 | 1 | 0 | 1 | 0 | 1 |
| Image Signal Processor (ISP) タイル | 0 | 1 | 0 | 3 | 0 | 3 |
| GPU | 4 コア Arm Mali-G78AE GPU (1 個) | |||||
すべての開発者向け
AMD は、アダプティブ SoC および FPGA を使用したデザイン向けに、業界をリードするソフトウェアおよびハードウェア開発環境を構築し、使い慣れた強力なツール、ライブラリ、および方法論を備えた包括的なセットを提供しています。
その一例として、Vivado™ Design Suite があります。これは、ハードウェア設計者がコンパイル時間と設計の反復回数を削減しながら、消費電力をより正確に推定するのに役立ちます。さらに、AMD Vitis™ 統合ソフトウェア プラットフォームを使用すると、AMD のアダプティブ SoC および FPGA、その他のツール (コンパイラ、シミュレータなど)、IP、ソリューションを使用して、高度でパフォーマンスに最適化されたシステム設計 (AI エンジン技術を搭載した高性能 DSP を含む) を構築できます。
こうした環境を利用することで、ワットあたりの性能が高いデザインを短期間に構築できます。また、AI サイエンティストから、アプリケーション エンジニア、アルゴリズム エンジニア、エンベデッド ソフトウェア開発者、従来のハードウェア開発者に至るまで、あらゆるタイプの開発者向けに自動化とユーザー制御の両方を提供します。
Vivado Design Suite の大幅な機能強化の詳細については、Versal 対応 Vivado のウェブ ページをご覧ください。

- Vitis 統合ソフトウェア開発プラットフォームAMD Vitis™ ソフトウェア プラットフォームは、FPGA ファブリック、Arm® プロセッサ サブシステム、および AI エンジンを含むデザインを開発するための開発環境です。AMD Vivado™ Design Suite と組み合わせて使用することで、RTL よりも高い抽象度での設計が可能になります。
- Vitis AIVitis™ AI ソフトウェアは、AMD のデバイス、ボード、Alveo™ データセンター アクセラレーション カード、特定 PC、ラップトップ、およびワークステーション向けの包括的な AI 推論開発ソリューションです。エッジ、エンドポイント、データセンターに使用可能な AI 向けの豊富な AI モデル、最適化されたニューラル プロセッシング ユニット (NPU) コア、ツール、ライブラリ、サンプル デザインが含まれています。Vitis AI は、効率性と使いやすさを考えて設計されており、AMD アダプティブ SoC や Ryzen™ AI 搭載 PC での AI アクセラレーションの性能を最大限に引き出すことができます。
- Vitis HLSVitis™ HLS ツールは C/C++ で定義した関数を RTL に合成することで、複雑な FPGA アルゴリズムを簡単に作成できます。このツールは、合成/配置配線用の Vivado™ Design Suite およびヘテロジニアス システム デザインとアプリケーション用の Vitis™ 統合ソフトウェア プラットフォームと密接に統合されています。
- Vitis Model ComposerVitis™ Model Composer は、MathWorks MATLAB® および Simulink® 環境でデザインを短時間で試行できるモデル ベースのデザイン ツールであり、自動コード生成により AMD デバイスでの製品化を加速します。DSP アルゴリズムを設計し、それらを性能重視で最適化されたブロックを使用して反復し、システム レベル シミュレーションで論理的に正しいかどうかを検証できます。Vitis Model Composer は、自動最適化機能を使用して、ユーザーのアルゴリズム仕様をプロダクション品質のインプリメンテーションに変換します。
- Vivado Design SuiteGo to linkVivado™ Design Suite は、AMD のアダプティブ SoC および FPGA 向けの設計環境であり、デザイン入力、合成、配置配線、検証/シミュレーション ツールが統合されています。Vivado 環境では、VHDL や Verilog などの従来の HDL を使用したデザイン入力をサポートしています。また、IP インテグレーター (IPI) という GUI ベースのツールもサポートしており、プラグアンドプレイの IP 統合設計環境を提供します。Vivado Design Suite は、最先端の複雑な FPGA およびアダプティブ SoC 向けに卓越した合成/インプリメンテーション機能を提供し、タイミング クロージャや設計手法をサポートします。
- OS およびエンベデッド ランタイムGo to linkAMD エンベデッド開発フレームワーク (EDF) は、オープンソースの Yocto Project™ をベースに構築されており、すぐに使用できる完全な体験を提供します。拡張性の高いモジュール式のシステム レベルの開発環境を備えており、開発から運用までのプロセスが合理化および迅速化されます。
リソース

脚注- AMD が社内で実施した検証結果に基づいています。Versal AI エッジ シリーズ Gen 2 の AIE-ML v2 演算タイル アーキテクチャで MX6 データ型を使用した場合の性能および消費電力見積もり結果を、INT8 データ型を使用する、第 1 世代 Versal AI エッジ シリーズの AIE-ML 演算タイル アーキテクチャの性能仕様および消費電力見積もり結果 (AMD Power Design Manager 使用) と比較したものです。前提: 2 行、8 列のサブ配列。動作条件: 1 GHz Fmax、0.7V AIE 動作電圧、100°C ジャンクション温度、標準プロセス、60% ベクトル負荷、アクティベーション率 = 0 < 10%実際の性能は、市場にリリースされた最終製品によって異なる可能性があります。性能の見積もりは、2024 年 3 月時点のものです。(VER-023)
- 8 個の Arm Cortex-A78AE アプリケーション コア (2.2 GHz) と 10 個の Arm Cortex-R52 リアルタイム コア (1.05 GHz) を使用した構成での Versal AI エッジ シリーズ Gen 2 および Versal プライム シリーズ Gen 2 のプロセッシング システムにおける合計 DMIP と、それぞれの第 1 世代 Versal AI エッジ シリーズおよび Versal プライム シリーズの公開されている合計 DMIP 値を比較した結果に基づいています。Versal AI エッジ シリーズ Gen 2 および Versal プライム シリーズ Gen 2最高スピード グレード、0.88V PS 動作電圧、スプリット モード動作、サポートされる最大動作周波数。第 1 世代 Versal AI エッジ シリーズおよびプライム シリーズの動作条件: 最高スピード グレード、0.88V PS 動作電圧、サポートされる最大動作周波数。実際の結果は、構成や動作条件によって異なります。(VER-104)
- 製品仕様の比較に基づいています。Versal AI エッジ シリーズ Gen 2 に搭載されている AIE-ML v2 コンピューティング タイル アーキテクチャの製品仕様は 1 クロックあたり 1024 回の INT8 演算、第 1 世代の Versal AI エッジ シリーズに搭載されている AIE-ML コンピューティング タイル アーキテクチャの公開された製品仕様は 1 クロックあたり 512 回の INT8 演算です。性能の見積もりは、2024 年 2 月時点のものです。(VER-024)
- AMD が社内で実施したプレシリコン段階での機能安全性目標と性能予測に基づいています。Versal AI エッジ シリーズ Gen 2 および Versal プライム シリーズ Gen 2 のプロセッシング システムを 8 個の Arm Cortex-A78AE アプリケーション コア (2.2 GHz) で構成した場合のアプリケーション プロセッシング ユニット (APU) の合計 DMIPS を評価したものです。動作条件: 最高スピード グレード、0.88V PS 動作電圧、サポートされる最大動作周波数、すべての APU コアはロックステップ モードで動作。実際の性能は、市場にリリースされた最終製品によって異なる可能性があります。(VER-028)
- Arm 社が公開している Versal AI エッジ シリーズ Gen 2 および Versal プライム シリーズ Gen 2 デバイスの製品仕様に基づいています。これらのデバイスは、4 コアの Arm Mali-G78AE GPU を使用して構成され、最大動作周波数 1050 MHz、1 演算/1 コア/1 クロックあたり 64 FP32、および 1 演算/1 コア/1 クロックあたり 4 テクセルです。実際の Versal AI エッジ シリーズ Gen 2 およびプライム シリーズ Gen 2 の実際の製品性能は、最終製品リリース時には異なる場合があります。(VER-030)
- AMD が社内で実施した検証結果に基づいています。Versal AI エッジ シリーズ Gen 2 の AIE-ML v2 演算タイル アーキテクチャで MX6 データ型を使用した場合の性能および消費電力見積もり結果を、INT8 データ型を使用する、第 1 世代 Versal AI エッジ シリーズの AIE-ML 演算タイル アーキテクチャの性能仕様および消費電力見積もり結果 (AMD Power Design Manager 使用) と比較したものです。前提: 2 行、8 列のサブ配列。動作条件: 1 GHz Fmax、0.7V AIE 動作電圧、100°C ジャンクション温度、標準プロセス、60% ベクトル負荷、アクティベーション率 = 0 < 10%実際の性能は、市場にリリースされた最終製品によって異なる可能性があります。性能の見積もりは、2024 年 3 月時点のものです。(VER-023)
- 8 個の Arm Cortex-A78AE アプリケーション コア (2.2 GHz) と 10 個の Arm Cortex-R52 リアルタイム コア (1.05 GHz) を使用した構成での Versal AI エッジ シリーズ Gen 2 および Versal プライム シリーズ Gen 2 のプロセッシング システムにおける合計 DMIP と、それぞれの第 1 世代 Versal AI エッジ シリーズおよび Versal プライム シリーズの公開されている合計 DMIP 値を比較した結果に基づいています。Versal AI エッジ シリーズ Gen 2 および Versal プライム シリーズ Gen 2最高スピード グレード、0.88V PS 動作電圧、スプリット モード動作、サポートされる最大動作周波数。第 1 世代 Versal AI エッジ シリーズおよびプライム シリーズの動作条件: 最高スピード グレード、0.88V PS 動作電圧、サポートされる最大動作周波数。実際の結果は、構成や動作条件によって異なります。(VER-104)
- 製品仕様の比較に基づいています。Versal AI エッジ シリーズ Gen 2 に搭載されている AIE-ML v2 コンピューティング タイル アーキテクチャの製品仕様は 1 クロックあたり 1024 回の INT8 演算、第 1 世代の Versal AI エッジ シリーズに搭載されている AIE-ML コンピューティング タイル アーキテクチャの公開された製品仕様は 1 クロックあたり 512 回の INT8 演算です。性能の見積もりは、2024 年 2 月時点のものです。(VER-024)
- AMD が社内で実施したプレシリコン段階での機能安全性目標と性能予測に基づいています。Versal AI エッジ シリーズ Gen 2 および Versal プライム シリーズ Gen 2 のプロセッシング システムを 8 個の Arm Cortex-A78AE アプリケーション コア (2.2 GHz) で構成した場合のアプリケーション プロセッシング ユニット (APU) の合計 DMIPS を評価したものです。動作条件: 最高スピード グレード、0.88V PS 動作電圧、サポートされる最大動作周波数、すべての APU コアはロックステップ モードで動作。実際の性能は、市場にリリースされた最終製品によって異なる可能性があります。(VER-028)
- Arm 社が公開している Versal AI エッジ シリーズ Gen 2 および Versal プライム シリーズ Gen 2 デバイスの製品仕様に基づいています。これらのデバイスは、4 コアの Arm Mali-G78AE GPU を使用して構成され、最大動作周波数 1050 MHz、1 演算/1 コア/1 クロックあたり 64 FP32、および 1 演算/1 コア/1 クロックあたり 4 テクセルです。実際の Versal AI エッジ シリーズ Gen 2 およびプライム シリーズ Gen 2 の実際の製品性能は、最終製品リリース時には異なる場合があります。(VER-030)


