Dernière minute
RUВ Ивановской области объявлен режим опасности атаки БПЛАFRFIFA "gracie" Folarin Balogun, l'attaquant américain jouera contre la BelgiqueGLOBALAzteca Stadium Issues Shelter-in-Place Order Due to Severe WeatherBRAdvogada morre após bater carro contra árvore em Patrocínio (MG)ITSinner e Djokovic ai quarti di Wimbledon: Sabalenka eliminataAUPM Albanese Apologises for Podcast CommentsAULive updates: Brazil vs NorwayFRBrésil-Norvège : le match des 8es de finale de la Coupe du Monde 2026 commenté en directTRCHP'li Başarır: Trabzonlular 'Partiyi Gerçek Sahiplerine Teslim Edin' DiyorRUЧисло погибших в Венесуэле после землетрясений возросло до 3342RUВ Ивановской области объявлен режим опасности атаки БПЛАFRFIFA "gracie" Folarin Balogun, l'attaquant américain jouera contre la BelgiqueGLOBALAzteca Stadium Issues Shelter-in-Place Order Due to Severe WeatherBRAdvogada morre após bater carro contra árvore em Patrocínio (MG)ITSinner e Djokovic ai quarti di Wimbledon: Sabalenka eliminataAUPM Albanese Apologises for Podcast CommentsAULive updates: Brazil vs NorwayFRBrésil-Norvège : le match des 8es de finale de la Coupe du Monde 2026 commenté en directTRCHP'li Başarır: Trabzonlular 'Partiyi Gerçek Sahiplerine Teslim Edin' DiyorRUЧисло погибших в Венесуэле после землетрясений возросло до 3342
Newsgather
Backソフトバンク、AI計算基盤のGPU故障に苦戦も「NVIDIA DGX SuperPOD」で安定稼働を実現
ソフトバンク、AI計算基盤のGPU故障に苦戦も「NVIDIA DGX SuperPOD」で安定稼働を実現
En développement
ITmedia23.06.2026Tech3 dk okumaJapan

ソフトバンク、AI計算基盤のGPU故障に苦戦も「NVIDIA DGX SuperPOD」で安定稼働を実現

L'essentiel

ソフトバンクはAI計算基盤構築でGPUの頻繁な故障に直面したが、NVIDIA DGX SuperPODの採用で安定稼働を実現。希少なGPUを修理しながら性能を向上させ、現在は他社にクラウドサービスとして提供し、国内のAI変革を後押ししている。

Résumé généré par IA

Pourquoi c'est important

ソフトバンクはAI計算基盤の構築において、GPUの頻繁な故障という課題に直面した。しかし、NVIDIA DGX SuperPODを採用し、希少なGPUを修理しながら性能を向上させ、安定稼働を実現した。

Taille de police

「(AI計算基盤を使うユーザー側の要望もあるが)『構築時の最新GPUを使えるか』『GPUの性能を最大まで使えるか』『決められた期限内に安定稼働させられるか』といった点が重要でした。NVIDIA DGX SuperPODを選んだ理由は、ここにあります」

種邑さんによると第1世代を構築した2023年当時、米AMDなどのベンダーが提供するAIシステムは、大規模な計算基盤として検証されていなかったという。一方のNVIDIA製システムは、スパコン世界ランキング「TOP500」の上位に入る多くのコンピュータに搭載されているなど実績があった。

AIシステムとして完成されている点も、NVIDIAの強みだ。GPUの性能を引き出せるAIサーバ「DGXシリーズ」、大容量データを高速に伝送できるネットワーク機器、AIモデルの学習・推論に必要なソフトウェアをセットにした「NVIDIA AI Enterprise」などを一体的に導入することで、高性能なAIシステムを素早く構築できるとされる。

GPU巡るトラブルも 壊れ過ぎて「みんなビビった」

AI計算基盤の構築時、GPUを巡ってさまざまな苦労があったという。その一つが、GPUが頻繁に故障したことだ。AI処理は、GPUにかかる負荷が高いため故障しやすいという難点があるのだ。

「AI用のGPUは、従来のITインフラで使っていたサーバなどよりも故障が多い。AI計算基盤を作り、性能試験をして安定稼働させるまでにGPUがどんどん壊れました。こんなに壊れると知らないため、みんなビビりました」(種邑さん)

第2世代以降の構築プロジェクトに参画し、サーバ関連を担当したソフトバンクの横山哲雄さん(AIクラウド開発部 部長)もGPUの故障問題に頭を悩ませたという。

「GPUは希少で国内の在庫が少ないため、かき集めて、順次修理をしました。他のIT製品にはない独特な苦労でした」(横山さん)

ソフトバンクはGPUの故障問題に向き合いながら、AI計算基盤の性能をアップグレードしてきた。現在はAI計算基盤群をクラウドサービスとして他社に貸し出し、企業のAI開発を後押しする。

国内屈指のAIインフラを運用する同社は、日本の“AI変革”を加速させられるか。

Questions ouvertes

  • GPU故障の根本原因は何か?
  • 今後のGPU調達・保守体制は?
  • 他社へのクラウド提供は収益にどう貢献するか?

Sujets liés

This article was originally published by ITmedia.

Articles liés

GoProの新シリーズ「MISSION 1」はシネマカメラ化で復活なるか?上位モデル「PRO」を試用
En développement·1 g önce

GoProの新シリーズ「MISSION 1」はシネマカメラ化で復活なるか?上位モデル「PRO」を試用

GoProの新シリーズ「MISSION 1」は、アクションカメラのシネマカメラ化を目指し、1型センサーや新画像処理エンジンを搭載。上位モデル「PRO」は従来モデルより大きく重くなったが、高画質化を実現。競争激化で苦境が続くGoProの復活の狼煙となるか注目される。

ITmedia
JR東日本、新幹線チケット購入機を駅に設置へ - 2026年度末から大宮・宇都宮で検証
En développement·2 g önce

JR東日本、新幹線チケット購入機を駅に設置へ - 2026年度末から大宮・宇都宮で検証

JR東日本は2026年度末ごろから、大宮駅と宇都宮駅で「新幹線eチケット購入機(仮称)」の検証を開始する。スマートフォンの普及が進む中、駅でのチケット購入における「20分の壁」や複雑なUIといった課題を解消するため、購入に特化した専用端末を設置する。MVP思考に基づき機能を絞り込み、プラットフォーム共通化による顧客体験の進化を目指す。

ITmedia
Plus sur ce sujetAI