ロックポート・ネットワークスが新会社名を発表
ティファニー・トレーダー著
2021年12月14日
スイッチレス ファブリック製品で HPC ネットワーキング分野に新規参入した Rockport Networks は本日、Marc Sultzbaugh を共同 CEO に任命したことを発表しました。 2020年12月からロックポートの取締役会メンバーとして活動しているスルツボー氏は、ロックポート・ネットワークスの共同創設者兼共同CEOのダグ・カーワーディン氏とともに同社を率いることになる。
Sultzbaugh 氏は以前、HPC ネットワーキング会社 Mellanox で販売およびマーケティングの幹部として 20 年間勤務していました。 Rockport での新しい役職では、製品管理、マーケティング、販売、製造、顧客関係など、会社の成長のあらゆる側面に責任を負います。 カーワーダインは会社の研究開発と財務管理を維持します。 この発表は、ロックポートがノーザン・プライベート・キャピタル主導による4,800万ドルの資金調達ラウンドを完了してから1週間後に行われ、同社の資金調達総額は1億ドル弱となった。
今回の資金は、ロックポートがエンジニアリング会社から自社製品(10月に発売した300Gbpsスイッチレスネットワーキングアーキテクチャ)の商品化に移行する中で、販売とマーケティングの拡大に充てられる予定だ。 従来のスイッチ アーキテクチャに依存する代わりに、Rockport はネットワーク機能を各ノードに分散し、パッシブ ケーブルを介して相互に直接接続します。 同社のテクノロジーは従来のハードウェア スイッチの意味での「スイッチレス」ですが、スイッチング機能は Rockport NC1225 ネットワーキング カードによってノード レベルで実行されます。
スルツボー氏は約 30 年前にベル研究所でエンジニアリングの分野で働き始めましたが、すぐにビジネスの役割に移りました。 彼はファブレス半導体会社ブルックツリーに 7 年間勤務し、IPO を成功させました。 そして彼は、製品の発売から Nvidia への 69 億ドルの引き継ぎの成功に至るまで、Mellanox に携わっていました。
スルツボー氏は、ロックポート・ネットワークスでも同様の成功の道を導くことができると確信しており、同社はエンドユーザーがネットワーキングを最大限に活用できるように支援するという使命を担っていると述べた。 同社によれば、それは結局のところ、Rockport のスイッチレス アーキテクチャが混雑を処理する方法に関係しているという。
「私たちのアーキテクチャは、絶対的にパフォーマンスを重視しています。しかし、それと同じくらい、あるいはそれ以上に重要なのは、予測可能なパフォーマンスです。ファブリック内にどのような種類のワークロードが同時に存在するかは問題ではありません。ファブリックがロードされていれば、非常に安定したランタイムが得られます。」
この点をさらに詳しく説明すると、「データセンター事業者は、[輻輳] を克服するために、アプリケーションを実行する規模を制限したり、ネットワーク内に混在するトラフィックの種類を制限したりするために、あらゆる種類の混乱を経験します。あるいは単に、アプリケーションに一貫性がない理由や、パフォーマンスが期待どおりでない理由がわからないため、従来のスイッチ ベンダーの答えは、「とにかくフィードと速度を上げましょう。10 から移行します」です。 25 ギガビット/秒、100 ギガビット/秒、そして現在は 400 ギガビット/秒に達しています。しかし、実際にはアーキテクチャに関する核心問題には対処しておらず、実際に達成されたのは、混雑がより早く発生することだけです。さらに、理論上の速度が上がるにつれてさらに悪いことに、 「これらのスイッチのパフォーマンスが向上すると、コストは直線的に上昇します。コストが下がることはないにしても、非常に中立的な傾向にある他のテクノロジとは異なります。」
同社は、従来のスーパーコンピューティング センターだけでなく、金融サービス、ライフ サイエンス、エネルギーなど、HPC および AI/ML の複数の垂直市場にわたって数多くの取り組みを行っていると述べています。
初期の顧客には、探索的なテストベッドとしてフロンテラ システムの 396 ノードにネットワーキング テクノロジを導入したテキサス アドバンスト コンピューティング センター (TACC) や、やはりネットワーキング ギアを試している DiRAC/ダーラム大学などが含まれます。 オハイオ州立大学のハイパフォーマンス ネットワーキング グループも Rockport と提携しており、その専門知識を標準サポートに活用しています。
従来の HPC サイトが Rockport の当初の焦点ですが、Sultzbaugh 氏は、エンタープライズ向けの取り組みが非常に多いと述べています。 「企業では、従来の HPC、設計、シミュレーション、モデリングを含むパフォーマンス コンピューティング アプリケーションと呼ばれるものに加え、AI、機械学習などの新しいワークロードを中心に、ますます多くの作業が行われています」と彼は HPCwire に語ります。 「当社は 100% チャネル主導型になりますが、ご想像のとおり、どのような種類の破壊的テクノロジを使用する場合でも、早期採用者との緊密な連携が必要です。そのため、当社は営業力を拡大するとともに、当社の営業力も拡大する予定です」マーケティング努力。」
ロックポートが行っている会話の多くにおいて、教育は重要な部分を占めています。
「市場に移行や混乱が生じるたびに、顧客を教育する必要があります。業界に対する私たちの教育の一環として、理論上のパフォーマンス速度や従来のネットワーク ベンダーが提供する速度に注目するのをやめる必要があるということです。ネットワークに負荷がかかっているとき、そのネットワーク上で複数の異なるタイプのワークロードが実行されているときに、実際のアプリケーションにどのような影響があるのかを実際に調べて測定し、それが顧客にとって本当に重要なことなのです。」
パフォーマンスの検証とデモンストレーションを支援するために、ロックポートは 2 つのセンター オブ エクセレンス (TACC とダーラムに 1 つ) を設置し、独自のテストベッドでもソリューションを検証する複数のチャネル パートナーを計画しています。 TACC Frontera システムを支えるシステムメーカーである Dell は重要なパートナーであり、Sultzbaugh 氏は Lenovo との初期の提携について言及しました。 ロックポートはまた、複数の垂直市場にわたる追加の「灯台顧客」の構築にも取り組んでいます。
競合他社の直接のレイテンシ比較について質問された Sultzbaugh 氏は、表面上は指標が誤解を招く可能性があると述べました。 ナノ秒の遅延に関する仕様は通常、データ転送なしで引用されますが、その場合は単なる理論上の能力に過ぎないと同氏は述べています。 「重要なのは、その帯域幅をどのように利用するか、そしてファブリック全体で予測可能なパフォーマンスをどのように実現するかです。」
「今日のロードマップでは、ノードあたり 300 ギガビット/秒を供給しています。現在、より高い帯域幅のスイッチがありますが、それらはスパイン リーフ アーキテクチャに基づいて構築されているため、混雑します。そしてそれが基本的なものです」と彼は続けました。問題は、複数のスイッチ ホップを通過する必要があり、それらのスイッチ ホップを集約することです。そのため、非常に低い遅延を実現できるにもかかわらず、パケットがパケットに滞留するために遅延のテールが存在するためです。ネットワーク、インフラストラクチャ全体が待機中です。そしてアプリケーション レベルで、ナノ秒のレイテンシーの能力からミリ秒のレイテンシーに移行します。実際に何をしようとしているかを [示す] ベンチマークで実際に測定する方法を見つける必要があります。パフォーマンスを重視するのです。それが私たちの課題です。」
「今日の顧客ベースの多くはすでにそれを理解しており、知っていると思います」と彼は付け加えた。 「そして、残りの人々を教育しなければなりません。」
Rockport は、Nvidia の Mellanox 部門が提供する InfiniBand と Ethernet (HPE の Slingshot ネットワーキングを技術的に分類する方法)、および現在スタートアップ Cornelis Networks の管理下にある独自の OmniPath ファブリックが支配的な競争環境に直面しています。
Hyperion Research のシニア アナリストである Mark Nossokoff 氏は、新しいスイッチレス ファブリック製品に可能性を感じています。 「ネットワーキング分野には、さまざまなアプローチでイノベーションを起こす余地が確実にあると思います」と同氏はHPCwireに語った。 「InfiniBand と Ethernet は進化のサイクルを進めており、その後 HPE が Ethernet に似た Slingshot を導入しました。次にスイッチレスのアプローチが登場しました。これはユニークで革新的であり、これにはいくつかのメリットがある可能性が非常に高いと思います [これにより、予測可能な遅延を短縮し、使用率の高いネットワークで発生する輻輳を最小限に抑えることができます。」
ノソコフ氏によると、輻輳の問題は、さまざまな種類の異種ジョブが多数存在するシステムで最も蔓延しているという。 「Rockport ソリューションは、多数のユーザーと、その上で実行される異種タイプのジョブが多数存在する大規模システムを対象としていると思います。異種とは、ジョブのサイズとジョブの実行時間の長さのことです。仕事を完了するには、システムの利用が必要です。システムの利用が増えるほど、Rockport ソリューションの利点がより実感できるでしょう。」と彼は言いました。
現在出荷されている Rockport のネットワーキング テクノロジーは、次の 3 つの要素で構成されています (以下で説明します)。