付属資料1 ペタフロップスマシンWG配付資料概略

PFM-WG-0001

Enabling Technologies for Petaflops Computing
(February/22-24/1994, App/Dev/Arch/Soft)
http://nhse.npac.syr.edu/roadmap/petaflops/peta.html
  • 1994年2月にPasadenaで開催されたワークショップの結果をまとめたもの。
  • MIT Pressから1995年7月に出版されている。日本で近日翻訳本が発売される予定(小林達・栗本武共訳、筑波出版会)。
  • ワークショップは、以下の4つの分野に焦点をあわせて実施された。
  • <編成されたWG>

  • Applications and Algorithms
    この規模の処理能力の開発の必要性と能力
    必要資源について知見を得た。
  • Device Technology
    半導体、光デバイス、超伝導素子
    それぞれについて強み、弱みを調べた。
  • Parallel Architectures
    プロセッサ、通信、メモリサブユニットを含む3種の構造を調査。
    実現しうるシステムを明確にするいろいろな技術力段階における最も望ましい
    構成と機能要素の集合を調べた。
  • System Software and Tools
    将来システムの実用的なアプリに対して、現在のソフト環境による主要な障害を明確にする。代替の環境と有用性を本質的に増加させる機能とのかかわりあいをも調べた。
  • <結論>

    エグゼクティブ・サマリから

    (1)
    実用的なペタフロップスマシンは現在の技術トレンドをベースにすれば約20年でできるであろう。
    (2)
    近い将来ペタフロップスを要求するアプリは科学、技術、経済、社会、情報基盤、管理の分野の広い領域に亘っている。
    (3)
    なによりもコストが根本的な実行可能性と時間軸を支配している。
    (4)
    信頼性は管理できるだろうが、現在のMPPよりはるかに多くの部品を有するシステムを妨げる唯一の理由はコストである。
    (5)
    システム・アーキに基本的なパラダイムシフトは必要ない。詳細は現在と異なるだろうが、NUMA、MIMD(可能ならSIMD)の進化型が満足させる。

     さらに、本文でペタフロップス実現の可能性ありとして提示されたアーキテクチャは、以下の3方式。

    a.グローバル・シェアド・メモリ
    b.マイクロプロセッサ・ネットワーク
    c.プロセッサ・イン・メモリ(PIM)

    (6)
    ペタフロップスマシンは直径が大きくなる。伝達遅延はシステムクロックサイクルで計られる。レイテンシ管理技術と百万のオーダのコンカレンシがこの規模のシステムのキーとなる。
    (7)
    メモリによっても支配される。しかし、科学技術の分野ではメモリ量は能力に対し線形以下の大きさであろう。ペタフロップスに対し30テラバイトオーダのメインメモリが要求される。
    (8)
    ペタフロップスマシンはより良いコストパーフォーマンスを達成する技術の集合によって構成される。半導体技術はいくつかのロジック回路を伴ったメモリを支配する。その進歩は半導体産業の進展に拘束される。光デバイスは広いバンド幅とモジュール間通信及び巨大ストレージを提供するが、ロジックデバイスができない。超伝導JJ技術は、非常に高いロジック性能と比類のない低消費電力をもたらす。
    (9)
    システムがエンドユーザアプリにとって実用的となるには、プログラミングとリソース管理のためのソフトウェア方法論に大きな進展が必要である。また、ソフトウェアテクノロジ・ワーキンググループ(第七章、129ページ)によれば、100ギガフロップスマシン用のソフトウェアは、ペタフロップスに向かないとしている。

    本文から

    (1)
    いつ:20-25年先-現在の技術トレンドが続き、技術が成熟した場合
    (2)
    誰によって:半導体デバイス、光デバイス、JJ開発が鍵を握る。また、ソフトウェア技術方法論、基盤開発が必要。
    (3)
    用途は:ターゲットが古めかしいプログラミング技法を使ったようなグランド・チャレンジスケールのアプリに限定されるなら、このようなシステムは使えないし、手に入らないし、実現しないだろう。成長する科学技術コミュニティと将来予想されるより広い情報管理の一般巨大市場コミュニティ(先進的な高速プログラミング方法論とNIIとしての集積を伴っている)の両方をターゲットとすれば、経済的に存立するし、何百万もの情報に対して行動する消費者によって直接・間接的に使われるだろう。
    (4)
    研究開発型製品における長期先行性:短期間のインパクトを持たなくても競争に勝つためやるべき。
    (5)
    本流となるハード・ソフトウエアの利用:システムは商用ソフトとコンパチでなくてはならない。また、プログラミングモデルは商業的成功に自信をもって並列プログラミング世界に入らせるISVを可能にしなければならない。
    (6)
    アプリを越えた価値:創造力、技術、さらに多くの舞台で予知できないが巨大な価値と重要性を持つ米国の競争力の本質的な能力をもたらす。
    (7)
    知的シナジー:このワークショップではペタフロップスコンピューティングの大きな理解もあるが、それを超えて重要で即効の結果はコンピュータ科学に対する国家の主要な貢献者のいくつかの間でシナジーとアイデアの交換・ふくらましができたことである。

    <これからやるべきこと>

    (1)
    超伝導技術
    (2)
    アプリケーション資源要求の規模拡大
    (3)
    将来的なアプリケーションのシナリオ
    (4)
    アーキテクチャーの詳細
    (5)
    SIA計画の拡張
    (6)
    プログラミング方法論
    (7)
    コンセプトとアプローチの代替案
    (8)
    アーキテクチャ的アプローチの代替案
    (9)
    安価なテラフロップスマシン
    (10)
    進捗のレビュー

    PFM-WG-0002

    The Proceedings of The Petaflops Frontier Workshop
    (February/6/1995, Arch/App)
    http://cesdis.gsfc.nasa.gov/~creschke/peta/report/report.html
  • 1995年2月にMcLeanでで開催されたワークショップの結果をまとめたもの。
  • このワークショップは、アーキテクチャ/テクノロジとアプリケーション/アルゴリズムが対象。
  • 第一節(5ページ〜)Introductionには、以下が記述されている。
    (1)いくつかのキーとなる出来事
    (2)今回のワークショップに先立つ諸活動
    (3)ワークショップの目的とアプローチ
    (4)報告のための組織
  • 第二節(10ページ〜)Issues for Petaflops Computersには、ワークショップでの成果や結論を含め、ペタフロップス・コンピューティングに対する論点のサマリが記述されている。
  • 第三節(17ページ〜)Workshop Organizationには、このワークショップの議事次第や発表題目18件(19ページ)、主催者、発表者、出席者の情報が記述されている。
  • 第四節(24ぺージ〜)Overview of Presentationsには、このワークショップの発表内容の概要について記述されている。
  • 第五節(28ページ〜)Architecture and Technology Issues and Challengesには、アーキテクチャとテクノロジに関する以下の6件の発表内容の要約が記述されている。
    (1)
    Heterogeneous Computing: One Approach to Sustained Petaflops Performance
    (2)
    Processors-In-Memory (PIM) Chip Architectures for Petaflops Computing
    (3)
    A Petaops is Currently Feasible by Computing in RAM
    (4)
    Design of a Massively Parallel Computer Using Bit Serial Processing Elements
    (5)
    Non von Neumann Instruction Set Architecture as an Enabling Technology in Grand Challenge Systems
    (6)
    Taming Massive Parallelism: The Prospects of Opto-Electronic CRCW-Shared Memory
  • 第六節(69ページ〜)Applications and Algorithms: Issues and Challengesには、アプリケーションとアルゴリズムに関する以下の発表内容の要約が記述されている。
    Enabling Data-intensive Applications through Petaflops Computing
  • 第七節(71ページ〜)Discussion and Conclusionsには、ワークショップでの結論や将来に対することが記述されている。
  • PFM-WG-0003

    P.E.T.A.: PetaFLOPS Enabling Technologies and Applications
    (Arch/App/Soft)
    http://www.aero.hq.nasa.gov/hpcc/petaflops/peta.html
  • P.E.T.A.は、ペタフロップスコンピューティングに関する、WWW上のリソース・センターである。ここを見ると、ペタフロップス・コンピューティングに関するワークショップや会議の情報、出版物、議事録などの情報を得ることができる。
  • 今回配布の資料には、以下に関する記述が載っている。
    (1)
    PetaFLOPS Architecture and Systems Structure
     ペタフロップスに関する論点が、質問と回答という形で簡単に書かれている。
    (2)
    PetaFLOPS Applications and Software
     ペタフロップスコンピューティングの適用分野、ソフトウェア技術やアーキテクチャの論点となる項目、アプリケーション・グループのゴールなどが簡単に書かれている。
    (3)
    1995 PetaFLOPS Computing Summer School/Workshop
     ペタフロップスのアプリケーションとアルゴリズムに関するワークショップの紹介。
  • PFM-WG-0004

    Applications and Algorithm Challenges for PetaFLOPS Computing
    (1995 Petaflops Computing Summer School/Workshop,August/14-23/1995 )
    http://www.mcs.anl.gov/summer.study/index.html
    (1)
    ゴ−ルの設定
    障壁とロ−ドマップの明確化
    (2)
    アプリケ−ション・ケ−ススタディ
    科学技術の分類、各研究分野での要求性能を別表として掲載
    (3)
    ケ−ススタディの詳細記述
    生物学、気象・海洋のモデリング、化学・物理学( 天体物理) 、薬学、工学
    自動推論、経済学、核兵器
    (4)
    アルゴリズム: 科学技術計算に用いられるアルゴリズムの列挙
    (5)
    ソフトウェア: 現状の効率は15% 、向上の指針は少ない。
    プログラミング言語、モジュ−ル化、レイテンシ、並列I/O
    (6)
    ア−キテクチャ: パソコンのネットワ−クによる並列化
  • 対称マルチプロセッサ
  • プロセシング・イン・メモリ
  • 細粒度MIMDシステム
  • (7)
    性能のモデリング: ボトルネックについての情報を得る
  • 現状のモデルは既に使えなくなっている( 企業の研究者の言)
  • isoefficiency function
  • (8)
    主な成果
  • 商品化される部品を使ったとして20-25 年後に実現できるだろう。
  • プロセッサア−キテクチャの提案
  • レイテンシ管理、メモリ必要量、高性能プロセッサの要求等があるが、あまり具体性があるようには思えない。
  • これからの実施項目

  • アプリケーション実行上での制限項目のリスティング
  • Support research
  • Sponcer development
  • Point design studies
  • Fund advanced system software
  • Sponcer additional workshop
  • petaFLOPS oversight commiteeの設立
  • PFM-WG-0005

    PetaSoft '96
    (Petaflops Summer Study on System Software,June/17-21/1996 )
    http://www.aero.hq.nasa.gov/hpcc/petaflops/petasoft96/ps.html
  • スポンサー:ARPA,DOE,NASA,NSA,NSF
  • Petaflops Architecture Workshop のFindingsとRecommendationsをもとに議論
  • ペタフロップスシステムのソフトウェアコンポーネントのための韻律則を評価する。
  • 11月にProceedingsが出る予定。
  • http://www.cacr.caltech.edu/calendar/petasoft/にシンポジウムの様子を写した写真のみ掲載
  • PFM-WG-0006

    Petaflops Architecture WorkShop- DRAFT Findings, DRAFT Recommendations
    (April/22-25/1996 )
  • Findings
    http://www.aero.hq.nasa.gov/hpcc/petaflops/petasoft96/paws.outcome/findings.html
     アーキテクチャ、素子テクノロジ、アプリケーション/アルゴリズム、システムソフトウェアについて詳述されている。
     SPD(Special Purpouse Device)-最初のペタフロップス・コンピュータは特殊なものであるが、5年以内に実現するかもしれない。価格は控えめに見ても1千万ドルするだろう。
  • Recommendations
    http://www.aero.hq.nasa.gov/hpcc/petaflops/petasoft96/paws.outcome/recommend.html
     アーキテクチャ、素子テクノロジ、アプリケーション/アルゴリズム、システムソフトウェア、一般事項について詳述されている。
     一般事項では、米国内のスーパーコンピュータ産業がペタフロップスの能力をつけるよう政府のてこ入れを主張している。また、準ペタフロップスを実現する中間的プログラムの必要性が説かれている。
  • PFM-WG-0007

    Intel Homepage
    http://www.ssd.intel.com/tflop.html

     Sandia National Lab. にテラフロップスをめざした20GFlopsの装置を納入(96/4/9)、年末までにテラフロップスを達成予定。
     システムはASCIプログラムのアプリをサポ−トするために、インテルParagon Operating system をLight-Weight Kernel(LWK)によって拡張したものである。

    ASCI(Accelerated Strategic Computing Initiative) Teraflops Machineの説明

  • 1.8 Tflops peak performance
  • 4500 dual node
  • 9000 Pentium Pro
  • 600 GBytes memory
  • 2 TBytes RAID disk strage
  • 85 cabinets
  • 1600 square feet
  • 400 MBytes/s transfer speed between two nodes
  • 50 MBytes/s cross-section bandwidth between all nodes
  • 800 kW of power
  • 4,600万ドル($46million)
    Teraflops computer is first step in pursuit of nuclear freedom.
    http://www.ssd.intel.com/press/record1.html
  • Pragonの紹介(装置の写真入り)
  • PFM-WG-0008

    Concurrent Supercomputing Consortium
    1995 Annual Report
    http://www.cacr.caltech.edu/publications/annreps/annrep95/cover.html

     インテルTouchstone Deltaがインテル Trex(Paragon XP/S Model L38)に置き換えられたこと、NSF 資金により74の新ノ−ドが設置できたこと等を含めたトピックスの紹介。以下に目次を記す。

    (1)
    Introduction
  • Enhancement of CSCC Facilities
  • Creation of Caltech's Center for Advanced Computing Research
  • Future Challenges
    Scalable I/O Initiative Under Way
    Stimulating Progress in High-Performance Computing
    Outreach Activities
    CSCC Mission and Strategy
  • (2)
    Computational Research
    (Research Articles by Topic. Author Index also found here.)
    (3)
    CSCC Administration
    (4)
    Computing Facilities
    (5)
    Recent Publications
    (6)
    World Wide Web Documents
    (7)
    Acknowledgments

    FM-WG-0009

     The 2nd Workshop On The Petaflops Frontier

  • Frontiers '96に先だって開催されたワークショップのAgenda
  • ワークショップ、シンポジウム参加の事前登録者名簿
  • PFM-WG-0010

     The Petaflops Systems Workshops

  • 今年(1996年)に開催されたPetaflops Architecture WorkShop(PAWS'96)とPetaflops System software Summer study (PetaSoft'96)の二つのプロシーディングを合わせたもの。
  • The 2nd Workshop On The Petaflops Frontier 登録時に受付で配付された。
  • Abstract、Contents、Findings、Recommendationsを抜粋。前回配付した資料PFM-WG-0006 PAWS DRAFT Findigs Recommendations が改変されており、さらにPetaSoft'96の結果が追加されている。
  • PFM-WG-0011

     Proceedings of Frontiers'96

  • The Sixth symposium on the Frontiers of Massively Parallel Computation のプロシーディング。
  • 1996年10月29日〜31日の発表分を掲載してあるもので、このうちContents、Conference committee、Program Committee、Referees、Petaflops Computing/Point Design Studiesを抜粋した。
  • PFM-WG-0012

     Frontiers'96 出張報告

    (1) 米国出張レポートOHP集 AITEC 高張
    (2) 海外出張報告 AITEC 河西
    (3) Frontiers'96参加報告書
    詳細は本書付属資料2、3参照。
    電総研 関口

    PFM-WG-0013

     結合網とルータに関する最近の話題(天野委員発表OHP)

    PFM-WG-0014

     Supercomputing'96 報告(山口主査発表OHP)

    PFM-WG-0015

     MPC++(石川委員発表OHP)

    PFM-WG-0016

     PetaFLOPS Computing(ソフトウエアの観点からの話題提供)
     (笠原委員発表OHP)

    PFM-WG-0017

     Peta xOPSマシンに向かってのメモリ・アーキテクチャのお話(中島(浩)委員発表OHP)

    PFM-WG-0018

     PFM-WGアプリケーションの観点からの話題提供(福井委員発表OHP)

    PFM-WG-0019

     並列ベクトル計算対スカラー並列計算(横川委員発表OHP)

    PFM-WG-0021

     21世紀の半導体技術(東芝 海野所長講演OHP)

    PFM-WG-0022

     ペタフロップスマシンの実現性〜ソフトウェア構築の観点から〜(妹尾委員発表OHP)

    PFM-WG-0023

     大規模並列における応用とその支援ツール(中島(克)委員発表OHP)

    【次へ】