「人間主体の知的情報技術」調査ワーキンググループ活動の一環として、欧州における研究開発の最新情報収集を目的に行なった海外調査について報告する。
| ・日 程: | 1999年9月21日(火) から 1999年10月3日(日) |
| ・調査員: | 奥乃 博 主査、北畠 重信、小林 茂 |
|
・主な調査先: |
1) CLAS(英国ロンドン) |
| 2) NTTデータ英国支店(英国ロンドン) | |
| 3) シェフィールド大学(英国シェフィールド) | |
| 4) SONY CSL パリ(仏国パリ) | |
| 5) CSCWD'99(仏国コンピエーニュ) |
1. CLAS
「人間主体の知的情報技術」調査ワーキンググループ活動の一環として、欧州における研究開発の最新情報収集を目的に行なった海外調査について報告する。
(1)概要
これは言語および音声処理における、形式的理論と統計的データを統合するモデルに焦点を当てた会議である。情報技術の適用においては、すでに統計的手法が開発されているが、この会議では、これまでに学んだ教訓を評価して、将来の研究のためのニーズと方向性を探ることを目的としている。
(2)セッション一覧
1999年9月22日
1999年9月22日
2 NTTデータ英国支店
(1)概要
支店長・菅野氏から、欧州の情報通信産業について総括的な話を聞かせて頂いた。以下、その要点を記す。
(2)欧州通信産業はモバイルに強い
欧州の通信産業は、モバイルに強い。
イギリスでは特に、携帯電話が普及している。日本と異なる特色としては、小型軽量化よりも、電話機にカードを挿して話すプリペイド・カード方式が発達。課金に対する安心感が主要な理由かと思われる。
銀行などのカード類は、日本と違い磁気式ではなくICカード式が先行して普及している。現在はセキュリティ対策が主だが、今後サービスの高度化も行なわれるだろう。
(3)インターネットは民族によって普及率に偏りがある
インターネット人口の比率には、国によって興味深い傾向がある。
概してラテン系諸国は日本(8%)と同程度かそれ以下だが、非ラテン系の諸国は高い傾向がある。特に北欧諸国は30%以上と極めて高い。人口密度や冬に家の中で過ごす時間が長いなどの要因もあるかも知れないが、やはり国民性も関係していると思われる。
(注意)日本のインターネット人口は増加を続けているため、現在では上記の 数値よりも大きくなっていると思われる。
(4)英国のインターネット接続プロバイダー(ISP)の接続料無料サービス
少し前にはISPによるユーザ獲得のための無料パソコン配布が米国で話題になったが、最近、イギリスでは、ISPによるインターネト接続料金無料のサービスが始まっているという。これは、そのISPにインターネット接続が増えると、ユーザからそのISPのアクセス・ポイントへの電話量が増え、電話会社への電話料金収入が増えるので、イギリスでは電話アクセスの多いプロバイダに対して、その電話料金の利益の一部が電話会社からペイバックされる仕組みがあり、これを無料接続の基本コストにまわすことが可能になる。ISPは、顧客が増えれば、ポータル・サイトとしての価値も高まり広告収入が増えるし、電話会社からのペイバックも増える。そこで、より多くのユーザを獲得しようと頑張ってサービス競争をしているとのことだった。
(5)アイルランドが欧州外からの展開拠点として注目される
アイルランドは、ITに関して海外から注目されている。その理由として、
などが挙げられる。 欧州外からの欧州展開の拠点として、今後重要度を増すと見られる。
(6)欧州もプラットフォームはウインテル
パソコンのプラットフォームに関しては、Linux が欧州発祥ながら、日米と同様に今のところはIntel-Windows が主流である。その一番の理由としては、Windowsで作成されたデータがやり取りされるために、結局みなWindowsでなければならなくなってしまうことがあるのではないかと考えられる。
基本ソフトウェア類がブラックボックス化するのに伴い、研究開発がアプリ寄りになる傾向がある。
(7)欧州の特徴的手法「SLA」
最近、欧州、特にイギリスで先行している特徴的な手法に、「SLA(Service Level Agreement)」がある。これは情報システムの運用などに関する最も大枠の仕様を、開発契約時に定量的に明確にするためのもので、契約社会化の進んだ欧州ならではと言える。現状では 「仕様記述言語」等が開発される段階には到っていないが、形式化手法も徐々に整備されるだろう。
(8)その他
ITに直接の関係はないが、ロンドンの日本食レストランが苦境にあるという。ただ日本食レストランにも、ロンドン在住の日本人を狙ったものと、現地英国人を対象に定着したものとがあり、閉店に追い込まれているのはほとんどが前者。これは日本の不況により、多くの日本企業が撤退したことの影響が大きいとのこと。
表面的な国際化のもろさを示す教訓を見ることができる。
3 シェフィールド大学
(1)概要
シェフィールド大学は音声処理、特にCASA(Computational Auditory Scene Analysis)と呼ばれる技術領域に関する世界最大の拠点である。
始めに学内の研究者に対して、奥乃主査から現在の研究に関するプレゼンテーションを行なった後、いくつかの研究室を巡り、それぞれの研究内容を説明してもらった。関連する研究者が一カ所に集中することによって、各研究者が自分の位置づけを明確に意識し、相互にモチベーションを高め合っている印象を受けた。
音声処理というと、日本ではまだ興味中心・研究段階の技術という認識を持たれる向きもあるが、ここでは最初の研究例のように極めて現実的な要求があり、技術も実用的なレベルに近づいている。
(2)混合音声の分離
国防省の依頼により行なっている、軍事利用を目的とした音声分離技術。
混合音声を各要素に分離する手法としては、複数マイクで採音し、その方向情報を利用することが多いが、ここでは含まれる可能性が分かっている音情報に関する、周波数や周期性などの特性を、予備知識として利用しながら切り分けている。
プロトタイプを用いて、注目する3〜4の音(とその他の雑音)にそれぞれ分離する実演をしてくれた。
(3)BBC放送音声の認識
BBCから提供されている、最近何年かの放送を録音したCDをサンプル音源として、音声認識・テキストへの変換ソフトを開発している。これらのCDはざっと十数枚のセットで、音声認識・情報検索のコンテスト用に作成されたもの。
このコンテストに相当する日本版イベント(ただし新聞のテキストデータを用いた情報検索)「IREX」の成果発表会が本調査出発の直前にあったので、これと対比させて見ることができた。
デモンストレーションでは、既に音声認識した結果がハードディスクにデータ化されていたが、認識・変換は、実際の音声に対しほぼリアルタイムで可能だという。
ここでは認識の他に、探したい記事を自然言語でキー入力すると、その意味内容に基づいて該当する記事を表示し、同時にもとの音声を再生するインタフェースが作られていて、我々も試すことができた。音声認識精度は極めて高いように思われ、明瞭な発音だけでなくインタビューを受ける一般者の口篭もった発音もきれいにテキスト化されていた。かえってアナウンサーが言い慣れているために早口になった「BBC」が「B・C」になっていたりするのが例外的な認識失敗として目に留まった。
(4)情報欠落のある音声の認識
途切れ途切れのラジオ音声のような情報欠落のある音声や、複数ストリームの音声を与えられたときの認識に関する研究。
欠落やノイズへの対策は、音声認識の実用化には重要な技術であろう。
(5)CASAツールキット
音声処理に関連して開発されている様々なソフトウェア(自動発話認識、音声の合成、各種解析、表示、etc.)をライブラリ化し、これらを部品として組合わせることによって、目的の機能を持ったシステムを構築するのを支援するフレームワークの開発。
◆研究者から受けた印象
大学内の研究所を訪ね回り(次節で述べる研究所にも共通して)、感じたことが2点ある。
4 SONY CSL パリ
(1)概要
日本企業関連の研究所ではあるが、所長以下すべての所員を含め日本人はおらず、完全に現地に基盤を置いている。パリ市街地ながら、表通りからやや奥まった静かな地区の一角にある。研究者は特定の製品を念頭に置くというより、技術開発そのものを楽しんでいるようで、いかにも研究所という雰囲気がある。いくつかの研究室を訪ね、研究内容に関する説明を聞いた。
(2)エージェント同士の対話学習
複数のエージェントが、丸や四角などの単純な図形で構成される世界をテレビカメラを通して認識し、その世界についての概念を学習する。さらに学習した概念について、エージェント間で対話するための言語を形成する。
概念の学習そのものは単純で、昔の素朴なAIの教科書がよく参照した、ウィンストンによる積み木世界での概念学習モデルのようなものと思われる。
研究の主な関心は、それよりも、知識の追加に伴う、エージェント間での言語の形成にある。エージェントは概念に、論理値を要素とする2次元配列を対応づける。配列の2つの座標軸は単語とカテゴリーを表わす。配列の単語軸は同じ概念に複数の単語が割り当てられる可能性に対応し、カテゴリー軸は、同じ概念が場面によって異なる側面から捉えられる(例えば馬は、動物であったり、乗り物であったりする)ことに対応している。2つのエージェントが対話を通して、同じ概念に対し同じ配列を形成することによって、言語を共有できることになる。状況に応じて、概念を表わすのに適切な単語を用いることも可能になる。
(3)人間の音声の合成
発話・リスニング・記憶の機能を備えた、エージェントの認知機能のインフラストラクチャー開発の一環として、音声・音楽合成を研究している。
デモンストレーションに用いられたソフトウェアは、テキストを読み上げる音声の合成に際して、パラメータを変えることによって、小さな子供・大人、男性・女性、興奮している・冷静などの感情などの違いを、声色やイントネーションに反映することができる。(余談ながら、このソフトウェアはLISPで記述されていた。既に多くのライブラリを持っていたので、これらを活用して効率を上げるため、とのこと。)
(4)複数ソースからなる音のミキシング
いくつかの楽器の演奏音を混合して合奏の音を構成するシステム。楽器間の音量の比率や楽器の方向など、様々な制約条件を設定しつつ、楽器や聴く人の位置を移動するといったことが、GUIで簡単にできる。原理として難しいことはないと思うが、それを実際に、簡単なインタフェースで使えるよう実現していることに応用上の重要性があるだろう。開発者は、ゲームに応用される可能性にも言及していた。新世代ゲーム機以降、視覚的表現の品質が格段に向上してくると、音声も、こうした技術で現実感を高める要求が出てくと予想される。
(5)発話理解に伴う目の動きの実現
人間は、例えば話し手が「この図は・・」と指差しながら説明するとき、言葉の意味を解析・理解してから指の位置に視線を向けるのではなく、先に視線を移動しつつ言葉を理解する。
これと同じように、音声情報と視覚情報を併用した認識において、話し言葉の理解フェーズをスキップし、発話と同時に視線を話題の対象に移動することができないか、という研究の紹介。
これから話される対象について、視覚側で素早く対応を開始することによって、より正確で効率の良い理解を実現したいという発想と思うがまだアイデアの段階のようだ。
◆研究者から受けた印象
研究所長のSteels氏から「国の開発資金援助の制度をどう思うか」に関する意見を頂いた。氏は「間違いだらけだ」「例えば、何か研究の成果が出ると、すぐ研究者にビジネスを起こせという話になるが、そうすると研究はそこで停滞してしまう。出資者が研究サイドを理解すべく近づいてくるべきだ」と苦言を呈した。(その点で今の環境は研究に専念でき満足している、と補足した。) 純研究者的な立場からの意見であるが、製品化後の技術競争力の持続、あるいは有望な技術を発掘育成できる土壌の形成という観点からは、重要な問題提起も含んでいると思われる。
5 CSCWD'99
(1)概要
ネットワークを通して流れてくる国際会議等の開催リストから抽出したものだが、詳細に関する事前情報は、Web上などにもほとんどなかった。テーマと趣旨説明から推測し、計算機+ネットワークの応用技術として注目すべき発表が期待され、また、どのような会議か押さえておく必要はあるとの判断から、参加の運びとなった。
現地で配布された名簿をみて驚いたのは、欧州での開催にもかかわらず、参加者の6〜7割が中国関係者だったこと。しかも、海外の大学の在籍者等でなく、本土の研究者も多い。この会議は、今回の開催地にあるコンピエーニュ工科大学と中国科学院から
General Chairs が出ていることを知って納得した。
会議そのものの歴史が浅い(4回目)ためか、内容的には、研究初期段階の調査・考察報告や、CORBAあるいはWebを用いたアプリケーション試作を趣旨とした発表も多く目に付いた。また、主催者・発表者とも不慣れな部分があったらしく、直前になってのプログラム変更が相次ぐなど進行にはラフな面があった。
しかし参加者には、自分達が中心となって情報通信分野に1つの国際活動を立ち上げていくことに対する非常な誇りと意気込みが感じられた。ちょうど中国の建国50年と重なった最終日の10月1日には、最初のセッションに先立ち、国籍に関係なく会場全体が一体となって万歳三唱をするなど、独特な熱気があった。
人材が最重要である情報通信技術の分野に、豊富な人的資源を有する国や地域が次々と進出してくるのには、脅威が感じられる。CSCWは研究対象としてのみならず、これまで埋もれていた潜在能力を効率よく発現させる手段としても注目すべきテーマであると思われる。
Linuxはフィンランドの技術者によって開発され、アイルランドのIONA社はORB製品で有名であるが、前述のNTTデータ・菅野氏の話からも、それらが突発的な現象でないことがうかがえる。そうした状況とも考え合わせ、情報産業、特にソフトウェア産業は従来の「工業先進国」という勢力図とは無関係に成長し始めていることへの認識を強めた。
会議の発表内容の傾向を見ると字義通りの、計算機支援による共同設計そのものの研究は比較的少なく、CAD、情報検索、ネットワーク利用のアプリケーション一般など、取り上げるテーマに関しては枠を大きく設けているようだ。
(2)セッション一覧
聴講したセッションは以下の通りである。(キャンセル等により並列セッションが1本化されたため、これが全て。)
(3)主要な発表内容
上記中、いくつかの発表の概要を記す。
仮想共同作業環境の構築において、デスクトップ中心だった従来の機能に対して、プロジェクトごとに仮想世界を構築するアプローチの提案。 そこでは、プロジェクト固有の、空間・建物・通路・部屋などを自由に設計できる。その中に開発に関係するオブジェクトが置かれ、作業者自身も、移動先の仮想世界に表示される。これによって、共同作業者が互いに何をしているか知ることもできる。
(補足)通路や建物は、ポインタやメニューなどに比べて本質的な情報を附加しているわけではないが、実際の画面サンプルを見ると煩雑なデスクトップよりもはるかにストレスが小さい。 最近、在宅勤務やモバイル環境の導入時に公私の境界が曖昧になるモラルの問題が懸念されているというが、そのような精神的な節度に関しても、現実世界のメタファーは有効な解決の鍵になるかも知れない。
CADシステムを用いた機械設計において応力計算をするよく知られた手法は、表面形状を微少な三角形に分割近似する。その際、従来はくびれなどの曲面で分割が細かくなり、効率が落ちる問題があった。これを改善し、十分な精度を保ちながら、表面全体をほぼ一様な大きさの三角形に分割して計算する方法を開発した。
この研究に関しては、欧州各国のメーカに対して技術提供し、逆に研究資金の援助も受けている。
電子商取引の発達により誕生した「仮想組織」の編成機構に関する研究。仮想組織は、ネットワーク上に必要な期間だけ発生存続し、店舗機能などを果たすもの。仮想組織の柔軟で機動的な特性を実現するため、マルチエージェントアーキテクチャによって自動的にパートナー選択する機構の、フレームワークを提案する。エージェントとしては、組織を構成するメンバに対応するものと、「マーケットエージェント」との2種類を用意する。マーケットエージェントは必要時に仮想組織に対応して生成され、要件に基づいてメンバへの呼びかけと選定を行ない、編成をコーディネートする。編成の過程で用いるネゴシエーションプロトコルは、複数の判断基準による評価と、分散制約解決を可能にしている。
製品に対する感性的表現の解析を可能とする試み。技術の用途としては、たとえば自動車のドキュメントを探すときに、検索条件を自然言語で入力し、それに適合するものを自動選択するなど。基本的にはフルテキストのインデキシングの手法を使うが、同義語を使われたときに検索にかからない問題がある。この問題の解決のため、「同義語」(ここでは「置き換え可能な単語」ではなく「強い相互関連のある単語」と、緩く定義)を自動的に形成する。単語の関連性の判断は、(1)他の単語との共起性をベクトル化し、(2)ベクトルが似ている単語は関連が強いと判断する、2つのステップによる。これによって、計測可能な値と認識を表わす言葉の間の対応を解析することが可能になる。
従来のCADは「開発」フェーズの支援を主とするが、これよりも早い段階の、「設計」に近い支援をするツール、"Computer Aided Styling tools" を考える。典型的システムとして、動物のイメージを用いた自動車のデザイン支援環境をとりあげる。 通常、自動車のデザインは全くのゼロから発想が始まるのではなく、既存の形状、特に動物を参考にしている場合が多い。そこで、データベースにさまざまな動物のイメージを格納し、それに連動したモーフィング機能を提供することによって、デザインを支援する。
企業全体としての知識管理・活用を目指す。きちんと規格化されたグローバルなシステムを前提したアプローチではなく、企業を、知識を局所的に生成管理する独立なグループの集まりと捉える。この場合、従来のように種々の知識表現手法(概念モデル、ハイパードキュメント、フルテキストインデキシング等)を用いるのは設計の一貫性の障害となるため、知識管理のバックボーンとしてオントロジーを用いるのが有効と考えられる。(過去の知識管理手法やオントロジーについて、問題点などを整理したという段階で、具体的提言には至っていない。)
6 付記
(1)大英博物館見学
ロンドンでの空き時間に、急ぎ足ではあるが大英博物館を見学する機会があった。
情報技術との連想で、いくつかの感想を持った。
膨大な情報をさまざまな視点から検索・整理する支援の必要、あるいは実物は1つしか存在せず、貴重な品々が世界中の各博物館に分散せざるを得ないことを実感し、電子図書館のようなシステムの有用性を再認識した。しかし、実際に博物館に行って見るときの、実物の存在感や本物であるという感慨は、情報以上の作用力を持つ。また目にする角度、光線の具合、他の見学者の行動など、偶然の要素が理解や発想に影響する可能性も大きい。これらの要素は、電子情報システムにとっては困難な壁であるが、同時に、研究の余地を多く提供するものと思われる。
展示のレイアウトには、列挙や対比、原状の再現などさまざまな手法が見られ、多くの知識と工夫が陰の力となっていることをうかがわせた。一方、見る側にも見方のノウハウが必要である。一般の見学者でも、専門家の着眼点をアドバイスされたら、より興味深く観察できる場合もあるに違いない。電子的システムにおいても、情報の氾濫に伴い、この種の支援の価値はさらに高くなると予想される。
現代文明の代表的産物として、将来、ソフトウェアを博物館の展示対象としようとすると、何をどう見せるか、難しく思われる。現在博物館に収まっている遺物も、正しくはそのものが重要というだけでなく、背景にあった文化や事実を伝える媒体なのだろうけれども、情報の量やウェイトの点で「情報化社会」は、歴史上かつてないフェーズの開始点なのかも知れない。
(2)コンピェーニュ城見学
CSCWDのコンファレンスのオプションとして、コンピェーニュ城の見学会が開催され、それに参加しておもしろい話があったので、述べておきたい。
コンピェーニュ城はルイ15世が別荘として建てたものであり、フランス革命がなければベルサイユの次の宮廷になっていただろうといわれている。マリーアントワネットがこまごまと注文を付けた豪華な宮殿であるが、フランス革命が起こったため彼女自身が住むことはなかった。約半世紀後のナポレオン3世の時代に、ここで贅沢を尽くした生活が行われ、現在は博物館となっている。
見学でいろいろ見たものの中には、中国文化の影響もいくつか見られた。その中で、ただ一つだけ日本文化の影響というものが紹介された。それが何とゲームマシンであった(パチンコ台を少し大きくして横に寝かせたようなもの)。今の情報技術で、世界にほこれる日本の独創技術というと、すぐゲームソフトが連想されてしまうことを考えると、なかなかおもしろい。