Back to list
グローバルワーキスペースア키텍チャにおけるトポーデウインターナーショナルメカニズムに対する注意力メカニズム
An Attention Mechanism for Robust Multimodal Integration in a Global Workspace Architecture
Translated: 2026/3/7 10:14:39
Japanese Translation
グローバルワーキステーション理論(GWT)は、認知神経科学で inspired される情報処理の世界において、多重モダリティ統合システム内の関連的モダリティの一部を選択し、柔軟な思考が形成されることを主張しています。この認知フレームワークは、多重モダリティの統合に向けた新たなコンピューティングアーキテクチャーを提案します。実装された GWT は、それ自身の多重モダリティ表現機能を探索してきましたが、それに伴う注意力メカニズムはまだ研究されていません。ここでは、我々はグローバルワーキステークシステム内のトポーディックな注意メカニズムを開発し評価します。まず、我々の注意メカニズムが、単純な形状とMM-IMDb 1.0の複雑性を増加させた両方の多重モダリティデータセット上でノイズの収束効率を改善し、確認しました。そして、我々はクロスタスク及びクロスモダリティの一般的性を持ち合わせていません他の多重模様注意力モデルが文献から開発されたことを強調する特異な機能を示しました。MM-IMDb 1.0 ベースラインとの比較において、我々の注意メカニズムがグローバルワーキステークシステムを先進レベルに競争させています。
Original Content
arXiv:2602.08597v1 Announce Type: new
Abstract: Global Workspace Theory (GWT), inspired by cognitive neuroscience, posits that flexible cognition could arise via the attentional selection of a relevant subset of modalities within a multimodal integration system. This cognitive framework can inspire novel computational architectures for multimodal integration. Indeed, recent implementations of GWT have explored its multimodal representation capabilities, but the related attention mechanisms remain understudied. Here, we propose and evaluate a top-down attention mechanism to select modalities inside a global workspace. First, we demonstrate that our attention mechanism improves noise robustness of a global workspace system on two multimodal datasets of increasing complexity: Simple Shapes and MM-IMDb 1.0. Second, we highlight various cross-task and cross-modality generalization capabilities that are not shared by multimodal attention models from the literature. Comparing against existing baselines on the MM-IMDb 1.0 benchmark, we find our attention mechanism makes the global workspace competitive with the state of the art.