Back to list
意味を持つ言葉:学習された語彙トークン表現における機動・感覚規範
Words that make SENSE: Sensorimotor Norms in Learned Lexical Token Representations
Translated: 2026/4/24 20:34:13
Japanese Translation
arXiv:2602.00469v2 Announce Type: replace-cross
要約:単語埋め込みは共起パターンから意味を導出する一方、人間の言語理解は感覚的・運動的体験に根ざしています。私たちは、単語の語彙埋め込みからランカスターの機動・感覚規範を予測する学習投影モデルである「SENSE」(機動・感覚埋め込み規範スコアリングエンジン)を提示します。さらに、281 名の参加者が候補する非実在語(nonce words)の中から特定の機動・感覚の結びつきを呼び起こすものを選ぶという行動研究を行いました。この研究は、6 つの 11 つのモードにおいて、人間の選択率と「SENSE」の評価値間に統計的に有意な相関があることを示しました。これらの非実在語の選択率に対するサブレキシャル解析は、内受覚規範に対して系統的な音韻感音パターンを解明し、テキストデータから候補の音韻要素を計算機上で提案する道筋を示唆しています。
Original Content
arXiv:2602.00469v2 Announce Type: replace-cross
Abstract: While word embeddings derive meaning from co-occurrence patterns, human language understanding is grounded in sensory and motor experience. We present $\text{SENSE}$ $(\textbf{S}\text{ensorimotor }$ $\textbf{E}\text{mbedding }$ $\textbf{N}\text{orm }$ $\textbf{S}\text{coring }$ $\textbf{E}\text{ngine})$, a learned projection model that predicts Lancaster sensorimotor norms from word lexical embeddings. We also conducted a behavioral study where 281 participants selected which among candidate nonce words evoked specific sensorimotor associations, finding statistically significant correlations between human selection rates and $\text{SENSE}$ ratings across 6 of the 11 modalities. Sublexical analysis of these nonce words selection rates revealed systematic phonosthemic patterns for the interoceptive norm, suggesting a path towards computationally proposing candidate phonosthemes from text data.