2031 articles
マルチモーダルなシーケンシャルリコメンデーションの強化
Multimodal Enhancement of Sequential Recommendation
我々は、MuSTRec(マルチモーダルとシーケンシャルトランスフォーマーに基づいた推奨)という新しい推奨フレームワークを提案しました。このファレノプシスはメラニック・モンドアルとシーケンシャルの推奨法の概念を統合しています。MuSTRecが抽出されたテキストや視覚特徴からアイテム間グラフを作成します。それがクロスアイテム類似性と協同フィルティングセントラックスの信号を集めます。また、頻度に基づく自...
Original: arXiv:2602.07207v1 Announce Type: cross Abstract: We propose a novel recommender framework, MuSTRec (Multimodal and Sequential Transformer-based Recommendation), that unifies multimodal and sequentia...
シーケンスとしてのノード:対応型マルチモーダリティ・グラフ推薦
Sequences as Nodes for Contrastive Multimodal Graph Recommendation
複数種類の材料が混在している推薦システムにおいて、『冷たくなった初歩』やデータ不足に直面する問題を解決するために、多くのマルチモーダル、シーケンシャル(順序的な)そして対応型の技術が提案されています。しかし、これらの強化は推奨性能を向上させる一方で、冗長さや有用な意味を持たないノイズを持ってきました。これを解決するために、私たちの研究では、MU-SIC-REC(マルチモーダルシーケンス・アイテム対...
Original: arXiv:2602.07208v1 Announce Type: cross Abstract: To tackle cold-start and data sparsity issues in recommender systems, numerous multimodal, sequential, and contrastive techniques have been proposed....
マルチ代理人を搭載したAI:モバイルエッジネットワークでの多モーダル大モデルの高速・偏義性対応推論
Multi-Agentic AI for Fairness-Aware and Accelerated Multi-modal Large Model Inference in Real-world Mobile Edge Networks
ジェネレーティング AI (GenAI) は、自然言語処理やコンテンツクリエーション分野でアプリケーションを transformative に変化させました。しかし中央的なインフェクションは、高遅延、制限のされたカスタマイズとプライバシーに関する懸念によって支えられています。モバイルエッジネットワークでの大規模モデル (LM) の展開で有望を見込む解決策が登場しました。しかしながら多種のモーダルな...
Original: arXiv:2602.07215v1 Announce Type: cross Abstract: Generative AI (GenAI) has transformed applications in natural language processing and content creation, yet centralized inference remains hindered by...
カognitivアルゴリズムと系のエピモディー記憶、サメナメモリそして彼らの習得
Cognitive algorithms and systems of episodic memory, semantic memory and their learnings
伝達的な記憶、言語で宣言できるものが"伝達的記憶"と呼ばれています。これは、エピモディー記憶とサメナメ記憶という2つの分離された部分からなります。これら2つの記憶は密接に関わりがあります。ヒッパカプスラの損傷は、典型的には事後的記憶や逆流記憶など多くの事前記憶障害や発達期記憶障害を引き起こします。これらの障害は我々が二つの記憶がどのように習得され、保管されそして整理されるかを理解する機会となります...
Original: arXiv:2602.07261v1 Announce Type: cross Abstract: Declarative memory, the memory that can be "declared" in words or languages, is made up of two dissociated parts: episodic memory and semantic memory...
aerial-autonomy-stack:リアルタイムより速い、ア autopilot 弓道免許のない、ROS2 フレームワークで感知に基づくドローンをシミュレーションとデプロイする
aerial-autonomy-stack -- a Faster-than-real-time, Autopilot-agnostic, ROS2 Framework to Simulate and Deploy Perception-based Drones
無人飛行機は、農業やインフラモニタリングからロジスティクスおよび防衛までの諸分野で急速に変化しています。これらのシステムに更なる自律性を注入することで、そのようなシステムはより有効且つ安定的になる可能性があります。したがって、それらを迅速にデザイン並びにデプロイする能力は重要な戦略的重要性要素となります。2010年代にはハイパフォーマンスコンピュート、データ、そしてオープンソースソフトウェアとの交...
Original: arXiv:2602.07264v1 Announce Type: cross Abstract: Unmanned aerial vehicles are rapidly transforming multiple applications, from agricultural and infrastructure monitoring to logistics and defense. In...
仮誇り:人類の推論と知的限界
Imagining the Alien: Human Projections and Cognitive Limitations
他の太陽系惑星で生命や、特に知的生命体がどんなようであるかについて考えるのは、人類文化において長い-runningテーマです。それは宇宙に関する人間固有の好奇心に象徴されます。これが数多くの芸術作品や風土紀に影響を与えたし、文学なども含まれます。これは哲学的で存在論的な問題でもあります。また宗教信条にもつながることがありますが、神とその超human beings(超自然的生物)は彼の上で象えていま...
Original: arXiv:2602.07284v1 Announce Type: cross Abstract: Imagining what life on other planets, and intelligent life in particular, may be like is a long-running theme in human culture. It is a manifestation...
Fin-RATE: Large Language Models (LLM) の投資信託決議文解析評価の新たな指標
Fin-RATE: A Real-world Financial Analytics and Tracking Evaluation Benchmark for LLMs on SEC Filings
Large Language Model(LLM)が金融産業における日益増の普及によって,複雑な規制発行を解釈するためには越来越期待されます。しかし、既存のベンチマーケットは多数の要素に焦点を当てることが多く,専門的な分析が要される情報に基づいて複数のドキュメントと報告期間間し、それらの会社の比較を行うプロフェッショナルな観点からは描かれていないことが多いです。これらは、データリテンションの失敗、...
Original: arXiv:2602.07294v1 Announce Type: cross Abstract: With increasing deployment of Large Language Models (LLMs) in the finance domain, LLMs are increasingly expected to parse complex regulatory disclosu...
RAGの検索を順次実施するための技術
Progressive Searching for Retrieval in RAG
大規模言語モデル (LLMs) の二つの重要な制限である過去の情報と hallucinations を緩和することで、引き続き有望な手法として Retrieval Augmented Generation (RAG) があります。 RAG シイズは文書をエントリーベクトアーとしてデデータベースに保管します。クエリが提示された場合、最関連の文書を検索し、これらをすべて LLMs のプロンプトに入れる...
Original: arXiv:2602.07297v1 Announce Type: cross Abstract: Retrieval Augmented Generation (RAG) is a promising technique for mitigating two key limitations of large language models (LLMs): outdated informatio...
Principled Synthetischeデータが初のLLMsスケーリング法を実証します:評価システムのリコメネーション
Principled Synthetic Data Enables the First Scaling Laws for LLMs in Recommendation
大規模言語モデル(LLMs)は再推薦システムにとって有望な分野ですが、予測可能なスケーラビリティ法の欠如により開発が阻害されています。データへのノイズ、バイアス、不完全性は再訓練(CPT)に基づく以前のユーザーアクションデータに由来することが考えられます。この論文では、高い品質のシナリオ合成データを生成するための新しい、層化されたフレームワークを開発することでこれを取り除きます 。その効果的な利点...
Original: arXiv:2602.07298v1 Announce Type: cross Abstract: Large Language Models (LLMs) represent a promising frontier for recommender systems, yet their development has been impeded by the absence of predict...
KRONE: 様々なレベルとモジュール的なログ異常検出
KRONE: Hierarchical and Modular Log Anomaly Detection
ログの異常検出は、システム上の問題やセキュリティリスクを確認するのに不可欠です。ただし、ログは_nested_コンポーネントの実行から来ており、明確な境界がありますが、それらがフラットな序列として保存される場合、その構造は失われます。した結果、最新の手法は真正の依存関係を検出しないまま無的妄動した依存性を学習することになり、また別の不適切なイベント間です。我々はKRONE、最初の階層的な異常検出フ...
Original: arXiv:2602.07303v1 Announce Type: cross Abstract: Log anomaly detection is crucial for uncovering system failures and security risks. Although logs originate from nested component executions with cle...
LIT-GRAPH: 深層学習型と浅いグラフエンボシングの深セングラフに基づく高品質なテキスト推奨用高域特定知能グーグル
LIT-GRAPH: Evaluating Deep vs. Shallow Graph Embeddings for High-Quality Text Recommendation in Domain-Specific Knowledge Graphs
この研究では、LIT-GRAPHとは西洋文学のグラフに基づいた推奨システムを提案し、高等学校英語教師が異なる、教科書適合されたインストラクショナル西洋文学を選択する支援を行うことを目指しています。このシステムは、西洋文学に関するオントロジーにより構築され、カリキュラムの停滞という課題に対処し、4つのグラフエンボシングのパラダイムを比較します: 深層ウェッブ、バイアスされたランダムウェッブ (BRW...
Original: arXiv:2602.07307v1 Announce Type: cross Abstract: This study presents LIT-GRAPH (Literature Graph for Recommendation and Pedagogical Heuristics), a novel knowledge graph-based recommendation system d...
Accuracyを超えて:医療偽りの評価は、リスクセンシティブにすること
Beyond Accuracy: Risk-Sensitive Evaluation of Hallucinated Medical Advice
大型言語モデルは、患者向けの医療に関する質問に対する答えるために広く使用され始めています。そして、偽り出力が潜在的に範囲が広々と異なる可能性があります。しかし現在の発想する、誤りに対する標準的な評価基準および指標の多くは、すべての誤りに対して同等に重視される傾向があります。これは臨床的に重要な失敗形態を隠蔽し、特に医療モデルが無根拠でも実行可能な医学用語を生成した際に起こります。私たちはリスクセン...
Original: arXiv:2602.07319v1 Announce Type: cross Abstract: Large language models are increasingly being used in patient-facing medical question answering, where hallucinated outputs can vary widely in potenti...
行動から行動へのフロー適合
Action-to-Action Flow Matching
>差分政策は、機動ロボットを推進する手法として、近日間の業績が驚異的であり、アクション予測を可逆的ノイズ処理と見なし、行動予定を取り繕う様が成功しました。 しかし、標準的な作法において、確率ベクタガウス型ノイズからサンプリングすることは何度も反復のステップを必要とするもので、その結果発生する推進アクションには高インフェーザー・レーションが存在し、実時間制御へ向かう大きなブロッキング要素となっており...
Original: arXiv:2602.07322v1 Announce Type: cross Abstract: Diffusion-based policies have recently achieved remarkable success in robotics by formulating action prediction as a conditional denoising process. H...
意図の違いが Large Language Model の複数回の会話の中で行き詰まる原因
Intent Mismatch Causes LLMs to Get Lost in Multi-Turn Conversation
複数回の会話を展開する大規模言語モデル (LLM) の会話交流は、一般的なコミュニケーションの形態となっています。ユーザーは追加的な質問を使用して意図を修正することで、この傾向を作動させます。一方で最新の研究は、多段式の会話とは別に指示が完結した状況におけるモデルに対する性能低下を明らかしています。これをお定め的に「会話を失う」と呼んでいます (LiC)。これはモデルの可靠性が原因であると考えられ...
Original: arXiv:2602.07338v1 Announce Type: cross Abstract: Multi-turn conversation has emerged as a predominant interaction paradigm for Large Language Models (LLMs). Users often employ follow-up questions to...
TernaryLM: 半精度1ビットのクオートリゼーションを使用した、記憶効率の良い言語モデル
TernaryLM: Memory-Efficient Language Modeling via Native 1-Bit Quantization with Adaptive Layer-wise Scaling
大きな言語モデル(LLMs)は驚異的なパフォーマンスを達成しますが、多くのコンピュータリソースを必要し、オッズデバイスや限られたリソースを持つ環境での展開に制約付けます。WeはTernaryLMと名付けた新しいトランスファーモデルの建築を提示しており、訓練時に一般的な1ビット半整数化(−1、0、+1)を使用して記憶効率を大幅に見込んでいます。これはパラメータ数が約1320万です。この手法はすでに学...
Original: arXiv:2602.07374v1 Announce Type: cross Abstract: Large language models (LLMs) achieve remarkable performance but demand substantial computational resources, limiting deployment on edge devices and r...
専門知識の注入による法廷判決要約における利点:英語とヒンドゥー語での邦訳インド裁判事判決を例とした調査
Advantages of Domain Knowledge Injection for Legal Document Summarization: A Case Study on Summarizing Indian Court Judgments in English and Hindi
インドの法廷判決を要約することは、複雑な言語や非構造化された文書の特有の難しさだけでなく、また法律文が作成されるための英語(多く使われる言語である)に理解できない多くのインド人の中に存在するための解釈を必要としているという複雑さからも複雑です。 これには、この研究は目的があります。 大規模な法廷文カタログを使った継続的訓練により専門的な法による分離したエンコーダーを使用して抽出的ニューラル要約モデ...
Original: arXiv:2602.07382v1 Announce Type: cross Abstract: Summarizing Indian legal court judgments is a complex task not only due to the intricate language and unstructured nature of the legal texts, but als...
アгентスイ:直接のメモリ管理に基づいてセーフと動的なLLMアグentsを保護する
AgentSys: Secure and Dynamic LLM Agents Through Explicit Hierarchical Memory Management
無関係なプロプストリンジェクションがLLMアグentsに脅威を及ぼし、外部コンテンツに悪意を持った指示を通じて不正行為とデータ強奪を可能にします。LMアグentsは相互作用歴などを保管するワーカープロンテンのコントロールウィンドウを維持して知識や行動を決めます。一般的なアグentsはすべてのツール出力や推論メモリの記憶を一気に蓄積し、その仕事には二つの重要な脆弱性が存在します:(1)インジェクトさ...
Original: arXiv:2602.07398v1 Announce Type: cross Abstract: Indirect prompt injection threatens LLM agents by embedding malicious instructions in external content, enabling unauthorized actions and data theft....
機能保証のための安心のコード生成:オンライン強化学習と脆弱性報酬モデル
Secure Code Generation via Online Reinforcement Learning with Vulnerability Reward Model
大きな言語モデル(LLMs)は、ソフトウェア開発で increasingly 使用され始めていますが、その傾向については、不安全なコード生成という課題は、実世界での展開においても大きな壁となっています。 現在のセキュアコード統合法には、機能性とセキュリティのパラドーキューに関する問題に陥りやすく、効果的な保護を確保することで大幅な機能性低下が伴います。</文章は続きます。 SecCoderX とい...
Original: arXiv:2602.07422v1 Announce Type: cross Abstract: Large language models (LLMs) are increasingly used in software development, yet their tendency to generate insecure code remains a major barrier to r...
Multi-Agentシステムが対人行為改善のために社会 Normを形作る
Multi-Agent Systems Shape Social Norms for Prosocial Behavior Change
共通の行動に対する共有理解が充足しない多様な集団で善行の進步性は限界であることを示す社会 Norm の実態干渉介入を用いることはしばしば効果的ではない。本研究は、仮想社会 Norm を奨励する「虚擬 Norm」をマルチ アジェントシステムによって作り出すことが可能かどうか試している。我々はオンラインの実験の中で、参加者の代理人を交互に共有した行動について議論しており、この議論前と後で見られるNor...
Original: arXiv:2602.07433v1 Announce Type: cross Abstract: Social norm interventions are used promote prosocial behaviors by highlighting prevalent actions, but their effectiveness is often limited in heterog...
スイッチ、感情、そして動き:VLMに基づいてデバイス側で利用できる多モーダルエンデューモラフレームワーク
Bridging Speech, Emotion, and Motion: a VLM-based Multimodal Edge-deployable Framework for Humanoid Robots
有効な人ロボティックスイタとが満遍なく異なるモーダルエモーションを持つ多機能の表現を必要とする。一方、実世界での展開ニーズは連続的なクラウド接続なしで自立可能の一機ダンスソースを使用するオンデバイスソリューションである。 <strong>speech emotion motion</strong>shem²、私たちを結びつけた多モーダルインタラクションにわたる視覚言語モデルに基づいたフレームワ...
Original: arXiv:2602.07434v1 Announce Type: cross Abstract: Effective human-robot interaction requires emotionally rich multimodal expressions, yet most humanoid robots lack coordinated speech, facial expressi...