3496 articles
LLM が効率的なシーケンス推察機となる要因は何か:好意的な強度と時間的コンテキストに関する調査
What Makes LLMs Effective Sequential Recommenders? A Study on Preference Intensity and Temporal Context
arXiv:2506.02261v3 Announce Type: replace-cross 要旨:大型言語モデル(LLM)がユーザーの好意をシーケンス推察において効果的にモデル化する要因は何ですか。私たちの調査では、既存の好意一致アプローチは基本的に二項対比に依存しており、好意的な強度(親近感や嫌悪さの構造化された強度)と時間的コンテキスト(最近のインタラクションがユーザーの現在の意図をどれだ...
Original: arXiv:2506.02261v3 Announce Type: replace-cross Abstract: What enables large language models (LLMs) to effectively model user preferences in sequential recommendation? Our investigation reveals that ...
効率的な多モーダル寓意識別のための概念漂移導向な LayerNorm 調整
Concept Drift Guided LayerNorm Tuning for Efficient Multimodal Metaphor Identification
arXiv:2505.11237v4 Announce Type: replace-cross 要約:寓意想像力、関連性のない概念を結びつける能力は、人間の認知とコミュニケーションの基盤であり、極めて重要です。言語的な寓意の理解は大幅に進歩しましたが、インターネットのミームに見られるような多モーダル寓意を理解することは、その非定型な表現と潜在的な意味に起因して独自の課題を伴います。既存の多モーダ...
Original: arXiv:2505.11237v4 Announce Type: replace-cross Abstract: Metaphorical imagination, the ability to connect seemingly unrelated concepts, is fundamental to human cognition and communication. While und...
人工的な対話生成システムの設計:オンラインファシリテーションのための事例研究
Designing Synthetic Discussion Generation Systems: A Case Study for Online Facilitation
arXiv:2503.16505v4 Announce Type: replace-cross 要約:社会科学の研究における主要な課題の一つは、人間参加者を対象とした実験に伴う莫大なコストです。私たちが新たな自然言語処理(NLP)領域として特定したのは、「人工的な対話生成(Synthetic Discussion Generation: SDG)」です。これは、コスト効果のあるパイロット実験を可...
Original: arXiv:2503.16505v4 Announce Type: replace-cross Abstract: A critical challenge in social science research is the high cost associated with experiments involving human participants. We identify Synthe...
Korobov 関数向けの 2 次元 Deep ReLU CNN 近似:建設的的手法によるアプローチ
Two-Dimensional Deep ReLU CNN Approximation for Korobov Functions: A Constructive Approach
arXiv:2503.07976v2 発表型:replace-cross 要約:本稿では、2 次元 (2D) ディープ畳み込みニューラルネットワーク (CNN) の近似能力を調べる。Korobov 関数をベンチマークとしつつ、マルチチャンネルの畳み込み層(パディング付き)と ReLU アクティベーション層が組み合わされ、その後に全結合層を持つ 2D CNN に焦点を当てている。Korobov 関数...
Original: arXiv:2503.07976v2 Announce Type: replace-cross Abstract: This paper investigates approximation capabilities of two-dimensional (2D) deep convolutional neural networks (CNNs), with Korobov functions ...
市場研究のための大規模言語モデル:データ拡張アプローチ
Large Language Models for Market Research: A Data-augmentation Approach
arXiv:2412.19363v3 Announce Type: replace-cross Abstract:大規模言語モデル(LLM)は、複雑な自然言語処理タスクに優れ、人工知能を転換しました。人間似たテキストを生成する能力により、共結合解析(conjoint analysis)を含む市場研究において新たな可能性が開け、消費者の好理解解が不可欠でありながら、資源集約的であることが示されまし...
Original: arXiv:2412.19363v3 Announce Type: replace-cross Abstract: Large Language Models (LLMs) have transformed artificial intelligence by excelling in complex natural language processing tasks. Their abilit...
価格、入札、価値:すべての問題を解決する ML 駆動型組合せ入札のすべて
Prices, Bids, Values: One ML-Powered Combinatorial Auction to Rule Them All
arXiv:2411.09355v3 Announce Type: replace-cross 要旨: 本稿では、反復組合せ入札 (ICAs) の設計について研究します。この分野の主要な課題は、アイテムの数が増えるにつれて束の空間が指数関数的に増大することにあります。これを解決するために、最近の研究では、効率を最大化するために入札者から最も重要な情報のみを集めることを目指す、機械学習 (ML) に...
Original: arXiv:2411.09355v3 Announce Type: replace-cross Abstract: We study the design of iterative combinatorial auctions (ICAs). The main challenge in this domain is that the bundle space grows exponentiall...
リソース効率の良い不変量量子畳み込みニューラルネットワーク
Resource-efficient equivariant quantum convolutional neural networks
arXiv:2410.01252v2 Announce Type: replace-cross 要約:不変量量子ニューラルネットワーク (QNN) は、対称性を活用して機械学習のパフォーマンスを向上させる有望な最適化モデルである。不変量 QNN に関する理論的発展にもかかわらず、近未来の量子装置における実装には、計算リソースの制約により大きな課題が残っている。本研究では、不変量量子畳み込みニュー...
Original: arXiv:2410.01252v2 Announce Type: replace-cross Abstract: Equivariant quantum neural networks (QNNs) are promising variational models that exploit symmetries to improve machine learning capabilities....
境界干渉データを用いて全変数の連合介入分布の推定
Estimating Joint Interventional Distributions from Marginal Interventional Data
arXiv:2409.01794v2 発表タイプ:交差検証の置換 本稿では、最大エントロピー原理を用いて境界介入データを活用し、全変数の連合条件付き分布を取得する方法を示す。これに応じて、観測データに加えて介入データも利用する因果的マックスエントロピー手法を拡張した。ラグランジュ対偶性を活用し、介入制約が課せられた因果的マックスエントロピー問題の解が、マックスエントロピーの解と同様に指数族にあるこ...
Original: arXiv:2409.01794v2 Announce Type: replace-cross Abstract: In this paper we show how to exploit interventional data to acquire the joint conditional distribution of all the variables using the Maximum...
LaMSUM: LLM 主導型抽出要約によるハラスメント報告のVOICE の増強
LaMSUM: Amplifying Voices Against Harassment through LLM Guided Extractive Summarization of User Incident Reports
arXiv:2406.15809v5 Announce Type: replace-cross 要約: 市民報告プラットフォームは、公衆と当局が性的ハラスメント事象について情報を把握するのを支えています。しかし、これらのプラットフォームで共有されるデータの量は極めて多く、個別の事例をレビューするのは困難です。そのため、多種多様なコードミックス言語を処理および理解する能力を持つ要約アルゴリズムが不...
Original: arXiv:2406.15809v5 Announce Type: replace-cross Abstract: Citizen reporting platforms help the public and authorities stay informed about sexual harassment incidents. However, the high volume of data...
独立顕微鏡間で深学習を活用したモーダム転移による高throughput イメージング
Deep Learning-Enabled Modality Transfer Between Independent Microscopes for High-Throughput Imaging
arXiv:2403.18026v2 Announce Type: replace-cross Abstract: 大規模生物学イメージングは、取得速度と画像品質のトレードオフによってしばしば制限されています。広い視野蛍光顕微鏡などの高速イメージングモードは、大規模なデータ取得を可能にしつつもコントラストや解像度の低下を伴い、一方、共焦点顕微鏡や単一分子局在顕微鏡に基づく超解像技術などの高解像度技...
Original: arXiv:2403.18026v2 Announce Type: replace-cross Abstract: High-throughput biological imaging is often constrained by a trade-off between acquisition speed and image quality. Fast imaging modalities, ...
ライングラフ変換を用いたグラフエッジ上の適応的時空推定
Adaptive Spatio-temporal Estimation on the Graph Edges via Line Graph Transformation
arXiv:2311.00656v4 Announce Type: replace-cross 摘要:信号のグラフエッジ上の時空推定は、従来のグラフ信号処理技術が主にグラフノード上で定義されているため、困難を極めています。ライングラフ変換を活用したライングラフ最小二乗(LGLMS)アルゴリズムは、ライングラフ変換を古典的な適応フィルタと統合し、時間変化信号におけるグラフエッジのオンライン推定手法を...
Original: arXiv:2311.00656v4 Announce Type: replace-cross Abstract: Spatial-temporal estimation of signals on graph edges is challenging because most conventional Graph Signal Processing techniques are defined...
SOAR: 拡散モデルにおける最適な整合性とRefinementのための自己訂正
SOAR: Self-Correction for Optimal Alignment and Refinement in Diffusion Models
arXiv:2604.12617v2 発表タイプ:置換 摘要:現在、拡散モデルの事後訓練パイプラインは、厳選されたデータ上の教師あり微調整(SFT)と報酬モデルを伴う強化学習(RL)の二つの段階から構成されています。これら間には根本的なギャップが存在します。SFT は、前進ノイズ化プロセスからサンプリングされた真のGround-truth状態上でのみデノイサーを最適化しており、推論がこれらの理想状...
Original: arXiv:2604.12617v2 Announce Type: replace Abstract: The post-training pipeline for diffusion models currently has two stages: supervised fine-tuning (SFT) on curated data and reinforcement learning (...
転換器におけるイン・コンテキスト分類の層別ダイナミクス
Layerwise Dynamics for In-Context Classification in Transformers
arXiv:2604.11613v2 Announce Type: replace 要旨:転換器は数つのラベル付き例からイン・コンテキスト分類を実行できるものの、推論時のアルゴリズムは不透明である。本稿では、ハード・ノ・マージン体制における多クラス線形分類を研究し、各層における特徴量およびラベル置換の同質性(equivariance)を強いることで計算を特定可能(identifiable)にしまし...
Original: arXiv:2604.11613v2 Announce Type: replace Abstract: Transformers can perform in-context classification from a few labeled examples, yet the inference-time algorithm remains opaque. We study multi-cla...
Fixed Discovery Rate を超える:E-バリエルを用いた事後コンフォーマル選択
Beyond Fixed False Discovery Rates: Post-Hoc Conformal Selection with E-Variables
arXiv:2604.11305v2 Announce Type: replace **要約**: コンフォーマル選択 (CS) は、校准データを利用して、未観測結果が事前定められた最小品質要件を満たす可能性が高いテスト入力を選択し、誤検知率 (FDR) を制御する手法です。既存の手法は、データを観測する前に目標 FDR レベルを固定してしまいます。これにより、利用可能なデータに基づき、選択され...
Original: arXiv:2604.11305v2 Announce Type: replace Abstract: Conformal selection (CS) uses calibration data to identify test inputs whose unobserved outcomes are likely to satisfy a pre-specified minimal qual...
SVG 生成における構造的評価指標:ロブ・ア・アウト解析を介したアプローチ
Structural Evaluation Metrics for SVG Generation via Leave-One-Out Analysis
arXiv:2604.08809v2 Announce Type: replace 要約:SVG 生成は通常、レンダリングされた出力を参照画像と比較して評価され、視覚的類似性はキャッチしますが、SVG が編集可能、分解可能、再利用可能にする構造的性質は捉えられていません。古典的なジャックナイフ手法に着想を得て、要素レベルのロブ・ア・アウト(LOO)解析を導入しました。この手法は、各要素が含まれて...
Original: arXiv:2604.08809v2 Announce Type: replace Abstract: SVG generation is typically evaluated by comparing rendered outputs to reference images, which captures visual similarity but not the structural pr...
AdaBoost の循環は常に起こらない:コンピュータ支援による反例
AdaBoost Does Not Always Cycle: A Computer-Assisted Counterexample
arXiv:2604.07055v2 Announce Type: replace アブストラクト:Rudin、Schapire、および Daubechies が 2012 年に COLT で提起した、アダブーストの完全探索法が常に有限の循環に収束するかという未解決の問題に対する、コンピュータ支援による反例を提示する。この構築は、2 つの要素が 5 段階の分岐マップに対して正確な周期 2 オビート...
Original: arXiv:2604.07055v2 Announce Type: replace Abstract: We give a computer-assisted counterexample to the open question, posed by Rudin, Schapire, and Daubechies in COLT 2012, of whether exhaustive AdaBo...
神経型コンピュータ
Neural Computers
arXiv:2604.06425v2 発表タイプ:置換 要旨:我々はその新領域である「神経型コンピュータ(NC)」を提案します。NC は、従来のコンピュータの計算、メモリ、I/O を統合した、学習された実行状態を持っています。我々の長期的な目標は、「完全神経型コンピュータ(CNC)」であり、これは新興の機械形式の成熟した汎用実現形態で、安定した実行、明示的な再プログラミング、ならびに耐久性のある機...
Original: arXiv:2604.06425v2 Announce Type: replace Abstract: We propose a new frontier: Neural Computers (NCs) that unify computation, memory, and I/O of traditional computers in a learned runtime state. Our ...
Olmo Hybrid: 理論から実践、そして理論へ
Olmo Hybrid: From Theory to Practice and Back
arXiv:2604.03444v3 発表タイプ:更新 要約:最近の研究では、変換器(transformer)ではない言語モデルの可能性が示されており、特に直線再帰型ニューラルネットワーク(RNNs)および再帰性とアテンションを混合したハイブリッドモデルが挙げられます。しかし、これらの新しいアーキテクチャがもたらす潜在的利益が、それをスケールアップするためのリスクと努力を正当化するかについてはコ...
Original: arXiv:2604.03444v3 Announce Type: replace Abstract: Recent work has demonstrated the potential of non-transformer language models, especially linear recurrent neural networks (RNNs) and hybrid models...
Scalable Maximum Entropy Population Synthesis via Persistent Contrastive Divergence
arXiv:2603.27312v2 Announce Type: replace Abstract: 最大熵(MaxEnt)モデリングは、個人レベルのマイクロデータを利用できない状況下で、集合的な統計データから合成人口を生成するための原理に基づいた枠組みを提供します。正確な列挙アプローチのボトルネックは、全ベクトル空間 $\ackslash\mathcal{X}$ に対する明示的な合計を用いた...
Original: arXiv:2603.27312v2 Announce Type: replace Abstract: Maximum entropy (MaxEnt) modelling provides a principled framework for generating synthetic populations from aggregate census data, without access ...
CoMeT: Long コンテキストモデリングのための効率的な共有メモリアイブラクター
CoMeT: Collaborative Memory Transformer for Efficient Long Context Modeling
arXiv:2602.01766v2 発表タイプ:置き換え アブストラクト:標準的なトランスフォーマーの平方の時間計算量と無制限に増大するキー・値(KV)キャッシュは、ロングコンテキスト処理の主要な障壁となっています。これを克服するために、私たちは、LLM を任意の長さのシークエンスを常駐メモリ使用量と線形時間の計算量で処理できるようにする、新しいアーキテクチャである共有メモリアイブラクター(Co...
Original: arXiv:2602.01766v2 Announce Type: replace Abstract: The quadratic complexity and indefinitely growing key-value (KV) cache of standard Transformers pose a major barrier to long-context processing. To...