Back to list
IDALC: スemi-supervised フレームワークによる意図の検出とアクティブ学習に基づいた修正
IDALC: A Semi-Supervised Framework for Intent Detection and Active Learning based Correction
Translated: 2026/2/14 8:09:47
Japanese Translation
音声制御の会話システムは、異なるユーザ質問に対する広範な行動を行うことで大変人気があります。これらの代理人は特定のユーザタスクで使用できる予め定義されたスキルや意図セットを持っています。けれども、全てのシステムには限界があるのです。知られざる意図の場合でも、モデルが低な確信を示した場合は発言は無効化され、それに伴う手動の記番作業が必要になることがあります。また時間とともにこれらに接続する新たなタスクをためらわすことなく遂行するためにこれらの代理人を再訓練することも必要となるでしょう。これらの新しい意図と非同期した発言に対する明示的注釈は、無理やりコストのかかるメカニズムが必要となります。この論文では、IDALC(意図検出とアクティブ学習に基づいた修正)のsemi-supervised フレームワークを導入し、これらユーザーからの意図を認識し、システムからは無効化された発言を行っている代理人を修復することが目的です。 IDALCは多くのバウンディングセットデータに対して評定結果により、我々のシステムは基準用アプローチより最高5%を上回る精度と最悪4%の改善したマクロ-F1スコアを達成しています。なおかつ我々の全体的な記番コストはシステムに提供される無効なデータの6-10%しかありません。IDALCの全体的フレームワークは図. 1に示します
Original Content
arXiv:2511.05921v2 Announce Type: replace-cross
Abstract: Voice-controlled dialog systems have become immensely popular due to their ability to perform a wide range of actions in response to diverse user queries. These agents possess a predefined set of skills or intents to fulfill specific user tasks. But every system has its own limitations. There are instances where, even for known intents, if any model exhibits low confidence, it results in rejection of utterances that necessitate manual annotation. Additionally, as time progresses, there may be a need to retrain these agents with new intents from the system-rejected queries to carry out additional tasks. Labeling all these emerging intents and rejected utterances over time is impractical, thus calling for an efficient mechanism to reduce annotation costs. In this paper, we introduce IDALC (Intent Detection and Active Learning based Correction), a semi-supervised framework designed to detect user intents and rectify system-rejected utterances while minimizing the need for human annotation. Empirical findings on various benchmark datasets demonstrate that our system surpasses baseline methods, achieving a 5-10% higher accuracy and a 4-8% improvement in macro-F1. Remarkably, we maintain the overall annotation cost at just 6-10% of the unlabelled data available to the system. The overall framework of IDALC is shown in Fig. 1