語義の曖昧性解消

語義の曖昧性解消(ごぎのあいまいせいかいしょう、英語: Word-sense disambiguation)とは自然言語処理において、文中のある単語に出会ったとき、その単語がどの語義をあらわしているのかを判断する過程のこと。語義識別語義判別語義確定などともいう。

自然言語の単語には複数の語義が存在する場合がある。たとえば動詞「やる」には以下のような異なった語義が存在する:

  • 彼はその仕事をやった。(ある動作をする)
  • その日はジャズをやった。(演奏/上映する)
  • プレゼントとして時計をやった。(譲渡する)
  • 机の上の本を向こうへやった。(どかす)
  • 心配なので人をやった。(遣いを出す)
  • 目を向こうへやった。(視線を投げる)

語義の曖昧性解消は機械翻訳などのアプリケーションで非常に重要である。たとえば日本語の「やる」という動詞のもつそれぞれの語義は、ほかの言語では別々の動詞(英語では play, give, remove など)によって表されているためである。現在の自然言語処理では、語義の曖昧性解消には単語の共起関係を使う手法が一般的である。

関連項目

  • 曖昧さ回避
  • 表示
  • 編集
基礎用語
テキスト分析
  • コロケーション抽出(英語版)
  • コンセプト・マイニング(英語版)
  • 共参照解析(英語版)
  • 深い言語処理(英語版)
  • 遠読(英語版)
  • 情報抽出
  • 固有表現抽出
  • オントロジー学習(英語版)
  • 構文解析
  • 品詞タグ付け(英語版)
  • 意味役割付与(英語版)
  • 意味的類似性(英語版)
  • 感情分析
  • 用語抽出(英語版)
  • テキストマイニング
  • テキスト含意(英語版)
  • Truecasing(英語版)
  • 語義の曖昧性解消
  • 語義推定(英語版)
テキストセグメンテーション(英語版)
自動要約
  • 複数文書要約(英語版)
  • センテンス抽出(英語版)
  • テキスト平易化(英語版)
機械翻訳
分布意味論(英語版)モデル
言語資源
データセット・コーパス
種類・基準
データ
自動認識・
データ取得(英語版)
トピックモデル(英語版)
  • 文書分類
  • 潜在的ディリクレ配分法(英語版)
  • パチンコ配分モデル(英語版)
レビュー支援
ツール(英語版)
自然言語ユーザー
インターフェース(英語版)
他のソフトウェア
  • NLTK(英語版)
  • spaCy
カテゴリ カテゴリ
典拠管理データベース: 国立図書館 ウィキデータを編集
  • ドイツ
  • イスラエル
  • アメリカ