今年も言語処理学会に参加してきました。初日のチュートリアルと最終日のワークショップは参加せず、本大会のみの参加でした1。 せっかくなので、聞いた発表の中で面白かったものをメモしておきたいと思います。紹介する数が多くないのは、素晴しいものだけを紹介するために絞っているのではなく、聞いた発表があんまり多くないからです(理由は察してください)。順番はプログラム記載の順なので特に意味はないです。

賞関連の情報は水本くんがまとめているのでそちらを参考にしてください。


  • 分散表現による格フレームの格要素の汎化を利用したゼロ照応解析

    山城颯太, 西川仁, 徳永健伸 (東工大)

ゼロ照応解析においては格フレームを用いて選択選好を推定することが多いです。 この研究では、格フレームのスパースになる問題を分散表現を使って対処しています。 以前、東工大の笹野さんがクラスタリングで自動獲得された語彙クラスを利用してスパース問題を回避する研究をされていたのですが、まさにそのニューラル版といったおもむき。 ニューラルならではと思ったのは、格要素間のベクトルの差を素性として入れていたこと。アイデアとしては非常にシンプルですが、ベクトルの差が意味を持つ、という考えはword2vec以前には思い付かなかったんではなかろうかと。 精度のところでは、もう一歩という感じですが、面白い研究なので、今後に期待したいところ。


  • 依存構造解析のための内容語と機能語の多言語可逆変換

    小比田涼介, 能地宏, 松本裕治 (NAIST)

若手奨励賞を受賞した研究です。 Universal Dependency(UD)は内容語ヘッドだけど、解析は機能語ヘッドの方がやりやすいので、ルールベースで機能語ヘッドに書き換えてモデルを学習して、推論時には機能語ヘッドで構文木を作ってやっぱりルールベースで内容語ヘッド(UD)に戻すという研究。 正直、「こんなんでうまくいくの?」と思って聞いていたのですが、うまくいった原因の分析含めて非常にいい研究でした。 ルールベースで構文木を書き換えるところが精度がよかったのが一番の驚きでした。 逆に言うと機能語ヘッドなのか内容語ヘッドなのかといったことは本質的には結構どうでもよかったんだなあ、ということを再確認させられた気分。


  • 数学問題テキストにおけるさまざまな照応現象の解析

    伊藤巧, 松崎拓也, 佐藤理史 (名大)

数学の問題で照応解析しました、という研究。 手法としては特に目新しいというわけではないが、問題にきちんと向き合っているな、という印象。 数学問題テキストの照応としての性質は質疑で聞いた限り簡単そうだけど、そのレベルに載せるための前処理的部分をしっかりできているのは立派だなと。

タイトルを見て照応だけかと思ったら、名詞のノ格のゼロ照応も扱っていたのは意外だった。今、いわゆる名詞の格を扱ってい研究している人はあまりいない気がするので、頑張って欲しいところ。


  • 文書全体を考慮したニューラル文間ゼロ照応解析モデル

    大内啓樹, 進藤裕之, 松本裕治 (NAIST)

「空前のゼロ照応解析ブーム」という名言が飛び出した発表。若手奨励賞も受賞してました。 ゼロ照応について語ると長くなるので省略。 研究の内容もですが、発表、質疑等で出た内容は、今後のゼロ照応解析の研究について考えさせられるものでした。 「とりあえず、村山富市を埋めれば当たる」研究からは抜け出したいですね。

細かいですが、先行研究紹介では「null」だったところが提案手法で「exo」になってたのは地味に好きなポイントです。


  • 時系列数値データからの概況テキストの自動生成

    村上聡一朗, 渡邉亮彦 (東工大/産総研), 宮澤彬 (総研大/NII/産総研), 五島圭一 (東工大/産総研), 柳瀬利彦 (日立), 高村大也 (東工大/産総研), 宮尾祐介 (総研大/NII/産総研)

これも若手奨励賞です。株価データから概況文を生成しています。 数値データの置き換えを、演算として定義しているのは面白いなと感じました。一方で、あんまり時系列感ないので、概況以外の対象の方が実験としては面白くなりそう。


  • 数値予報マップからの天気予報コメントの自動生成

    村上聡一朗, 笹野遼平 (東工大), 高村大也 (東工大/さきがけ), 奥村学 (東工大)

上と同じ村上くんの発表。数値予報シミュレーションの結果から一気通貫手法で、天気予報のコメントを生成しています。 一応コメントについては弊社でデータを提供しました。 論文ではコメントのタイトルで実験していましたが、もう少し長い本文でも結構いい感じに生成されていました。 データを提供した関係で色々見せてもらいましたが、ニューラル生成はもっとグダグダになると思っていたのですが、かなりまとものものが多くてビックリしました。


論文以外のイベントについては後日時間があれば書こうと思います。

  1. 今日は「言語処理の応用」ワークショップに行かずに、会社で言語処理の応用をしています。