機械学習と黒魔術

2次元から3次元への埋め込みをしていくブログ。

進化したGoogle Translateの性能限界はどこか? ー文法・表現力についてー

乗り遅れた感のあるGoogle Translateの性能改善調査ですー

 

これまでの流れとしては、

1.グーグル先生すごいや!

翻訳前:グーグル先生すごすぎるんやが。マジやばいっす。

翻訳後:Mr. Google is too great. It is really serious.

               f:id:chienomikun:20161122214734p:plain

 

2.いや、文脈理解が問われる場合はいけてない・・・

 

翻訳前:彼ってば誕生日忘れやがったのよ。

翻訳後:He forgot his birthday.

 

 

てな感じにグーグル先生の翻訳力の考察が進んでいるようですが、ではグーグル先生(が採用しているエンコーダーデコーダーモデル)の性能限界はどこか、というのを探ってみたいと思います。

                    f:id:chienomikun:20161122214734p:plain

 

性能指標を2つ導入します。

1.構文力

2.表現の機微

 

1.構文力

問題1:次の有名なチョムスキーの例を訳せれば合格です

翻訳前:無色の緑色の考えが猛烈に眠る

翻訳例:Colorless green ideas sleep furiously

グーグルせんせーのこたえ f:id:chienomikun:20161122220947p:plain

A colorless green idea sleeps furiously

 

うん。。。これには驚きました。みたことのない文でも構文どうりに訳せるということがわかりました。はい次!

 

問題2:次の入れ子構文をうまく訳せれば合格です

翻訳前:私が彼に言ったのは、彼は彼女に私が遅刻をしたらしいと言ったのではないかということだ。

グーグルせんせーのこたえ f:id:chienomikun:20161122220947p:plain

 I told him that he said that she seems to have arrived late. 

 

遅刻をしたのが彼女になっちゃってますね。これは残念。ということで、構文に関する性能限界は、

チョムスキーの 無色の緑色の考えが猛烈に眠る を完璧に訳すほど単文は得意だが、入れ子構造になると苦手らしい

というところかと

 

2.表現の機微

問題3:次の文を、注目している物体に合わせて訳出できれば合格です(ピンカー先生の本からとってきた)

1.アリが生姜入りクッキーの上を這い回った

2.生姜入りクッキーは這い回るアリだらけだった

 

グーグルせんせーのこたえ f:id:chienomikun:20161122220947p:plain

 

1.Ali crawled over cookies with ginger

2.Cookies with ginger were full of crawling ants

 

 

 

うん。。。完璧ですね!モハメド・アリがクッキーを這い回っている以外は!

対象をうまく選んで、それに従って訳し分けることができています。

ということで、表現力については、

常識の実装はまだまだこれからだが、文章が注目している対象に逆らわずに訳出できる程度にはすごい。

というところかと。

 

ほなまた!