2016-11-22

進化したGoogle Translateの性能限界はどこか？　ー文法・表現力についてー

乗り遅れた感のあるGoogle Translateの性能改善調査ですー

これまでの流れとしては、

１．グーグル先生すごいや！

翻訳前：グーグル先生すごすぎるんやが。マジやばいっす。

翻訳後：Mr. Google is too great. It is really serious.

　　　　　　　　　　　　　　　 f:id:chienomikun:20161122214734p:plain

２．いや、文脈理解が問われる場合はいけてない・・・

翻訳前：彼ってば誕生日忘れやがったのよ。

翻訳後：He forgot his birthday.

てな感じにグーグル先生の翻訳力の考察が進んでいるようですが、ではグーグル先生（が採用しているエンコーダーデコーダーモデル）の性能限界はどこか、というのを探ってみたいと思います。

　　　　　　　　　　　　　 f:id:chienomikun:20161122214734p:plain

性能指標を２つ導入します。

１．構文力

２．表現の機微

１．構文力

問題１：次の有名なチョムスキーの例を訳せれば合格です

翻訳前：無色の緑色の考えが猛烈に眠る

翻訳例：Colorless green ideas sleep furiously

グーグルせんせーのこたえ　 f:id:chienomikun:20161122220947p:plain

A colorless green idea sleeps furiously

うん。。。これには驚きました。みたことのない文でも構文どうりに訳せるということがわかりました。はい次！

問題２：次の入れ子構文をうまく訳せれば合格です

翻訳前：私が彼に言ったのは、彼は彼女に私が遅刻をしたらしいと言ったのではないかということだ。

グーグルせんせーのこたえ　 f:id:chienomikun:20161122220947p:plain

I told him that he said that she seems to have arrived late.

遅刻をしたのが彼女になっちゃってますね。これは残念。ということで、構文に関する性能限界は、

チョムスキーの　無色の緑色の考えが猛烈に眠る　を完璧に訳すほど単文は得意だが、入れ子構造になると苦手らしい

というところかと

２．表現の機微

問題３：次の文を、注目している物体に合わせて訳出できれば合格です（ピンカー先生の本からとってきた）

１．アリが生姜入りクッキーの上を這い回った

２．生姜入りクッキーは這い回るアリだらけだった

グーグルせんせーのこたえ　 f:id:chienomikun:20161122220947p:plain

１．Ali crawled over cookies with ginger

２．Cookies with ginger were full of crawling ants

うん。。。完璧ですね！モハメド・アリがクッキーを這い回っている以外は！

対象をうまく選んで、それに従って訳し分けることができています。

ということで、表現力については、

常識の実装はまだまだこれからだが、文章が注目している対象に逆らわずに訳出できる程度にはすごい。

というところかと。

ほなまた！

2016-10-13

CNN - Convolutional Neural Net - 畳み込み層の実装

普通のニューラルネットの各層を全結合層とよぶ（全てのノードは次の層のノードにつながっている）

なぜ全結合では不満があるか

全結合層では、２次元的・３次元的構造を保持しない。これは１次元ベクトルとして入力する仕様のため。これでは２次元的構造（画像など）の重要な構造が失われてしまう

全結合の不満の解消

全結合層で不満だった２次元的構造の消失問題を構造の情報を取り出し、保存することにより解決する。その取り出し方が畳み込みと言われる手法である。

2016-10-13

「進化計算と深層学習」まとめノート 3

第２章　ニューラルネット　ー　多層パーセプトロン　ー

多層パーセプトロンは、パーセプトロンの収束定理では得られなかった学習、例えば線形分離不可能なXOR関数の学習を行える。

問題設定

入力ベクトル x を第１層めとして、第 n 層における脳細胞に対応する出力値を x_n, それぞれの出力にかかる重みベクトルを w_n として、最終層の出力 y をニューラルネットの予想とする。

ディープラーニングの最終目的はディープラーニングの予想 y と教師データ d の差を最小化するパラメーターを求めることである。差を測る関数は色々ある。

問題の再設定

最小化するといっても、いま最小値を取ったというためには、凸関数だとかメタな知識がない限り無限時間待つことになるので、傾きが０になるパラメーターを求めることで満足しておく。これにより最急降下法という古典的手法が使えて、重みパラメーターの傾きに沿って滑り降りるようなアルゴリズムで更新すれば良いことになる。

2016-10-13

確率的勾配微分法とは

前提

ニューラルネットの重みとバイアスを訓練データを予測できるよう調整したい（学習の定義）

Step 1

訓練データの中から、一定数を無作為抽出する。得られたデータをミニバッチといい、ミニバッチの損失関数の値を最小化したい

Step 2

勾配を求めることで、得られた関数を最も大きく減らす方向を求める

Step 3

重みパラメータを、 Step 2 の方向に少しずらす

Step 4

Step 1-3 を繰り返す

なぜ確率的（Stochastic）とよぶか

Step 1 のように、データを確率的に選び出すから。

2016-10-09

「進化計算と深層学習」まとめノート 2

第２章　ニューラルネット

学習の定義

ある状況における繰り返された経験によるその状況に対する動作の変化のこと（Hilgard 1975）

過学習を防いでうまく学習するには

データセットを３つに分ける

学習用の訓練データ
学習の終了判断を行うための評価用のデータセット（訓練データの一部から取ってくる）
最終的なテストを行うテストデータ

ニューロンのモデル化

人間の脳には１４０億個のニューロンがあり、それぞれ８０００個程度シナプスを介して他のニューロンとつながっている。

McCulloch-Pitts モデルでは、ニューロンが発火するか否かを、

y = σ ( <w,x> + b )

で表す。ここで、w はシナプスの結合強度を表す重みベクトル、x は各細胞の値。σ は入力が０以上なら１を、それ以外は０を返す関数。b は発火しやすさを表すバイアス。ただし< x, y > は x と y の内積を表している

アイディアの出所

2016-10-08

「進化計算と深層学習」まとめノート 1

２つの本

1. 進化計算と深層学習 -創発する知能― (理論中心)

2. ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装 (ゴリゴリ計算)

を 1. を中心に読み比べていくシリーズです。

第１章　進化計算入門

２７億年の歴史がある世界最古の生物ストロマトライトが光合成を行なったことで好気性菌の誕生を可能にしたことから生命の進化は加速していく。

では進化とは何か

Darwin は生物の集団を次のように特徴付けている。

2016-10-08

事業計画勉強会＠Hiveshibuya　まとめ

事業計画の作り方 Hiveshibuyaワークショップ@10/7　まとめ

０．最初に書くべきこと

ミッション・解決すべき問題を定義するのは特にサービス開始前に重要

１．金目鯛を売るには？

ただ旬ですよといっても、いくらだよ！となって結局買わない。値段を言うべき。若手で投資条件を言う人はほぼ０なのでできればお金の苦労が小さい。

２．市場規模について必要なこと

サービスがグロースしている（しそう）なこと

ー　アプリだと１０００万人でグロースしていると言える

３．ビジネスモデルのパターン

ー　EC の手数料パターン（ピクスタなどの独占型だと５０％、独自価値あると３０％、ないと１０％）

　　ー　総流通量がECサイトのKPI。だからメルカリはプレスリリースでも必ずこの数字を出す。

ー　広告

ー　ユーザー課金（ゲーム）

ー　ユーザー課金（非ゲーム）

機械学習と黒魔術

２次元から３次元への埋め込みをしていくブログ。

進化したGoogle Translateの性能限界はどこか？　ー文法・表現力についてー

１．構文力

チョムスキーの　無色の緑色の考えが猛烈に眠る　を完璧に訳すほど単文は得意だが、入れ子構造になると苦手らしい

２．表現の機微

常識の実装はまだまだこれからだが、文章が注目している対象に逆らわずに訳出できる程度にはすごい。

CNN - Convolutional Neural Net - 畳み込み層の実装

なぜ全結合では不満があるか

全結合の不満の解消

「進化計算と深層学習」まとめノート 3

第２章　ニューラルネット　ー　多層パーセプトロン　ー

問題設定

問題の再設定

確率的勾配微分法とは

前提

Step 1

Step 2

Step 3

Step 4

なぜ確率的（Stochastic）とよぶか

「進化計算と深層学習」まとめノート 2

第２章　ニューラルネット

学習の定義

過学習を防いでうまく学習するには

ニューロンのモデル化

アイディアの出所

「進化計算と深層学習」まとめノート 1

第１章　進化計算入門

では進化とは何か

事業計画勉強会＠Hiveshibuya　まとめ

事業計画の作り方 Hiveshibuyaワークショップ@10/7　まとめ

０．最初に書くべきこと

１．金目鯛を売るには？

２．市場規模について必要なこと

３．ビジネスモデルのパターン

１．構文力

チョムスキーの 無色の緑色の考えが猛烈に眠る を完璧に訳すほど単文は得意だが、入れ子構造になると苦手らしい

２．表現の機微

常識の実装はまだまだこれからだが、文章が注目している対象に逆らわずに訳出できる程度にはすごい。

なぜ全結合では不満があるか

全結合の不満の解消

第２章 ニューラルネット ー 多層パーセプトロン ー

問題設定

問題の再設定

前提

Step 1

Step 2

Step 3

Step 4

なぜ確率的（Stochastic）とよぶか

第２章 ニューラルネット

学習の定義

過学習を防いでうまく学習するには

ニューロンのモデル化

アイディアの出所

第１章 進化計算入門

では進化とは何か

事業計画の作り方 Hiveshibuyaワークショップ@10/7 まとめ

０．最初に書くべきこと

１．金目鯛を売るには？

２．市場規模について必要なこと

３．ビジネスモデルのパターン

チョムスキーの　無色の緑色の考えが猛烈に眠る　を完璧に訳すほど単文は得意だが、入れ子構造になると苦手らしい

第２章　ニューラルネット　ー　多層パーセプトロン　ー

第２章　ニューラルネット

第１章　進化計算入門

事業計画の作り方 Hiveshibuyaワークショップ@10/7　まとめ