2020年は新型コロナウイルスの猛威により、東京オリンピックの延期、夏の風物詩である甲子園での高校野球の中止など、様々な行動を制限された、我慢の年となった。
身近な生活の部分においても、リモートワークの推進や、時短営業、緊急事態宣言発令など、私たちの生活スタイルを変えざるおえない事態にまで陥っている。
そんな激動の一年ではあったが、ことAI技術においてはこれまでに研究していたことが生かされ、数多くの分野で活躍の幅を広げる飛躍の年になっていたように感じる。
そこで今回は、2021年のAI技術の成長に関わってくるであろうと予測される「自然言語処理」、そして2020年に発表された、自然言語処理AI「GPT-3」について紹介していきたい。
自然言語処理とは
自然言語処理(しぜんげんごしょり、英語: natural language processing、略称:NLP)は、人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術であり、人工知能と言語学の一分野である。
上記説明はWikipedia より抜粋したものになる。
分かりやすく言えば、私たちが日常で話している言葉(口語)であったり、文章に書き記した言葉(文語)を様々な方法を用いてその意味を解析する技術のことだ。
こうしてみると大して難しくないことのように思えるかもしれない。だが、我々の会話の中でも、時折、認識の齟齬によって会話が噛み合わないことが起こるだろう。
例えば、以下のような文章があったとする。
「しんだいしゃたのむ」
この文章を読もうとすると、二通りの読み方ができる。
- 寝台車、頼む
- 死んだ、医者頼む
普通に考えて、死んだ人間が医者を頼むなんて言うことができるわけがないのだから、正しいのは一であると判断できるが、コンピューターはそれを判断することができない。それは何故か、我々は生きていくうちに色々なことを覚えていく。一般常識と置き換えてもよい、それら蓄積が判断材料となり、私たちはどちらが正しいか、間違っているのかを判別することができるようになっている。自然言語処理は、その意味付けの部分をコンピューターに教え込むうえで必要なものなのだ。
こう書いてみると、私たちが使っている言語には、曖昧な部分が多くあることがわかるだろう。それこそが言葉の面白さでもあるのだが、コンピューターに理解させる点においては難しい課題となってしまっている。
自然言語処理の具体的な内容についてここでは割愛するが、自然言語処理は活用できる分野が多いことから、今現在も世界中で研究が進められており、日々進歩を続けている。
次項で紹介する「GPT-3」は、そんな自然言語処理の開発において、大きな飛躍を期待させるものを持っている。
自然言語処理AI「GPT-3」
「GPT-3」はテスラモーターズCEOであるイーロンマスク氏らによって設立された非営利団体 OpenAI(現在は営利団体)によって開発された言語モデルだ。
言語モデルとは、簡単に言えば、インプットされた文章を基にその続きを統計的に最も可能性があるものを予測して追加していくことを指す。統計的に判断していくことになるため、リソースとなる情報が多ければ多いほど確実性は上がってくる。「GPT-3」では一つ前の世代である「GPT-2」では15億個だったパラメータを、100倍以上となる1750億個にさせ予測させることでその精度を高めさせることに成功させた。しかも、「GPT-3」が発表されたのは、2019年に発表された「GPT-2」の約1年後だ。僅か1年間という期間でこれだけの成長を遂げさせたのだ。
「GPT-3」の可能性
前述した通り、「GPT-3」は、インプットされた文章を基にその続きを統計的に最も可能性があるものを予測して追加していくものだ。この言語モデルが優れている点は、作成できるものが文章だけではないことだ。
検索エンジン作成
Here's a sentence describing what Google's home page should look and here's GPT-3 generating the code for it nearly perfectly. pic.twitter.com/m49hoKiEpR
— Sharif Shameem (@sharifshameem) July 15, 2020
上記の動画では左のボックスに以下の指示を入力しただけだ。
the google logo, a search box,and 2 lightgrey buttons that say “Search Google” and “I’m Feeling Lucky” with padding in between them
a wide search box
日本語に訳すと以下のような指示になる。
グーグルのロゴ、検索ボックス、間に隙間を入れて「グーグルを検索」と“I’m Feeling Lucky” と書かれた2つの薄い灰色のボタン。検索ボックスは広く。
この文言を基に「GPT-3」は動画右のようなGoogleの検索エンジンを作り上げるためのコード(画面左下)を自動で作り上げたのだ。
ギタータブ譜
Guitar tab generated by GPT-3 from a fictional song title and artist. pic.twitter.com/ZTXuEcpMUV
— Amanda Askell (@AmandaAskell) July 16, 2020
「GPT-3」が作成できるのはただ文字を作成するわけではない。上のものは架空のアーティスト名と架空の曲名を入力して作成させたギタータブ譜だ。実際にこのコード譜通りに音を奏でてみると、きちんと音楽になっていることがわかる。
詩
I used @OpenAI's GPT-3 to write Dr. Seuss poems about @elonmusk. I suggest reading them out loud:https://t.co/FV5jSzu8LO pic.twitter.com/kgexGEw8oI
— Arram Sabeti (@arram) July 15, 2020
もちろん、上二つのものに比べれば大したことじゃないように思えてしまうが、詩の先を予測して書くということが人ではなくてもできてしまうようになっているのは驚くべきことではないだろうか。
「GPT-3」は発展途上に過ぎない
「GPT-3」は前項で上げた通り、既に作られたものがSNSなどで拡散され、驚きや、称賛の声を受けている。確かに、どれも素晴らしい出来であり、称賛に値する。ただ、一つ覚えておいて欲しいのは、あくまでもこれは統計を基に作られたものであることであり、全て完璧な予測の基、作成することに成功しているわけではないということだ。
実際に「GPT-3」を開発したOpenAIのCEOであるサム・アルトマン氏も以下のように警鐘を鳴らしている。
The GPT-3 hype is way too much. It’s impressive (thanks for the nice compliments!) but it still has serious weaknesses and sometimes makes very silly mistakes. AI is going to change the world, but GPT-3 is just a very early glimpse. We have a lot still to figure out.
— Sam Altman (@sama) July 19, 2020
日本語に意訳するとこのようになる。
GPT-3に過大評価されている。GPT-3には弱点があるし、時には簡単な間違いを犯したりする。AIは世界を変えようとしているが、GPT-3はその初期に過ぎず、まだまだ解明しなければならないことがたくさんあります
おわりに
今回紹介した「GPT-3」は残念ながら完璧な自然言語処理AIとは言えないかもしれない。たが、その可能性を感じることは出来たのではないだろうか。
今後も「GPT-3」、「自然言語処理」の進化に期待していきたい。