いきなりではあるが、皆さんは文章を読むのが好きだろうか? 筆者は本の虫を自称しているほど読書好きであり、通勤時の電車の中などでは、本以外にもスマートフォンでニュース記事を読んでいたりと文章を読むことに抵抗がない。
だが、全く文章を読まなかったり、好きではない人も大勢いることだろう。文化庁が平成30年度に行われた『国語に関する世論調査』では、実に47.3%の人が「1か月に1冊も本を読まない」と回答している。日本の総人口が約1億人であるから、その半分の5千万人が1か月に1冊も本を読まないことになるのだ。
本好きの筆者としては残念な話ではある。だが、時代の流れ的な側面から考えれば仕方ないだろうし、じゃあ無理に本を読んだり、記事を読んだりしましょうと勧めるのはもっと違う話だ。ただ、問題となってくるのは、文章を読むこと、そしてそれを理解する力、所謂「読解力」は生きていく上で必要となっていることではないだろうか。
少々話が逸れてしまったが、今回はそんな文章が好きではない人たちにとってありがたいツールになるかもしれない話を紹介したい。
日本の読解力の低下と読解力の定義の違い
2019年12月3日に発表された『国際学習到達度調査(PISA)』で、日本の読解力は前回調査時の8位から15位へと大幅に順位を落としている。『国際学習到達度調査(PISA)』とはOECD(経済協力開発機構)が進めている国際的な学習到達度調査のことだ。義務教育を修了している15歳を対象としており、2000年から3年ごと実施され、2018年の調査では79カ国・地域が参加している。
ところで、読解力と聞くと、文章の意味をしっかりと理解するというような意味だと考えている人が多いことだろう。だが、この『国際学習到達度調査(PISA)』では『自らの目標を達成し、自らの知識と可能性を発展させ、社会に参加するために、テキストを理解し、利用し、評価し、熟考し、取り組む力』と定義されている。
ただ、文章を理解するだけでなく、そこから得た情報を自分に取り入れたり、真偽を判断したりすることまで含め、読解力と呼んでいるのだ。
文章を要約するシステム「タンテキ」
さて、前置きが長くなってしまったがここからが本題になる。
文章を読むことが好きではない人たちにとって、文章を読むことは苦行ではないだろうか。出来ることなら要点だけを読みたいが、上手く要点を掴めない人もいるかもしれない。
そんな人たちに紹介したいのが、株式会社バズグラフが発表している「タンテキ」だ。
「タンテキ」は独自の文章解析技術により、今までのAIでは不可能だったレベルの文章読解が可能にしている。それだけでなく、日本語特有の揺らぎやルーズな文法までも正確に解析し、語句と語句のつながりを判断することで、文の構造を正確に把握した要約ができると言うのだ。
詳しい技術内容については情報が開示されていない為、把握できていないが、記事データとその記事の要約されたもの両方をディープラーニングさせることで対応しているのではないかと、筆者は愚考する。
下図は実際に「タンテキ」でニュース記事の要約を試してみたものだ。
文章の圧縮率を10%ずつ選ぶことができる点も非常に魅力的だ。
現在はβ版の運用として1万字以下の文章の要約であれば無料で行うことができるので、興味のある人は是非試してみていただきたい。
筆者も実際に幾つかの記事を使い試してみたが、程度要約は出来ているが、β版ということもあり、完ぺきな要約とは言えないような印象を受けた。だが、文章に齟齬などは見られず、これをAIが自動で生成していると考えると驚きだ。
バズグラフでは有償版のリリースに向け、さらに開発を進めているとのことだ。より正確な要約であったり、更に長文の要約が可能になるなどその推移を期待しながら見ていきたい。
他にもある文章要約ツール
今回紹介した「タンテキ」以外にもAIが文章を要約するツールは既に幾つか存在しているので併せて紹介したい。
朝日新聞社「長文要約生成API」
約500字の文章を約200字に変換したり、文章を30%や50%削減したり、用途に応じた文章を生成することができる。過去30年分の朝日新聞記事のデータおよび、記事を生み出すフローで生み出した内部データを活用することで、効率的にデータを集めディープラーニングさせていると言われている。
こちらもAPIキーを取得することで評価用途に限り無料で使用することが可能の為、興味があれば使用してみてはいかがだろう。
User Local社 自動要約ツール
「タンテキ」と同じように最大で約1万字の文章を3行、5行、10行に要約することができる。注目したいのは本ツールでは要約元の文章の重要な部分がハイライトして表示され、ひと目でわかるようになっていることだ。それを踏まえて要約された文章をみることでAIがどのように要約しているのかを見ることができるのだ。
こちらも無料で試すことができるので、興味があれば一度試していただければと思う。
https://text-summary.userlocal.jp/
おわりに
文章関連のものはAIには難しいと言われていたものの一つである。だが、他の難しいと言われていた芸術分野なども含め、完ぺきとは言えないまでもある程度形になったものがここ数年間で出始めている。それだけ技術の進歩が目覚ましいのだ。これからも新たな情報について注視していきたい。