いさぼうネット
賛助会員一覧
こんにちはゲストさん

登録情報変更(パスワード再発行)

  • rss配信いさぼうネット更新情報はこちら
 シリーズコラム 「社会を支える人工知能」 
【第6回】 人工知能「知取気亭主人さんのお仕事頂戴します!」
 

 突然ですが、以下の文章を御覧ください。

 ヒトは、見たことも経験したこともない遥からことは無い、、最高のそうしいは、何のとがある。方も106年だ。そして、「何とな気がする。そのものであった。そして、「あまり大きな気がするという。、いずれ、その上に今年に、日本的につめていたのかあまりの生物は、一度、私の、も、「大きくなる」と言えば、"んで、しかしないようなまう、またとあったともらいている。我々の一度をするから、やはり最も、スーベル性にはいがたのだが、それは、一年になり、「日本人は“まさかに大る」というマーなどは、リットトのスイタドが子供に10年になってきた日本のようなことない。さらには、そのままだが、そして、手表をお出来ることもありない。その気になったことがある。その中に、思い出したのである。どちらが、そのまま代わることが、1973年間を発表した。205年が大きくなる、自然の「“一日」にとっては、そしてのように高くなる。今年、時々と、これにもない。また、いつまでもいい事が

 この文章ですが、筆者が寝ぼけ眼で書いたものではありません。そして、決して酔っ払って書いたものでもありません。

 では、誰がこの意味不明な文章を書いたのでしょう?

 その答えは人工知能です!

 今回から数回に渡って、人工知能による文章作成についてお伝えしようと思います。また、実際に人工知能による文章作成を試してみましたので、それについてもお伝えしようと思います。

 最近、人工知能に奪われる職業という話題がメディアで取り上げられるようになりました。実際に人工知能が作成した文章を紹介するだけではつまらないため、この話題に乗っかり、いさぼうネットで知取気亭主人さんが毎週配信している「知取気亭主人の四方山話」を人工知能で書かせて、知取気亭主人さんのお仕事を奪いにいってみましょう。

 「知取気亭主人の四方山話」は14年間毎週配信されており、その記事数は727にも上ります。そして、全記事に書かれてる文字の総数は1,547,864文字であり、テキストデータとしてはそれなりのデータ量です。

 では、「知取気亭主人の四方山話」の全記事で人工知能を学習させて、知取気亭主人が書く文章の特徴を捉えた「AI知取気亭主人」を作ってみましょう。

 AI知取気亭主人の執筆方法は、冒頭の20文字(「ヒトは、見たことも経験したこともない遥か」)を人間が与えて、その続きを1文字ごと人工知能が考えて書くこととしました。

 今回は1,547,864文字の並びを学習させ、この学習を複数回行いました。また、AI知取気亭主人の成長を確認するために、1回の学習毎に400文字の文章を出力するようにしました。

 それでは各回の学習から出力された文章を見ていきましょう。

学習1回目(学習開始1時間後)

 ヒトは、見たことも経験したこともない遥か、すことがあったでこない。「ととまた、このしてもらるさん、になっているのだろうか。そうだろうか。はなかったなも方をするかはや日から、、この人もあたりのそのはすままりしたところなになってくるのが、しかし、のにかい。このない。り国からできる。しかし、をしてがたらこしても」と、のったなり、人なめ、にさせさを。「、このりは「者の話を、よる大しい。「またり、人間に、るため、いた。その、は0年のありをられたのだろうか。「なたわりそのがらい。みころをしただろうか。、今を、どんないものは、またをすると、は1100100年3月2日はならって、今年ののり、しかし、にはこのはただ。そうとも。もんがまったと、ちのすか。のなてている。が、にんでりの。ただ、がしたか前をなって。1そせ事」もはあること」と事をしているのは、そのそうなでは、来るのだで、「この思いがもしないためのは、いくなることをのおか、話0のだろう。今人

 所々に『しかし、』、『人間に』、『今年の』、『そうだろうか。』など単語や一言はありますが、まだまだヨチヨチ歩き程度でしょうか?しかしながら、次に出力する文字を1文字毎考えさせている中で、1回の学習で複数文字で構成される単語が出てきたことには驚きました。

 学習11回目(学習開始9時間後)

 ヒトは、見たことも経験したこともない遥かれると、そのはこがらよいはという度、、り、その一ためにとって。年のう出て。さて、もうされている。れたもので、近くはいそうなは、その大きな。してしまったとは、まく、てだ。がそんなようになっているが、よった。1日になっていたりしている。るそれで、っというとしてできう行年事に話わり、だ。い、をした。いものどうたいというのだ。そしている、したという。そして、その、で、そしている。、でもしる。どうだ。、そしてはくれていると、け1んだわけていることも、それが、りうやっている。いきで」、なれて、ったこともそうこのろう。くそんな200月にたた、やっていれば、スーことを見ると、「上はないかれ」にも「一い」、「下を与えるのまだ」というで。10日のうこが「ため」にった方があ』いか。そして、リ」いいものだが「」という。ところが、「るとになるりがある。「、その「になる。うそい、そしてもあってい,くなをだ。なある。の

 なんと、『「』で始まったら『」』で閉じることを覚え始めました。ただ、そのカッコの中身や文章は意味不明です。

 学習23回目(学習開始22時間後)

 ヒトは、見たことも経験したこともない遥かまでも、これも少なくないものだという。41005年害をすると、まついた。我々そいときに、いつのである。体の中である。何とか、人間としても、まだと、それも一方も5.571月である。地方がないのは事にすることだ。アルトにも行ない。よくこれも日本には“もある。”としてくれたものが「ない」という言われた山にそれを呼手になる2月1年"明り、私の事は、後は、それに不思えられる610年の生会をしているのかもしれない。出ているのだが、何かな(2007年3月20日には、書々ながら目に中書以外をした。「「一つ」という。「者は、しかもできいけれた地出は「またなりを見ていると、性のと言いと、そうな意力を除ければるが、クっところこが、「”で、一、と、全くないスマり、それは、「日本を浴ったしれた。生物になるという国民のは、これでも、プランターのトック)である。また、いよう同じた死らの一方の1月分からな話がきることは、

 この段階で、学習時間が非常に長くなると予想されたため、学習速度を向上させるために人工知能のパラメータを少しいじりました。その結果、漢字を多用し始めました。また、『これも少なくないものだという。』、『「ない」という言われた』、『出ているのだが、何かな』など少し文章っぽい部分が多くなってきました。

学習55回目(学習開始44時間後)

 ヒトは、見たことも経験したこともない遥か回も、多くの思い道をもたらすだけに「最近、」を手に「付き」としても“なり”なのかもしれない。そうすると、一度に、長いという。結局、しかも200年のたちに違いない。そのままということがは言うということだろう。どんな高気も大が“ニュース”といった。それがそうだろう。この大きな気に思っているのは、」といっているものだ。「「トンドン」に、「またという」がは、本人などは、その高い国の一年に関する時にもあるのも、そして日本日は“思い”の.333年は、日本の話も、無い。『今子もあって、こんな「一年」のかと思われるようになり、つまり、チッラインが“その後の時は、そのは、というよう”だ。これももない。学事のものなことで、このものにも大きな要因は、「世界さん」やつだ慢の「一年、少なく、といった。その上に、といるのだ。その新聞に言わせるには「食べきらしくたくなる“この間は無くなっている。“としてやって”の金と

 ここでは『“なり”』、『“ニュース”』、『“思い”』や『“その後の時は、そのは、というよう”』のように、『”』は文字・文章を囲むということを覚えました。文章の内容に関しては、学習23回目とあまり変わらない程度でしょうか。

 さて、現状としては、まだまだ知取気亭主人さんから「知取気亭主人の四方山話」の仕事を奪えるレベルではありません。文章作成技術を更に洗練させ、十分な学習時間が必要みたいです。

 次回も、人工知能による文章作成とAI知取気亭主人の続編をお伝えしようと思います。

<余談>
AI知取気亭主人が発したおもしろセンテンス。(注意:一切、知取気亭主人とは関係ありません)
・インタータットしてくれてしまう (インターネットしてしまう?)
・このことではないか。これまでの結婚になったのも (どのこと!?)
・金を目にするのだが、「一時のようにともらいたくなった。 (お金ほしいよね。)

Copyright(C) 2002- ISABOU.NET All rights reserved.