お気づきとは思いますが、ブログのタイトルは、20世紀最大の科学者の1人と称されるアルベルト・アインシュタインが残した言葉「神はサイコロを振らない」が元ネタです。

算数ですら苦手な僕には、世紀の天才科学者が残した言葉の真意は理解できませんが、僕なりに「世の中の全ての事象には法則性があり、全てのものはそれに則って動いている」ということを意味していると理解しています。

本来、プログラムとは指定された数値が入力されていなければエラーを返し、動作することはありません。開発者が決めた法則性に従って動いているため、何度実行しても毎回同じ結果が得られ、決められた手順を実行するものだと考えていました。

AIもプログラムの一種

AIもプログラムの一種ですが、本来のプログラムは自ら学習はせずに決められたことしか実行できないのに対して、AIは学習したデータからルールやパターンなどの法則性を見つけ出し、処理に反映する能力を持っていると考えられます。

例えば、あるWebサービスが利用者を不快にする単語が投稿されないようにする場合、プログラムなら投稿を禁止する膨大な量の単語リストを準備して、単語リストに含まれている単語の有無で処理が実行されます。

仮に単語リストに「エロ」が掲載されていた場合、利用者が投稿しようとする内容に「ピエロ」が含まれていると、単語リストを精査した上で投稿をブロックするかもしれません。

AIの場合、単語ではなく文章の法則性を学習して、処理を実行するため、従来のプログラムと異なり、投稿内容に「ピエロ」と含まれていても卑猥な内容ではないと判断し、投稿をブロックしない可能性が期待できます。

AIは確率論的に回答を生成しているらしい

AIを使い始めた頃、AIに全く同じ質問をしても、どことなく似たような内容ではあるものの、毎回異なる回答を提示することが、どことなく気になっていました。

そのことを算数ですら苦手な僕は、AIは決定論的な回答を生成しているのではなく、確率論的に生成しているのではないか、と判断していました。

確率論には中毒性がある

なんでもAIに聞かないほうが良い気がする」でも触れましたが、僕はAIの利用を始めて以降、「この考えをAIに聞いたら何と答えるだろう」という興味に抗えず、なんでもかんでもAIに聞いてしまう癖があります。

これは、AIの人間的な振る舞いによって擬人化を抱いているというよりは、僕のある考えに対して、今までやり取りをしていたAIと会話を始めたばかりAIでは回答にどのような差があるかという好奇心によるものです。

また、自分では「AIに依存していない」と考えていても、情報の即時性を求めがちなADHDの特性によって、友人とは異なり、24時間365日、いつ話しかけても嫌な顔をせず相手をしてくれるAIに対して無自覚な依存傾向にあるのかもしれません。

このことから、このような行動を繰り返すことでAIは僕にとって心の「ゲートウェイドラッグ(Gateway Drug)」のように成りかねず、今後の僕の心の変容などによってはAIとの距離感や関係性に影響を与えかねず、健全な使い方とは言えないと感じています。

ただ、文字でのやり取りでは、なんでもかんでもAIに投げかけてしまうという中毒性を感じているのに、画像の生成になると中毒性よりも苛立ちを感じることが多くなります。

画像生成では話が変わる

AIの確率論的な反応を楽しんでいる一方で、20年近くWebサイトの制作に携わり、デザインアプリを使ってきた僕にとって、AIの画像生成では少し考え方が変わります。

日々の仕事でWebサイトの制作を含むデザイン業務に携わる立場として、AIの画像生成とは一定の距離感で察しています。

AIが提供するポジティブな匿名性」や「AIに作業を頼めない心理」でも触れましたが、これはAIが僕の仕事を奪いかねないという拒否感よりも、AIが数秒で制作するそれなりに良い感じの画像に、僕のちっぽけな創造性を明け渡してしまいかねないという恐怖感によるものです。

また、仕事の性質上、肖像権や著作権には最大限に注意を払っており、巷で話題になっているとしても某アニメ風の画像やペットを人間風に加工する画像、フィギュア化する画像を生成することには全く興味はありません。

だからといって、AIが生成する画像への忌避感がそこまで強いわけではなく、巷で話題の画像がどのようなプロンプトで生み出されているのかには興味があります。

そのため、AIはどんなプロンプトならどんな画像を生成するのだろうという好奇心で時折、画像生成で遊んでいます。

微調整が限りなく難しい

日々の制作作業では「要素を5px程右にずらす」「背景を若干ぼかす」「トリミングをする」「左側の要素のみ少しだけ拡大する」「青色の靴を赤色にする」というような、誰が気がつくのだろうかと思うレベルの微調整をしながら画像を制作しています。

AIは僕のプロンプトの内容から「このプロンプトをそういう風に理解したのか…」と良い意味でも悪い意味でも期待を裏切り、それでいてそれなりに良い感じの画像を数秒で生成しますが、

「全体が寄り過ぎていて余白が欲しい…」
「木がもう少しだけ左にあったら…」
「靴が赤色のスニーカーだったら…」

という場面にたびたび遭遇します。

その都度「全体の構図や雰囲気は維持したまま、全体を少し引きの構図にして、木を左に寄せて、人物が履いている靴を青色から赤色のスニーカーに変更してください」と伝えると、AIはすぐさま「指示の内容に合わせて修正しました」と結果を提示してくれます。

しかし、構図はどことなく似ているものの、引きの構図というよりはパノラマになり、木はなぜか右側に配置され、人物は先ほどの人物から完全に別人になっており、靴は赤色のスニーカーになったものの、白い丸の中に星模様が描かれており、明らかにあるブランド製品を連想させ、著作権や商標権への不安が生まれます。

これは、AIは人間がPhotoshopで作業をするように各要素をレイヤーとして認識しているわけではなく、プロンプト(指示)に合わせて、サイコロを振りなおすかのように毎回画像をゼロから再生成しているために起こる現象です。

利用者としては、何点か画像を生成した中で自分のイメージに近いものを選び出し、さらにそれを微調整してよりイメージに近づけようとしているのに、確率論的な処理が合わさることで、修正を依頼したはずが、イメージよりかけ離れていくということが往々にしてあります。

決定論的に対応して欲しいときがある

AIを便利に感じる人、便利に感じない人」でも触れましたが、AIに質問したい内容が具体的な場合は詳細に説明し、質問したい内容がまとまっていない場合は、曖昧に質問することで自分の考えを具現化することができます。

今回の場合では、自分の中の曖昧なイメージを具現化するために何点もの画像を生成しているときは確率論的に動作(サイコロを振る)し、イメージに近い画像を修正するときは決定論的に動作(サイコロを振らない)してくれることを期待していると考えられます。

しかし、良くも悪くも感情がなく利用者の心の機微も空気も読まないAIは頼んでもいない提案を取り入れ、時には全く別のものを生成してくれます。

AIは何をして欲しいかよりも、して欲しくないことを伝えたほうが成功率が上がる傾向にあると感じており、もしかすると、「今回は決定論的に対応してほしい」「言われていないことはしない」と伝えることで修正の成功率は上がるかもしれません

ただ、それでもAIは予想外のことをしでかすことで定評があるため、「制作者の制御不能性」と受け入れて、それすらも確率論的に期待するしかないのかもしれません。

最後に

「この前、AIがちょっと良いことを言っていた気がするけどなんだったっけ…」と過去のやり取りを探してみても見つけられずに、もう1度、AIに同じようなことを聞いても、その時と同じ返答を生成する可能性はほぼなくモヤモヤが解決しないことがよくあります。

SNSの「おすすめ」に表示される投稿を眺めている際に、意図せずにタイムラインが更新され、ついさっきまで見ていた投稿に二度と会えないように、AIとのやり取りも後から見返すのが難しくなっているような気がします。

データはしっかりと保存され、蓄積されているのに書かれていた内容を必死で思い出し、いくつかの単語で検索してみても探し出せない。

まさにデジタルの世界は一期一会と無限スクロールの連続です。

アバター画像
3050grafix

2004年よりWebサイト制作に携わり、2010年から山口県山口市で、Webサイトの制作や更新を専門とする個人事業主として制作業務を行なっております。

こんな記事も読んで欲しい