Open AI が開発・提供する画像生成ジェネレーターの DALL-E 2 と、同じく同社による人間が話しているかのような言語を生成する GPT-3 を最近使ってみました。
近年流行のトレンド?である生成系 AI といった新しい技術に触れておこうくらいの感じなので、特に TIPS や参考になるようなヒントがあるというよりは、まだ触ったことがない人に向けて「こんなことができるんだ」くらいの感じで眺めてもらえればと思います。
目次
DALL-E (ダリ) とは何なのか
せっかくなので GPT-3(後述)で生成したテキストを DeepL で翻訳した文章で説明すると以下のようになります。
DALL-E 2は、2021年1月5日にOpenAIが公開した、テキスト記述から画像を生成する人工知能プログラムです。自然言語の入力を解釈し、対応する画像を生成するために、120億パラメータの学習版GPT-3トランスフォーマーモデルを使用します。
ちなみに、英語版 Wikipedia にある文章を翻訳すると以下のようになります。
DALL-E 2は、OpenAIが開発した、自然言語による記述からデジタル画像を生成する機械学習モデルです。
DALL-E – Wikipedia (英文を DeepL により翻訳)
今までは利用するにはアカウント作成後、招待を受けないとサインインできませんでしたが、先日一般公開されたので現在は誰でもアカウント作成して画像生成できます。
DALL-E で画像を生成してみる
DALL-E で画像を生成するには「プロンプト」と呼ばれるテキストを英語で入力することで AI が自動で画像を生成してくれます。生成した画像は想像以下に出来上がったり、思いもよらなかった完成度に仕上がったりと、適当に作っているだけで結構面白いものが出来上がります。
上の3つの画像生成のプロンプトはそれぞれ以下になります。
- 白い砂浜が続くエメラルド色のビーチに建つ巨大な近未来的ビル: A huge futuristic building in the long emerald beach with white sands
- 森の中で熊と戦う2Dポリゴン武闘家: A 2D polygon martial artist fighting with a bear in the forest
- 富士山を眺める武士 葛飾北斎風: A samurai looking at Mount Fuji, Katsushika Hokusai style
プロンプトは DALL-E にログイン後に表示されるテキストボックスに入力します。確定後「Generate」を押すと画像生成が始まります。
GPT-3 は自然な形での文章を生成する
「Generative Pre-trained Transformer」の頭文字である GPT と、3つめのモデル番号ということで「GPT-3」といいます。
GPT-3 でできることとして、質問に対して答えたり、長文を要約したり、正しい文章に直したり、チャットをしたり、ソースコードを生成したりと、多岐にわたります。ちなみに、先程の DALL-E にも GPT-3 が利用されています。
長文を短く要約する
例として長文を要約させてみます。Wikipedia 英語版からマクドナルドのページの最初の部分をいれてみます。一行目に Summary this: といれ、改行して Wikipedia の英文約13行を流し込み、送信します。そうすると3行程度の文章にまとめた文章が生成されました。
専門家と会話をする
次に、他でみかけて面白いなと思ったチャットをやってみました。登場人物として整形外科医と患者を設定し、患者の質問を入力すると整形外科医の答えが生成されるというチャットです。首が痛い患者を設定し、いくつか質問してみました。以下は返答文章を DeepL で翻訳した文章です。
- 患者: 首を横に倒すと痛みを感じるのですが、これは正常なのでしょうか?
- 整形外科: あなたが経験している痛みは、首の椎骨と椎間板の変性状態である頸椎症として知られている状態によるものと思われます。この症状の治療には、通常、理学療法、ストレッチ体操、市販の痛み止めが含まれます。痛みがひどい場合は、医師から副腎皮質ホルモンの注射や手術が勧められることもあります。
- 患者: 一日8時間くらいパソコンの前に座っているのですが、首の痛みを減らすために何かできることはありますか?
- 整形外科: 首の痛みを軽減するためにできることの1つは、良い姿勢を保つことです。コンピュータの前に座るときは、背筋を伸ばし、肩の力を抜いてください。こまめに休憩をとり、首と背中の筋肉をストレッチしましょう。また、手首や手にかかる負担を軽減するために、人間工学に基づいたキーボードやマウスを使用してみるのもよいでしょう。
ちなみに、全然関係のない質問をするとちゃんと整形外科医には関係のない質問という返答が返ってきました。
- 患者: 飲食店に最適なWebマーケティングとは?
- 整形外科: これは医学的な質問ではありません。
きちんと整形外科医としての前提条件に基づいた返答になっているのがわかります。この会話の画面は以下です。
様々な活用法が考えられる AI
これから AI はますます色々な分野で活用されていくことが期待されています。流行っているし、個人でもこのように自由に使えることもできるので、まずは触ってみるということが大事なのかなと思います。
実際に触ってみて感じる気づきも多くありました。日本語ではなく英語でプロンプトを入力する必要はありますが、DeepL といった翻訳ツールも充実してきているので、あまりハードルは高くないと言えます。
他にも色々な生成 AI があるので、時間があるときに試してみたいと思います。ちなみに画像生成AIである Stable Diffusion でジブリ風の絵をリクエストしてみたところ、こんな感じの絵を生成しました。
以上、Open AI の DALL-E 2 と GPT-3 を使ってみた感じをまとめてみました。
コメントを残す