
デザイン会社 btrax > Freshtrax > いまさら聞けない生成AIの基本...
いまさら聞けない生成AIの基本【生成AI vol.1】
ここ数週間でジェネレーティブAI (生成AI) がネットを中心に大旋風を巻き起こしている。
SNSを見ればタイムラインに次から次へとChatGPTの上手な使い方やアウトプット画面。そしてAIによって生成されたリアルな画像がシェアされている。
そして一週間でものすごい数のAI系のサービスがリリースされている。

2023年3月3週目だけでもこれだけの生成系AI関連サービスがリリースされている
生成AIの進化が爆速すぎる
あまりにもいきなりすぎる。あまりにも進化スピードが速すぎる感じがする。昨日できなかったことが今日できるようになったりしてる。
まるで今までの1年間におけるテクノロジーの進化がまるで1日で一気に達成されてる感覚。
そんな爆速なスピードで生成AIが普及し始めたものだから、ついていくのがやっとな感じがする。僕自身も会社のテクノロジー主任に教えてもらいながらなんとか知識を保っているレベルだ。
生成AIのウェビナーに登壇することに
そんな状態だったのにも関わらず先日「世界に衝撃!Generative AIとは?」というタイトルのウェビナーで登壇した。
元々は友人でもあるTomorrow Accessの傍島さんから一ヶ月ほど前に依頼をいただき、その際には快諾した。しかし、それからイベント開催するまでの間にとんでもなく進化してしまった。
GPT-4がリリースされ、ChatGPTもアップデートされ、Midjourneyもv5になった。というか、ここで自分で書いていても正直よくわからないくらいだ。

開催されたGenerative AIに関するウェビナーのバナー
デザイナー目線で説明する生成AI
そのため、僕が行ったウェビナーの内容は極力誰にでもわかるように心がけた。そしてできる限りデザイナー目線でのお話をした。
今回はその内容を元に誰にでもわかる生成AIの基本をウェビナーで利用したスライドを活用しながらまとめることにした。
この記事はその第一弾である基本編である。
生成 (ジェネレーティブ) AIとは?
まずは基本中の基本。そもそも「生成AI」って何?というところから。
これは生成を意味する英語の “Generate” と人工知能である “AI” を合わせた “Generative AI” の日本語表記で「AIで何かを生成する」という意味。

生成系AIの基本的な概念
簡単に表現すると2つ以上の入力に対してAIが “いい感じ” に出力を生成してくれるのが生成AIのサービスだったりする。
例えば、「サンフランシスコの風景写真とモネの画風を合わせて」とAIにお願いするとこんな感じになる。

サンフランシスコの写真とモネの画風を合わせて生成された画像
また、ChatGPTのように何かを聞いたらそれに対して答えてくれる仕組みと、音声を再現する仕組みを合わせて、故スティーブ・ジョブズを再現できたりもする。AIがジョブズの声を学んだことで実現した結果がこれ。
ということで、おさらいになってしまうが、生成AIは一言で表現すると、”文字 や 画像等を入力しAIに生成させる” 仕組み、である。

生成系AIを一言で表現したら
何が生成できるの?
じゃあ、そんなすごいAIだったらどんなものが生成できるのか?
全てを想定することは永遠に難しいが、今のところは:
- 文章
- 画像
- 動画
- ゲーム
- Webサイト
- アプリ
- 音声
はアウトプットとして確実に生成することが可能。

AIで生成されるアウトプット例
文字から画像、画像から文字、画像から画像も可能
生成AIの使い方で最も一般的なのは、文字を入力して文字を出力してもらう手法。ChatGPTはまさにそうで、指示に従ってメールの本文を書いてくれたりする。

ChatGPTに書いてもらったドクターへのアポ取りメールの内容
次に一般的なのは、文字を入力してそれに応じた画像を生成する使い方。たとえばこんな感じ。

文字入力から画像を生成
また、画像から文字を生成することも可能で、AIが画像に写っている物体を分析してユーザーからの指示に応じた内容を生成してくれる。

画像から文章をアウトプット
あと、複数の画像を提供して、それを元にAIが画像を生成することも可能になっている。例えばこの例のような感じで。

複数の画像から画像を生成
ここまで読めば、難しいことがわからなくても、とりあえず生成AIがかなり便利なのがお分かりいただけたと思う。
なぜ革命的なの?
こんなにも凄いことができるのだからかなり革命的。
でも、何がそんなに騒がれるほど凄いのかというと、インターネットがこの世に生まれてから、恐らくこのテクノロジーによって時代が “第三期” 情報革命に入ろうとしているからだ。
第一期はWebが普及し、ハイパーリンクで情報が得られるようになった時代。初期の頃のYahooやWikipediaなどが良い例。
第二期はネット上の情報が増えすぎて、リンクだけでは追えなくなったことで “検索” テクノロジーを活用して情報を獲得するようになった時代。まさにGoogleが世界一になった理由がそれ。
そして、第三期が対話と生成で情報が獲得できる時代。まさに我々は生成AIの登場によって第三期情報革命を目の当たりにしようとしているのだ。

時代は情報革命の第三期に入ってきている
次回は「プロンプト」に関して
次回は生成AIを操る際に重要になってくる「プロンプト」に関してできるだけ簡単に、わかりやすくまとめました。
今回のウェビナー録画動画
私たちと一緒に働きませんか?
ビートラックスは、デザインを中心に、最適なユーザー体験を創造し、新しい価値の創出に貢献している会社です。協調性が高く、ポジティブで、主体性を持って仕事を進めるメンバーが集まっています。
私たちと一緒に働いて革新的なプロジェクトを共に実施しませんか?