デザイン会社 btrax > Freshtrax > いまさら聞けない生成AIの基本...
いまさら聞けない生成AIの基本【生成AI vol.1】
ここ数週間でジェネレーティブAI (生成AI) がネットを中心に大旋風を巻き起こしている。
SNSを見ればタイムラインに次から次へとChatGPTの上手な使い方やアウトプット画面。そしてAIによって生成されたリアルな画像がシェアされている。
そして一週間でものすごい数のAI系のサービスがリリースされている。
生成AIの進化が爆速すぎる
あまりにもいきなりすぎる。あまりにも進化スピードが速すぎる感じがする。昨日できなかったことが今日できるようになったりしてる。
まるで今までの1年間におけるテクノロジーの進化がまるで1日で一気に達成されてる感覚。
そんな爆速なスピードで生成AIが普及し始めたものだから、ついていくのがやっとな感じがする。僕自身も会社のテクノロジー主任に教えてもらいながらなんとか知識を保っているレベルだ。
生成AIのウェビナーに登壇することに
そんな状態だったのにも関わらず先日「世界に衝撃!Generative AIとは?」というタイトルのウェビナーで登壇した。
元々は友人でもあるTomorrow Accessの傍島さんから一ヶ月ほど前に依頼をいただき、その際には快諾した。しかし、それからイベント開催するまでの間にとんでもなく進化してしまった。
GPT-4がリリースされ、ChatGPTもアップデートされ、Midjourneyもv5になった。というか、ここで自分で書いていても正直よくわからないくらいだ。
デザイナー目線で説明する生成AI
そのため、僕が行ったウェビナーの内容は極力誰にでもわかるように心がけた。そしてできる限りデザイナー目線でのお話をした。
今回はその内容を元に誰にでもわかる生成AIの基本をウェビナーで利用したスライドを活用しながらまとめることにした。
この記事はその第一弾である基本編である。
生成 (ジェネレーティブ) AIとは?
まずは基本中の基本。そもそも「生成AI」って何?というところから。
これは生成を意味する英語の “Generate” と人工知能である “AI” を合わせた “Generative AI” の日本語表記で「AIで何かを生成する」という意味。
簡単に表現すると2つ以上の入力に対してAIが “いい感じ” に出力を生成してくれるのが生成AIのサービスだったりする。
例えば、「サンフランシスコの風景写真とモネの画風を合わせて」とAIにお願いするとこんな感じになる。
また、ChatGPTのように何かを聞いたらそれに対して答えてくれる仕組みと、音声を再現する仕組みを合わせて、故スティーブ・ジョブズを再現できたりもする。AIがジョブズの声を学んだことで実現した結果がこれ。
ということで、おさらいになってしまうが、生成AIは一言で表現すると、”文字 や 画像等を入力しAIに生成させる” 仕組み、である。
何が生成できるの?
じゃあ、そんなすごいAIだったらどんなものが生成できるのか?
全てを想定することは永遠に難しいが、今のところは:
- 文章
- 画像
- 動画
- ゲーム
- Webサイト
- アプリ
- 音声
はアウトプットとして確実に生成することが可能。
文字から画像、画像から文字、画像から画像も可能
生成AIの使い方で最も一般的なのは、文字を入力して文字を出力してもらう手法。ChatGPTはまさにそうで、指示に従ってメールの本文を書いてくれたりする。
次に一般的なのは、文字を入力してそれに応じた画像を生成する使い方。たとえばこんな感じ。
また、画像から文字を生成することも可能で、AIが画像に写っている物体を分析してユーザーからの指示に応じた内容を生成してくれる。
あと、複数の画像を提供して、それを元にAIが画像を生成することも可能になっている。例えばこの例のような感じで。
ここまで読めば、難しいことがわからなくても、とりあえず生成AIがかなり便利なのがお分かりいただけたと思う。
なぜ革命的なの?
こんなにも凄いことができるのだからかなり革命的。
でも、何がそんなに騒がれるほど凄いのかというと、インターネットがこの世に生まれてから、恐らくこのテクノロジーによって時代が “第三期” 情報革命に入ろうとしているからだ。
第一期はWebが普及し、ハイパーリンクで情報が得られるようになった時代。初期の頃のYahooやWikipediaなどが良い例。
第二期はネット上の情報が増えすぎて、リンクだけでは追えなくなったことで “検索” テクノロジーを活用して情報を獲得するようになった時代。まさにGoogleが世界一になった理由がそれ。
そして、第三期が対話と生成で情報が獲得できる時代。まさに我々は生成AIの登場によって第三期情報革命を目の当たりにしようとしているのだ。
次回は「プロンプト」に関して
次回は生成AIを操る際に重要になってくる「プロンプト」に関してできるだけ簡単に、わかりやすくまとめました。
今回のウェビナー録画動画
【12/6(水)開催】動画生成AI最前線:Mootion CEO × チャエン氏 特別対談
世界が注目する動画生成AI「Mootion」から、CEO Yonggang Wang氏が来日。 AI専門家チャエン氏を迎え、最新技術と市場展望について語る特別セッションを開催いたします。
■ 特別デモンストレーションあり
■ 参加者全員にMootionプレミアムアカウント1ヶ月分進呈
開催概要: 📅 2023年12月6日(水) 18:00-20:30 📍 AOU銀座の森 💰 参加無料
※本イベントは事前承認制となっております ※メディア関係者・インフルエンサーの方からのお申し込みを歓迎いたします
AI技術の事業応用に関心をお持ちの方は、ぜひこの機会をご活用ください。 ▼ 詳細・お申し込みはこちらの画像をタップ👇