【概要速修】Stable Diffusion(テキストから画像生成)はどうやって実現するのかざっくり仕組みを知る(DiffusionModel,Deep Learninig)【機械学習解説動画】

Published: 02 September 2022
on channel: ThothChildren みんなのわかりやすい技術解説動画

16,420

441

本日は、Stable Diffusionの仕組みについてです.

Stable Diffusionは文章を与えるだけで、これまで存在しないような画像など、様々な画風を持ちながら多様な画像を生成することができる技術です. 内部では、ノイズ画像から次第に綺麗な画像を生み出すことで実現しています.
論文並びにその実装もオープンソースとして公開されており、誰でも機能を試すことができます. このような文章から画像を作る技術をtext2imageと呼びます. 少し工夫すると画像から画像を生成することも可能です.

今回はこのStable Diffusionで使われている機械学習/DeepLearning技術をざっくりと把握することで、どのように実現されているのかを学びます.

今回はユーザが入力したテキストから全く新しい画像生成を行うStable Diffusionを17分で紹介します.

ThothChildrenは数分でアルゴリズムのポイントをわかりやすく簡単に理解できること、メリットデメリットの把握を目指した解説を投稿する動画チャンネルです.

【リンク】

ThothChildren - エンジニアをサポートするサイト
http://www.thothchildren.com/top

【概要速修】𓀀ヒエログリフ𓅓でプログラミング|古代エジプトの文字𓅓|(Parserを活用してAST生成しTranspile)【JavaScript】
   • 【概要速修】𓀀ヒエログリフ𓅓でプログラミング|古代エジプトの文字𓅓|(Pa...

【概要速修】C言語やC++がコンパイルされて実行される仕組みをさっと知りたい. なぜ異なるOSで実行できないかなど【初心者向け】
   • 【概要速修】C言語やC++がコンパイルされて実行される仕組みをさっと知りた...

【概要速修】JavaScriptはどう動く?仕組みをさっと知りたい【初心者向け】
   • 【概要速修】JavaScriptはどう動く?仕組みをさっと知りたい【初心者向け】

【数分解説】K-means法(k平均法) : クラスタ数を指定してデータを分割、クラスタリングしたい
   • 【数分解説】K-means法(k平均法) : クラスタ数を指定してデータを...

【数分解説】ベイズとかp(A|B)、画像や文字列を絡めた確率、条件付き確率のイメージを持てるようにする解説動画【初学者向け】
   • 【数分解説】ベイズとかp(A|B)、画像や文字列を絡めた確率、条件付き確率...

【数分解説】ラグランジュの未定乗数法 : 拘束条件を守りつつ関数の値を最大化するパラメータを求めたい【Lagrange multiplier】
   • 【数分解説】ラグランジュの未定乗数法  : 拘束条件を守りつつ関数の値を最...

【数分解説】レーベンバーグ・マーカート法 : 非線形な式を扱う場合でも関数の極小値を高速に求めたい:関数フィッティングなどに応用【Levenberg–Marquardt algorithm】
   • 【数分解説】レーベンバーグ・マーカート法  : 非線形な式を扱う場合でも関...

【数分解説】ガウス・ニュートン法 : 非線形な式を扱う場合でも関数の極小値を高速に求めたい:関数フィッティングなどに応用【Gauss Newton Method】
   • 【数分解説】ガウス・ニュートン法  : 非線形な式を扱う場合でも関数の極小...

【数分解説】ニュートン法による最適化 : 非線形な式を扱う場合でも関数の極小値を求めたい:関数フィッティングなどに応用【Newton Methods】
   • 【数分解説】ニュートン法による最適化  : 非線形な式を扱う場合でも関数の...

【数分解説】拡張カルマンフィルタ : 非線形でもノイズを考慮してリアルタイムに直接観測できない状態を推定したい【Extended Kalman FIlter】
   • 【数分解説】拡張カルマンフィルタ  : 非線形でもノイズを考慮してリアルタ...

【数分解説】カルマンフィルタ : ノイズを考慮してリアルタイムに直接観測できない状態を推定したい【Kalman FIlter】
   • 【数分解説】カルマンフィルタ  : ノイズを考慮してリアルタイムに直接観測...

【数分解説】ベイズ更新 : データを受けて確率を逐次的に更新して推定したい
   • 【数分解説】ベイズ更新 : データを受けて確率を逐次的に更新して推定したい

[内容の抜粋]
DiffusionModelやU Netとは何か、どのようにユーザのテキストを生成に生かしているのか、Cross AttentionからVariational AutoEncoderまで広く知識を拾っていきます. Clip Text Encoderに関しても解説します.

Stable DiffusionはどのようなデータでもAttentionに繋げることができるのが強みの一つです.
これまでのようにテキストから画像の他、低解像度の画像を高解像度にする超解像、物の配置などを指定して画像生成するlayout ツー imageや、マスクした箇所の画像を消して画素を保管するようなinpaintingなどを実現することも可能です. 低解像度の画像や、レイアウト情報のテキスト、マスク画像とマスクをかけたい情報を、
それぞれAttentionと入出力に入れることで実現できます.

-----
iOSアプリ紹介

あなたの休日/旅が最速で決まるアプリ - さるたびこがAppStoreで公開中!!!

やりたいことを見つけるだけでも、旅行の予定を立てることも、友達に共有もあっという間!
見逃してはいけない旅先を逃さないから後悔しない、最強タイパコスパ旅程アプリ。
賢く一瞬で旅程を作る時代にSarutabiko。
https://apple.co/4fLfmCs
https://apps.apple.com/jp/app/id66671...

Watch video 【概要速修】Stable Diffusion(テキストから画像生成)はどうやって実現するのかざっくり仕組みを知る(DiffusionModel,Deep Learninig)【機械学習解説動画】 online without registration, duration hours minute second in high quality. This video was added by user ThothChildren みんなのわかりやすい技術解説動画 02 September 2022, don't forget to share it with your friends and acquaintances, it has been viewed on our site 16,420 once and liked it 441 people.