【AI】Tiled diffusionによる簡単アップスケール

832: 名無しさん@お腹いっぱい。 (ワッチョイ 0661-31TA) 2023/05/26(金) 12:51:43.54 ID:WoJmSq3y0
>>829 変なレス拾って話広げてしまってすまん

ところで今更 Tiled Diffusion + ControlNet 試してるけどお手軽で綺麗にアップスケール出来て良いね
https://imgur.com/a/xpQBJlf
元画像の質感損なわず綺麗に拡大してくれてるわ

引用元:https://mevius.5ch.net/test/read.cgi/cg/1682857488/

833: 名無しさん@お腹いっぱい。 (テテンテンテン MM86-FIIW) 2023/05/26(金) 12:59:54.54 ID:wBoNCl65M
>>832
なにこれすげー
これってたまたま上手くいったケースじゃなくて確実にほぼそのままの絵柄で拡大できるの?
タイルの意味がよくわからん、というか全くわからん

834: 名無しさん@お腹いっぱい。 (ワッチョイ 0661-31TA) 2023/05/26(金) 13:03:15.99 ID:WoJmSq3y0
>>833 まだ自分も沢山は試せてないから断言はできないけど、今のところは大体綺麗に拡大してくれてる。
タイルの仕組みは俺もよく分かってないけど、要は一つの画像を細かい区画に区切って拡大してるってことだと思う。

846: 名無しさん@お腹いっぱい。 (ワッチョイ cb01-ko3+) 2023/05/26(金) 16:32:07.22 ID:U+wAsQj70
>>833
他人だけどだいたいそれであってる
ディテールを維持して拡大できる革命的な機能
Tiledだけだと細部が変わることがあるけど併用だとそのままキレイに拡大できる

847: 名無しさん@お腹いっぱい。 (ワッチョイ caa9-ayg6) 2023/05/26(金) 16:37:31.85 ID:UUi91krJ0
>>832
4GB VRAMでは無理?

848: 名無しさん@お腹いっぱい。 (ワッチョイ 0661-31TA) 2023/05/26(金) 16:42:25.34 ID:WoJmSq3y0
>>847 分からんけどめっちゃ大きくし過ぎなければある程度までならいけるんじゃない?
自分はGTX1070の雑魚だけどさっき教わったTiledVAEで4K出力出来てるしw

857: 名無しさん@お腹いっぱい。 (ワッチョイ 0661-31TA) 2023/05/26(金) 18:55:49.58 ID:WoJmSq3y0
>>854 手順としては
・768×432をhiresしないでいくつか出力
・気に入った画像を選んでPNG Info にドロップ > Send to img2imgを押す
・Tiled DiffusionとControlNetを設定 (Enable Tiled VAEもここでやる)
っていう感じでやった

一応エビデンスとして貼っておく
https://imgur.com/a/Uk2obfW

859: 名無しさん@お腹いっぱい。 (ワッチョイ caa9-ayg6) 2023/05/26(金) 19:13:07.86 ID:UUi91krJ0
>>857
ぉぉ、神よ
1070って8GBなのか・・・4GBと思ってた
8GBなら確かに1650superより高解像度いけるよね

それよりimgurって複数ファイルいけるようになったのね

860: 名無しさん@お腹いっぱい。 (ワッチョイ 0661-31TA) 2023/05/26(金) 19:19:19.22 ID:WoJmSq3y0
>>859 一応 –medvramは有効にしてる。あとCN使う時はLow VRAMにもチェック入れてる

836: 名無しさん@お腹いっぱい。 (ワッチョイ 0661-31TA) 2023/05/26(金) 13:21:28.66 ID:WoJmSq3y0
人物より背景が細かいソースにしてみた
https://imgur.com/a/KpXVSKx

宇宙船の残骸とか奥の山の表面とか手前の地面の岩と山草の質感は良いんだけど、星空が雑な感じになった。
完璧では無いねー

838: 名無しさん@お腹いっぱい。 (テテンテンテン MM86-FIIW) 2023/05/26(金) 13:49:03.87 ID:wBoNCl65M
ついでにTiledVAEもええね
VRAM使用量半減ででかいの出せる

839: 名無しさん@お腹いっぱい。 (ワッチョイ 0661-31TA) 2023/05/26(金) 14:14:50.55 ID:WoJmSq3y0
>>838 本当だ、さっきの画像で試したら5倍の3840×2160まで拡大できたわw

840: 名無しさん@お腹いっぱい。 (ワッチョイ 3a55-LHQO) 2023/05/26(金) 14:27:01.18 ID:L4V6dWZP0
今更始めたけど程々の解像度で生成するだけなら6GB奴でもまあ実用レベルなのな…へー…
なおそっから先

842: 名無しさん@お腹いっぱい。 (テテンテンテン MM86-FIIW) 2023/05/26(金) 15:30:43.78 ID:wBoNCl65M
俺の場合は理由はわからんけど、ControlNetは無しで、Tiled Diffusionだけのほうが結果が良いわ
TiledVAEの有無はほとんど影響ないから常時有効でよさそう

843: 名無しさん@お腹いっぱい。 (ワッチョイ 0661-31TA) 2023/05/26(金) 15:42:08.53 ID:WoJmSq3y0
やっぱこれモデルとか描画されてる内容によるよね。マジ沼w
ただの好き嫌いではあるんだけどNoise Inversionも試してみたら質感消えてのっぺりしちゃって微妙に感じた
でも多分もっとアニメっぽい他のモデルとかなら普通にありだとも思った

844: 名無しさん@お腹いっぱい。 (ワッチョイ 6f02-FIIW) 2023/05/26(金) 15:43:08.57 ID:cbE7MK1/0
分割とタイルの話がまざってんな
低ストレングスじゃCN使う意味ねえから

845: 名無しさん@お腹いっぱい。 (ワッチョイ 0661-31TA) 2023/05/26(金) 16:21:41.73 ID:WoJmSq3y0
確かにDenoise strength 0.35で試した感じだとControlNetいらないかも
https://imgur.com/a/fHujBKm

FFMpeg で SSIM 出してみたけど、
TDのみ: SSIM R:0.766411 (6.315485) G:0.766237 (6.312244) B:0.712554 (5.414434) All:0.748401 (5.992907)
TD+CN: SSIM R:0.791622 (6.811482) G:0.796111 (6.906054) B:0.744627 (5.928251) All:0.777453 (6.525787)
って感じで一応CN使った方が微妙に高くはなってたけど、雑にペイントで1920×1080 -> 768×432のリサイズしてソースと比較しただけだからあんま当てにならない。