管理人Utanoの戯言やIT関連情報やゲームリプレイや日々の出来事などをつれづれなるままに書きなぐる、そんな感じのブログです。

皆さまいかがお過ごしでしょうか。歌乃です。

ShuttleAI から 新しい学習モデル ShuttleAI 3.1 aesthetic が公開されています。

ShuttleAIの公式 Hugging Face では「画像品質、タイポグラフィ、複雑なプロンプトの理解、リソース効率の面でパフォーマンスが向上しています」と謳っています。

とりあえず使えるかどうか試してみました。

続きを読む… 3 分 35 秒

皆様いかがお過ごしでしょうか。歌乃です。

画像生成してますか?

前回、自作の 3D model 小物 (銃) を取り込んで画像生成を試した記事を書きましたが、様々な要因で望んだクオリティは難しい (不可能ではない) という結論になりました。

その際、一つの解決手段として i2i (image to image 画像を元に画像を生成する) に使用する元絵の加工段階で精度を上げておく、という手法が考えられましたが、専用ソフトでもない限り厳しいという結論に至ってました。

続きを読む… 3 分 43 秒

皆様いかがお過ごしでしょうか。歌乃です。

3D modeling してますか?

大規模学習モデルで画像生成 (PromptGraphics) に傾倒している私ですが、PromptGraphics もモデルによって得手不得手があり、求める画像がなかなか生成されない、もしくは生成されているがいまいち納得がいかない、かゆいところに手が届かない状況も多く発生します。

そういった場合、納得のいかない部分を手描きしてしまうという手っ取り早い解決法があり、私も良くこの方法を使っています。

ですが、私の画力の低さもあって、求めるイメージが学習モデルになかなか伝わらない (学習モデルが手描き画像を元にしたノイズから求めるイメージを復元してくれる確率が低い) という自体が起こるわけです。

※いつものごとく大半が戯言です。

続きを読む… 5 分 30 秒

皆様いかがお過ごしでしょうか。歌乃です。

やっと私のとこにもやってきましたよ。

なにがって?あれですよ、X 冬のBAN祭りですよ!( ゚Д゚)

続きを読む… 1 分 10 秒

皆さまいかがお過ごしでしょうか、歌乃です。

新しい Model はないかしらん?とハギングフェイスを物色していてみつけた OmniGen v1

GitHub はここ。ライセンスは MIT 。

元プロジェクトは コーネル大 (Cornell University in NYC) のコンピュータ科学の研究。

続きを読む… 7 分 10 秒