在上一年,Stable Diffusion模型发布以来,“AI文本图片生成”真正的变成普通人也能使用的技术。
但是最近一些网友利用网上的真人图片,不断喂给模型进行自主学习。其训练出来的效果已经可以做到以假乱真,你甚至不知道哪些图片是AI生成的还是真人拍出来的。
为了给广大读者造福利,这篇文章从零开始,教你如何搭建自己的真人AI网站。
1.搭建你自己的AI网站
之前我写过一篇文章,在自己本地可以部署可玩的文本图像生成网站。这里我们也可以直接使用GitHub仓库:stable-diffusion-webui
1.在电脑上安装python 3.10.6,如果已经安装了其他python版本,可以利用conda安装多一个3.10的虚拟环境版本:
conda create -n novelai python==3.10.6
2.下载该仓库的代码:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
3.安装对应的GPU版本的Pytorch,直接进入网站:https://pytorch.org/get-started/locally/,复制对应的命令
进入刚刚创建的虚拟环境”novelai“:
执行刚刚的命令:
./python -m pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116
4.安装成功后,可以测试自己的pytorch版本是否可以跑通
5.进入刚刚下载的Github仓库的代码文件夹,安装第三方依赖:
python -m pip install -r requriements.txt
2.模型下载
有了网站之后,就需要下载对应的AI模型进行有效生成。
一些网友已经利用网上大量的图片训练好的模型,并分享到网站上
https://civitai.com/
这个大名鼎鼎的网站被人们称为”C站“,里面有很多你意想不到的模型
我们可以在这个网站上找到很多已经训练好的模型。比如找一个生成真人图片的模型:ChilloutMix
从网页上下载对应的模型后,把该模型放到工程目录:models/Stable-diffusion
3.生成你的真人图片
启动主程序”launch.py”,等待一定的时间出现网页地址就可以了
打开网址后,我们需要选择刚刚的生成模型:
我们可以参考C站上的prompt词语进行生成:
4.让你生成的图片开口说话
从上面我们已经得到了生成的图片
那么我们就可以利用这张图片,创建自己的AI说话视频
登陆这个网址:
https://studio.d-id.com/
选择刚刚生成的图片,然后输入自己想要说的话,之后生成就可以了:
最后就可以得到比较逼真的真人AI说话视频了。
有了这个技术,就可以批量制作二次元甚至是真人说话视频。这对于AICG这个行业是一个颠覆性的技术,相信未来这个技术在多个领域上都能够推广开来。
好了,以上就是本期的内容了。我是leo,欢迎关注我的公众号“算法一只狗”。我们下期再见~
推荐阅读
02-20 特稿
01-08 特稿
感谢对我的支持
6个