免费的开源稳定扩散非常受欢迎!
有些人将其用作简短的视频,他们可以在几分钟之内游览地球上一切的演变。
其他人用它来使英雄在守望先锋中。
即使由于过度使用和ART版权问题,一群艺术家甚至开始争论,并向禁令报告了一个非正式的帐户。
这究竟如何创造出如此惊人的回应?
让我们看看到底说了什么。
又是扩散模型
首先,从名称稳定扩散来看,我们可以看到这主要使用扩散模型(扩散模型)。
简而言之,扩散模型是通过连续应用Denoisis AutoCododer逐渐生成图像的过程。
通常提到的扩散是反复在图像中添加小的随机噪声。扩散模型与此过程相反。——生成噪声的高清图像。训练有素的神经网络通常是U-NET。
但是,由于该模型直接在像素空间中运行,因此扩散模型的训练和计算成本非常昂贵。
基于此背景,稳定的扩散主要以两个步骤进行。
首先,使用编码器将图像X压缩到较低的潜在空间表示z(x)中。
上下文y,即输入文本提示,用于指导x的denoising。
与时间步骤t一起,它以两种方式注入潜在的空间表示:简单连接和交叉。
然后根据z(x)进行扩散和降解。换句话说,该模型并未在图像上直接计算,从而减少了训练时间并具有更好的结果。
值得一提的是,稳定扩散的上下文机制非常灵活。 Y不仅可以是图像标签,而且可以是掩码图像,场景细分和空间布局。
霸占GitHub热榜第一
这个平台一直在Github热门列表中排名第一,并积累了2.9k星。
这是由慕尼黑大学和跑道的机器视觉和学习研究小组的研究人员开发的开源模型,基于CVPR2022的论文《High-Resolution Image Synthesis with Latent Diffusion Models》,并与其他社区团队合作。
根据官方报道,它可以在几秒钟内对消费者CPU进行创作,而无需进行任何预处理和后处理。
核心数据集是LAION-5B的子集,该子集是专门为基于剪辑的新模型而创建的。
同时,它也是第一个在4,000个A100 EZRA-1 AI超大群集群中训练的文本对图像模型。
无论如何,文本生成的图像派对中还有另一个强大的明星。 (狗头)
github链接:https://github.com/compvis/latent-diffusion参考链接: [1] https://TWITTER.COM/AI__PUB/STATUS/15613625424242487695360 [2] https://STOBICATION.AI/BLOG/STABLE-DIFFUSION-ANSECTION [3] 3https://ARXIV.ORG.ORG.ORG/ABS/ABS/2112.10752
– 超过-
用户评论
念初
这波 Stable Diffusion太厉害了,居然能把人AI图都生成出来!
有7位网友表示赞同!
命硬
听说是因为它能制作非常逼真的图片,所以才被举报的啊。
有6位网友表示赞同!
我要变勇敢℅℅
没想到科技发展这么快啊,这种 AI 可以做这么多事情!
有18位网友表示赞同!
慑人的傲气
LeCun 点赞?那必须是靠谱的啊!
有16位网友表示赞同!
未来未必来
感觉未来的绘画行业可能会被AI颠覆了。
有16位网友表示赞同!
最怕挣扎
这个 Stable Diffusion 我要去试试看!
有10位网友表示赞同!
淡抹丶悲伤
大家都在用吗?我怎么没听说过呢?
有19位网友表示赞同!
闲肆
希望这种技术能够更好地应用在艺术创作上。
有15位网友表示赞同!
莫阑珊
感觉有点像电影里那种AI创造的画面吧。
有14位网友表示赞同!
旧爱剩女
这背后机制听起来很复杂啊,估计普通人不太能理解。
有17位网友表示赞同!
太易動情也是罪名
现在谁都可能成为艺术家了呗!
有11位网友表示赞同!
掉眼泪
这么厉害的技术居然会被人举报,真是可惜。
有6位网友表示赞同!
入骨相思
我很好奇它是怎么运作的,会不会有一些道德问题?
有18位网友表示赞同!
歆久
AI技术的发展确实令人兴奋,也可以带来很多挑战。
有20位网友表示赞同!
男神大妈
说不定以后我们可以用软件自己绘画了!
有13位网友表示赞同!
灼痛
这个技术真的需要好好学习一下,很有潜力!
有14位网友表示赞同!
伱德柔情是我的痛。
现在的人真是太厲害了!
有5位网友表示赞同!
抚笙
未来想想还是蛮期待的啊!
有14位网友表示赞同!
你瞒我瞒
希望这种技术能够被更广泛地应用于生活各个方面。
有11位网友表示赞同!