新开源,自回归文生图领域的创新突破
1. 新开源公司简介: 新开源(300109)是一家综合性企业,主要从事聚乙烯吡咯烷酮(PVP)系列产品、乙烯基甲醚/马来酸酐共聚物(PVM/MA)共聚物、口腔护理产品的生产和基因测序等医疗技术服务。
2. 新开源在新能源领域的应用: 新开源的PVP产品在固态电池中应用广泛,主要作为正极材料和硅基负极碳纳米管导电剂的分散剂,以提高电池性能。
3. 新开源的产能扩展: 新开源位于焦作中站区的PVP一期项目已经投入约1.83亿元,建设内容包括年产2万吨NVP装置等。二期工程的上游GBL及2P方面的建设基本具备试车条件。
4. 新开源的跨界发展: 新开源通过收购呵尔医疗、三济生物和晶能生物三家公司,跨界进入精准医疗行业,确立了精准医疗与精细化工并行的“双轮驱动”发展战略。
如果您有更具体的问题或需要进一步的信息,请随时告知!
字节跳动发布Infinity模型:自回归文生图领域的创新突破
Infinity模型的核心创新:Bitwise Token的自回归框架
Infinity模型的核心创新在于采用了Bitwise Token的自回归框架。这一框架通过预测下一级分辨率的1或-1构成的细粒度Bitwise Token,显著提升了模型对高频信号的捕捉能力,从而生成细节更加丰富的图像。
Infinity模型的性能优势:超越Stable Diffusion3
Infinity模型在图像生成质量上超越了Stable Diffusion3,同时在推理速度上也展现了显著优势。这一成果得益于Infinity模型在词表扩展、模型大小和比特自我矫正技术等方面的创新。
Infinity模型的词表扩展:增强Image tokenizer的表示空间
Infinity模型将词表扩展到无穷大,极大地增强了Image tokenizer的表示空间,提高了自回归文生图的性能上限。这一创新使得Infinity模型在处理复杂图像时具有更强的能力。
Infinity模型的性能对比:远超HART、LlamaGen、Emu3等方法
在性能对比中,Infinity模型在自回归方法中表现突出,远超HART、LlamaGen、Emu3等方法。在人类评测中,Infinity模型以接近90%的胜率击败了HART模型,证明了其在同尺寸模型中的优势。
Infinity模型的胜率:击败SOTA的扩散模型
Infinity模型在击败SOTA的扩散模型如PixArt-Sigma、SD-XL、SD3-Medium等时,也表现出色。其中,Infinity模型以75%、80%、65%的胜率分别击败了这些模型,进一步证明了其在同尺寸模型中的优势。
Infinity模型的scaling特性:验证集损失稳步下降
Infinity模型的另一大特点是其良好的scaling特性。随着模型大小的增加和训练资源的投入,验证集损失稳步下降,验证集准确率稳定提升。这一特性使得Infinity模型在处理大规模数据时具有更高的性能。
Infinity模型的比特自我矫正技术:缓解自回归推理时的累计误差问题
Infinity模型提出了比特自我矫正技术,增强了模型的自我矫正能力,缓解了自回归推理时的累计误差问题。这一技术使得Infinity模型在生成图像时具有更高的稳定性和准确性。
Infinity模型的推理速度:超越现有模型
在推理速度上,Infinity继承了VAR的速度优势,2B模型生成1024x1024的图像仅需0.8秒,比同尺寸的SD3-Medium快3倍,比12B的Flux Dev快14倍。8B模型比同尺寸的SD3.5快7倍,20B模型生成1024x1024的图像用时3秒,比12B的Flux Dev快近4倍。
Infinity模型的开放与试用:GitHub仓库和网站体验
目前,Infinity模型的训练和推理代码、demo、模型权重已在GitHub仓库上线,同时提供了网站体验,方便用户试用和评估模型效果。这一举措有助于推动自回归文生图技术的发展,让更多用户受益于Infinity模型带来的创新。