flow-matching安全
后门攻击
flow-matching的相关攻击,包括后门攻击和prompt攻击,配合数学公式证明一下为什么容易被破解,轻松完成
prompt-based jailbreak
svg相关
svg生成survey
svg+VQVAE
svg的分项生成
VAR加正则逐层匹配损失
llm svg benchmark
关键元素提取与背景生成,跨模态理解
svg大语言模型的survey,但是不是做跟当前的类似,我们只做生成和矢量化,重在矢量图像的自身结构特征
限制数量,fid测试,分层语义
flow-matching用于生成矢量图像
text-to-image相关
美术生会梦见小镇做题家吗?
diffusion生成数学式子
考验diffusion模型的理解能力,在数学上的
生成具有明确数学意义的公式,对此进行benchmark的评估
此后使用纯数学公式对diffusion模型进行微调,来看他是否具有泛化能力
生成效果评估
端到端的llm-as-photo judge
使用端到端的多模态大模型作为图片的评估器
类似llm-as-a-judge
图像语义重建
给予一个固定的文生图模型,给予图片要求进行语义重建,图->文->图的测试
图表benchmark
推测解码
小模型是无需训练的cot推测解码draft模型
使用kv cache快速调度让小模型快速总结大模型生成的思维过程后复用kvcache