flow-matching安全

后门攻击

flow-matching的相关攻击,包括后门攻击和prompt攻击,配合数学公式证明一下为什么容易被破解,轻松完成

prompt-based jailbreak

svg相关

svg生成survey

svg+VQVAE

svg的分项生成
VAR加正则逐层匹配损失

llm svg benchmark

关键元素提取与背景生成,跨模态理解

svg大语言模型的survey,但是不是做跟当前的类似,我们只做生成和矢量化,重在矢量图像的自身结构特征
限制数量,fid测试,分层语义

flow-matching用于生成矢量图像

text-to-image相关

美术生会梦见小镇做题家吗?

diffusion生成数学式子

考验diffusion模型的理解能力,在数学上的
生成具有明确数学意义的公式,对此进行benchmark的评估
此后使用纯数学公式对diffusion模型进行微调,来看他是否具有泛化能力

生成效果评估

端到端的llm-as-photo judge

使用端到端的多模态大模型作为图片的评估器
类似llm-as-a-judge

图像语义重建

给予一个固定的文生图模型,给予图片要求进行语义重建,图->文->图的测试

图表benchmark

推测解码

小模型是无需训练的cot推测解码draft模型

使用kv cache快速调度让小模型快速总结大模型生成的思维过程后复用kvcache

VAR推测解码

model-swarm

应用与金融模型

应用于多小类任务的模型并行

eoh

db eoh自动优化

cv模型架构

基于语义分解的模型tokenizer

适用于2d的rope