焦点速看:ImageReward奖励模型:让文本到图像合成更符合人类偏好
(资料图片仅供参考)
站长之家(ChinaZ.com)5月8日 消息:Stable Diffusion 等生成式 AI 模型在文本到图像合成方面越来越受欢迎。像 CLIP 或 BLIP 这样的文本图像评分方法可以评估模型生成的图像是否与文本提示匹配,但它们并不总是符合人类的偏好和感知。
清华大学和北京邮电大学的团队开发了第一个通用的文本到图像的人类偏好奖励模型——ImageReward,主要解决改进生成模型(如 Stable Diffusion)中的各种普遍问题,接受了人类反馈的训练,并使它们与人类价值观和偏好保持一致。
ImageReward 使用强化学习和人类反馈进行训练,这是一种受 OpenAI 的 CLIP 启发的方法。ImageReward 已经接受了137,000个人工评分的 AI 图像训练,有望提供更好的图像合成。ImageReward 在各种基准测试中优于 CLIP、Aesthetic 或 BLIP 等其他评分方法30% 到近40%。
ImageReward 从根据各种标准对 AI 图像进行排名的人类评分中学习
在实践中,ImageReward 实现了更好的文本和图像对齐,减少了身体的扭曲渲染,更好地匹配了人类的审美偏好,并减少了毒性和偏见。该团队在几个示例中展示了 ImageReward 如何影响图像质量,他们让不同的文本图像评分器从64代图像中选择表现最优的图像。
与 CLIP 等其他文本图像评分方法相比,ImageReward 在大多数情况下都能产生更好的结果。
该团队希望在未来与研究界合作,找到将 ImageReward 用作 RLHF 中文本到图像模型的真正奖励模型的方法。ImageReward 可从 GitHub 获得,并提供了有关如何将其集成到 Stable Diffusion WebUI 中的说明。
ImageReward项目网址:
https://github.com/THUDM/ImageReward
(举报)
标签:
- 焦点速看:ImageReward奖励模型:让文本到图像合成更符合人类偏好
- 报道:流转土地_关于流转土地的介绍
- 同有科技:5月5日融资买入3474.8万元,融资融券余额2.53亿元
- 每日金选|新能源整车与锂电池同步出海 量价齐升开启“外卷”模式;游族网络:游戏公司最大的成本是人力成本,AI可以用来降本! 环球快播
- 消息!NX二次开发_射线函数用法
- 环球快看:延边仁韩生物科技有限公司
- 天天观察:2023年05月08日07时06分泰国铢/人民币汇率最新报价
- 全球热议:“互换通”探路衍生品市场对外开放 市场期待“双向通车”――专访彭博大中华区总裁汪大海
- 千万别学我买iPad mini 6:最后亏1000卖掉了
- 白条提前还款要利息吗 微动态
- 雨,周末再见!深圳未一周天气总体平稳,这两天仍要防范大风_快讯
- 电脑正常的屏幕分辨率是多少(如何调整电脑屏幕的分辨率)
- 视点!南方持续降雨 各地紧急抢险救援
- 郑州青年中医捧得“五四奖章”
- 冲!拼!干!常州新一季 讯息
- 天天消息!那香海农贸集市开业运营
- 当前快播:福鼎家长,疫苗查漏补种月开始啦!你家孩子打全了吗?
- 世界今头条!桑树有哪些作用_三个土五笔怎么打
- 传奇变态版手游推荐 最火的传奇变态版手游排行榜2023 每日观察
- 全球最资讯丨助力济南打造中国激光第三极!“世界激光产业大会·齐鲁光谷”项目揭牌
- 国家外汇管理局公布2023年4月末外汇储备规模数据
- 巴里克黄金CEO寻找收购目标,因看好黄金和铜的表现
- 天使路西法电影_天使路 世界新视野
- 《贝姐3》《贝姐起源》同时开发!老任决定谁先发售
- 上海发布大风蓝色预警,今天半夜以前陆地最大阵风有6-7级|简讯
- 长春市绿园区邮政编码_长春市邮政编码 全球视讯
- 世界今亮点!联域光电全靠ODM收入9成来自境外 面临大客户砍单危机
- 每日视讯:高考倒计时一个月,为2023高考生加油!
- 半场-范迪克助攻萨拉赫破门努涅斯失良机 利物浦暂1-0布伦特福德
- 什么是目标管理它有哪些优势与缺陷_什么是目标管理它有何特点