MARC状态:订购 文献类型:中文图书 浏览次数:4
- 题名/责任者:
- 视觉语言交互中的视觉推理研究/牛玉磊著
- 出版发行项:
- 北京:机械工业出版社,2023-03-01
- ISBN及定价:
- 978-7-111-72303-5/CNY49.00
- 载体形态项:
- XXVI, 160页, [10] 页图版;21cm
- 丛编项:
- CCF优博丛书
- 个人责任者:
- 牛玉磊
- 学科主题:
- 计算机视觉
- 中图法分类号:
- TP302.7
- 责任者附注:
- 牛玉磊,美国哥伦比亚大学博士后,2015年和2020年于中国人民大学分别获得学士与博士学位。
- 书目附注:
- 有书目 (第145-158页)
- 提要文摘附注:
- 本书聚焦于视觉-语言领域的视觉推理研究问题。视觉语言是计算机视觉与自然语言处理的交叉领域,对机器的感知和认知能力均有较高的要求。随着深度学习的发展和计算能力的提高,机器的感知能力得到了显著提升,研究者们开始探索机器的认知能力,尤其是推理能力。本书从知识建模和知识推断两个方面入手,对视觉语言交互任务中的视觉推理问题进行研究。其中,知识建模指通过模型的构建,从视觉媒介和自然语言中提取视觉和语言知识,并进行特征表示;知识推断指机器对视觉和语言两个模态的知识进行综合考虑,并进行无偏的推断与估计。
- 使用对象附注:
- 视觉-语言、视觉推理领域的科研工作者或对该领域感兴趣的研究人员
全部MARC细节信息>>