机读格式显示(MARC)
- 000 01445nam0 2200289 450
- 010 __ |a 978-7-111-72303-5 |d CNY49.00
- 092 __ |b 23bwzjgsjpsm-000792
- 100 __ |a 20230301d2023 em y0chiy50 ea
- 200 1_ |a 视觉语言交互中的视觉推理研究 |d =Visual reasoning in Vision-Language interaction |f 牛玉磊著
- 210 __ |a 北京 |c 机械工业出版社 |d 2023-03-01
- 215 __ |a XXVI, 160页, [10] 页图版 |d 21cm
- 314 __ |a 牛玉磊,美国哥伦比亚大学博士后,2015年和2020年于中国人民大学分别获得学士与博士学位。
- 320 __ |a 有书目 (第145-158页)
- 330 __ |a 本书聚焦于视觉-语言领域的视觉推理研究问题。视觉语言是计算机视觉与自然语言处理的交叉领域,对机器的感知和认知能力均有较高的要求。随着深度学习的发展和计算能力的提高,机器的感知能力得到了显著提升,研究者们开始探索机器的认知能力,尤其是推理能力。本书从知识建模和知识推断两个方面入手,对视觉语言交互任务中的视觉推理问题进行研究。其中,知识建模指通过模型的构建,从视觉媒介和自然语言中提取视觉和语言知识,并进行特征表示;知识推断指机器对视觉和语言两个模态的知识进行综合考虑,并进行无偏的推断与估计。
- 333 __ |a 视觉-语言、视觉推理领域的科研工作者或对该领域感兴趣的研究人员
- 510 1_ |a Visual reasoning in Vision-Language interaction
- 801 _0 |a CN |b 北京百万庄图书大厦 |c 2023-07-27