跨媒体智能将多媒体计算与人工智能结合,开展文字、图像、视频、音频、文档、3D等多媒体内容理解与生成的理论、方法和技术研究,主要目的是借鉴人脑的跨媒体特性,跨越视觉、语言、听觉等不同感官信息感知和认知外部世界,实现多媒体信息的智能处理。
主要研究内容包括多媒体压缩与处理、多媒体分析、跨媒体检索、跨媒体生成、跨媒体传输、跨媒体知识图谱、文档智能、文字计算等。多媒体智能技术广泛应用于新闻出版、新媒体、互联网、各企事业单位等领域,应用技术包括图像视频等内容的生成(AIGC)、图像细分类、特定内容检测与识别、大规模跨媒体内容检索、文档信息识别与分析、多模态信息融合处理等等。
地址:北京市海淀区颐和园路5号(62755617) 反馈意见:its@pku.edu.cn
Copyright 版权所有©北京大学智能学院 All Rrights Reserved.