報告人簡(jiǎn)介:
魏云超,北京交通大學(xué)計算機學(xué)院教授、副院長(cháng),國家高層次人才計劃獲得者。曾在新加坡國立大學(xué)、美國伊利諾伊大學(xué)厄巴納-香檳分校、悉尼科技大學(xué)從事研究工作。入選《麻省理工科技評論》中國區“35歲以下科技創(chuàng )新35人”(MIT TR35 China)、百度全球高潛力華人青年學(xué)者、《澳大利亞人》TOP 40 Rising Star;獲世界互聯(lián)網(wǎng)大會(huì )領(lǐng)先科技獎(2023)、教育部高等學(xué)校自然科學(xué)獎一等獎(2022)、中國圖象圖形學(xué)學(xué)會(huì )科技技術(shù)獎一等獎(2019)、澳大利亞研究委員會(huì )青年研究獎(2019)、IBM C3SR最佳研究獎(2019)、計算機視覺(jué)世界杯ImageNet目標檢測冠軍(2014)及多項CVPR競賽冠軍;發(fā)表CCF A類(lèi)期刊/會(huì )議論文100多篇,Google引用超20000次。目前主要研究方向包括面向非完美數據的視覺(jué)感知、多模態(tài)數據分析、生成式人工智能等。
內容摘要:
近年來(lái),多模態(tài)大模型作為人工智能領(lǐng)域的重要研究方向,已經(jīng)取得了顯著(zhù)的成果。在本次報告中,魏云超教授將分享其課題組利用多模態(tài)大模型在開(kāi)放視覺(jué)內容感知研究方面的相關(guān)工作。這些工作著(zhù)重解決了以下問(wèn)題:1)如何利用多模態(tài)大模型將模型的語(yǔ)義分割能力從有限類(lèi)別擴展到無(wú)限類(lèi)別?2)如何將自然語(yǔ)言的復雜推理能力同語(yǔ)義分割任務(wù)結合,賦予模型在視覺(jué)感知任務(wù)上推理能力?相關(guān)工作均發(fā)表在近期國際頂級會(huì )議上。
歡迎廣大師生參加!
信息科學(xué)與工程學(xué)院(軟件學(xué)院)
2024年5月6日