基于多模態(tài)大模型的開(kāi)放視覺(jué)內容感知

活動(dòng)時(shí)間：2024年5月8日（周三）16:00 活動(dòng)地點(diǎn)：信息學(xué)院2號樓行知學(xué)術(shù)報告廳

報告人簡(jiǎn)介：

魏云超，北京交通大學(xué)計算機學(xué)院教授、副院長(cháng)，國家高層次人才計劃獲得者。曾在新加坡國立大學(xué)、美國伊利諾伊大學(xué)厄巴納-香檳分校、悉尼科技大學(xué)從事研究工作。入選《麻省理工科技評論》中國區“35歲以下科技創(chuàng )新35人”（MIT TR35 China）、百度全球高潛力華人青年學(xué)者、《澳大利亞人》TOP 40 Rising Star；獲世界互聯(lián)網(wǎng)大會(huì )領(lǐng)先科技獎（2023）、教育部高等學(xué)校自然科學(xué)獎一等獎（2022）、中國圖象圖形學(xué)學(xué)會(huì )科技技術(shù)獎一等獎（2019）、澳大利亞研究委員會(huì )青年研究獎（2019）、IBM C3SR最佳研究獎（2019）、計算機視覺(jué)世界杯ImageNet目標檢測冠軍（2014）及多項CVPR競賽冠軍；發(fā)表CCF A類(lèi)期刊/會(huì )議論文100多篇，Google引用超20000次。目前主要研究方向包括面向非完美數據的視覺(jué)感知、多模態(tài)數據分析、生成式人工智能等。

內容摘要：

近年來(lái)，多模態(tài)大模型作為人工智能領(lǐng)域的重要研究方向，已經(jīng)取得了顯著(zhù)的成果。在本次報告中，魏云超教授將分享其課題組利用多模態(tài)大模型在開(kāi)放視覺(jué)內容感知研究方面的相關(guān)工作。這些工作著(zhù)重解決了以下問(wèn)題：1）如何利用多模態(tài)大模型將模型的語(yǔ)義分割能力從有限類(lèi)別擴展到無(wú)限類(lèi)別？2）如何將自然語(yǔ)言的復雜推理能力同語(yǔ)義分割任務(wù)結合，賦予模型在視覺(jué)感知任務(wù)上推理能力？相關(guān)工作均發(fā)表在近期國際頂級會(huì )議上。

歡迎廣大師生參加！

信息科學(xué)與工程學(xué)院（軟件學(xué)院）

2024年5月6日

日本一区二区三区久久精品,欧美一区二区三区婷婷月色,.xyz国产精品,中文字幕精品视频在线

學(xué)術(shù)活動(dòng)

基于多模態(tài)大模型的開(kāi)放視覺(jué)內容感知

最近更新

抗氧化納米酶催化醫學(xué)

鐵硫生物學(xué)與功能拓展

五峰講堂（第1期）：關(guān)于“第二個(gè)結合”...

“紅色旋律”讀書(shū)會(huì )（第84期）：讀《鄧...

“創(chuàng )新融合：藝術(shù)、設計與科技的未來(lái)”...