2024年1月2日,我校工程系邀請(qǐng)澳大利亞阿德萊德大學(xué)吳琦副教授和浙江大學(xué)計(jì)算機(jī)學(xué)院博士后景宸琛博士分別做了題為“Human-Computer Conversational Vision-and-Language Navigation”和“開(kāi)放世界下的視覺(jué)理解”學(xué)術(shù)報(bào)告,是深北莫大學(xué)電子與計(jì)算機(jī)科學(xué)前沿系列講座的首場(chǎng)報(bào)告,線(xiàn)下和線(xiàn)上60多位師生聆聽(tīng)了學(xué)術(shù)報(bào)告,武玉偉長(zhǎng)聘副教授主持了這場(chǎng)報(bào)告會(huì)。
吳琦博士任職澳大利亞阿德萊德計(jì)算機(jī)系副教授、澳大利亞機(jī)器學(xué)習(xí)研究中心視覺(jué)和語(yǔ)言實(shí)驗(yàn)室主任,他是Image captioning、VQA以及Vision-language navigation研究方面的國(guó)際知名專(zhuān)家,在TPAMI、CVPR、ICCV、ECCV等著名會(huì)議和期刊發(fā)表論文100余篇,他還擔(dān)任過(guò) CVPR、ICCV 和NeurIPS的領(lǐng)域主席。吳琦教授首先給師生帶來(lái)人機(jī)對(duì)話(huà)式視覺(jué)語(yǔ)言導(dǎo)航這一國(guó)際學(xué)界的熱點(diǎn)和前沿話(huà)題,介紹了他的團(tuán)隊(duì)近期在該領(lǐng)域的最新研究成果,給出了該領(lǐng)域的關(guān)鍵核心和挑戰(zhàn)以及未來(lái)發(fā)展趨勢(shì),特別是他們搭建的實(shí)驗(yàn)平臺(tái)和視覺(jué)語(yǔ)言回話(huà)式無(wú)人機(jī)平臺(tái),引起了與會(huì)師生的濃厚興趣。



景宸琛博士從當(dāng)前國(guó)內(nèi)外學(xué)界就人工智能領(lǐng)域的通用基礎(chǔ)模型這一前沿?zé)狳c(diǎn)問(wèn)題開(kāi)始,介紹了通用基礎(chǔ)模型的百花齊放,以及為實(shí)現(xiàn)開(kāi)放世界下的視覺(jué)理解帶來(lái)的新機(jī)遇與挑戰(zhàn)。視覺(jué)基礎(chǔ)模型的強(qiáng)大的表征能力為實(shí)現(xiàn)通用感知奠定了基礎(chǔ),多模態(tài)基礎(chǔ)模型則使得開(kāi)集理解成為了可能。報(bào)告中,景博士也展示了他在該領(lǐng)域的許多工作進(jìn)展,分享了他對(duì)開(kāi)放世界下視覺(jué)理解的一些深刻的思考,得到了與會(huì)師生的廣泛共鳴和討論,受益匪淺。景宸琛博士分別于1997年和2022 年獲得北京理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)士學(xué)位和博士學(xué)位,獲北京理工大學(xué)優(yōu)秀博士學(xué)位論文獎(jiǎng)。目前在浙江大學(xué) CAD & CG 全國(guó)重點(diǎn)實(shí)驗(yàn)室從事博士后研究工作,主要研究方向包括計(jì)算機(jī)視覺(jué)、多模態(tài)理解與推理以及開(kāi)放世界的理解,在IEEE-TMM、PR、CVPR、ICCV、AAAI、MM等人工智能及計(jì)算機(jī)視覺(jué)領(lǐng)域國(guó)內(nèi)外高水平會(huì)議期刊上發(fā)表論文十余篇。
