上周四開始的 IJCAI 大會(huì)還是 2020 版。
北京時(shí)間 1 月 7 日,IJCAI 2020 在線上開幕。目前,大會(huì)已經(jīng)公布了包括 IJCAI-JAIR 最佳論文、AIJ 獎(jiǎng)、杰出論文獎(jiǎng)等多個(gè)獎(jiǎng)項(xiàng)。
IJCAI 2020 原定于 2020 年 7 月在日本橫濱舉行,受到疫情影響,延期至 2021 年 1 月線上召開。
從整體數(shù)據(jù)上看,IJCAI 2020 是史上接收率最低的一屆,4717 份有效投稿僅有 592 篇被接收,接收率為 12.6%。
圖片來(lái)源:https://github.com/lixin4ever/Conference-Acceptance-Rate
與往年大會(huì)相比,今年最大的變化就是線下大會(huì)專為虛擬會(huì)議,而會(huì)議界面的清新風(fēng)格,也是讓參會(huì)者耳目一新,一度以為自己進(jìn)入了某游戲界面。
杰出論文獎(jiǎng)
本次共有兩篇論文獲得 IJCAI 2020 杰出論文獎(jiǎng)。
《Synthesizing Aspect-Driven Recommendation Explanations from Reviews》
論文地址:https://www.ijcai.org/Proceedings/2020/0336.pdf
論文摘要:解釋有助于理解建議并增加采納的可能性,然而有些解釋性建議方法依賴于嚴(yán)格、標(biāo)準(zhǔn)化的模板。為了獲取更加靈活、通俗、多樣化的解釋,覆蓋 interest 各個(gè)方面,來(lái)自新加坡管理大學(xué)的研究者從評(píng)論中選擇片段來(lái)進(jìn)行綜合解釋,同時(shí)優(yōu)化了其代表性和連貫性。為了適應(yīng)目標(biāo)用戶的偏好,研究者基于一個(gè)兼容的可解釋推薦模型,將觀點(diǎn)與上下文相銜接。幾個(gè)產(chǎn)品類別數(shù)據(jù)集上的實(shí)驗(yàn)表明,在模板、評(píng)論摘要、選擇和文本生成這些方面,本文方法具備更高的效率。
本文提出框架 SEER 的架構(gòu)。
《A Multi-Objective Approach to Mitigate Negative Side Effects》
論文地址:https://www.ijcai.org/Proceedings/2020/0050.pdf
論文摘要:非結(jié)構(gòu)化環(huán)境內(nèi)運(yùn)行的智能體通常會(huì)產(chǎn)生設(shè)計(jì)時(shí)不容易識(shí)別的負(fù)面作用 (NSE) 。來(lái)自 UMass Amherst 和微軟研究院的研究者分析了在系統(tǒng)部署過(guò)程中,如何利用各種形式的人類反饋或自主探索,來(lái)學(xué)習(xí)與 NSE 相關(guān)的懲罰函數(shù)。他們將降低 NSE 影響的問(wèn)題描述為一個(gè)具備字典式獎(jiǎng)勵(lì)偏好與松弛多目標(biāo)馬爾科夫決策過(guò)程。松弛指的是相對(duì)于智能體的主要目標(biāo)允許的最優(yōu)策略的最大偏差,以減少次要目標(biāo) NSE。
多項(xiàng)實(shí)驗(yàn)評(píng)估表明,本文所提出的框架能夠成功減少 NSE 的影響,不同的反饋機(jī)制會(huì)帶來(lái)不同的偏差,從而影響 NSE 的識(shí)別。
論文提出的消除 NSE 的框架
IJCAI-JAIR 最佳論文獎(jiǎng)
IJCAI-JAIR 最佳論文這一獎(jiǎng)項(xiàng)頒發(fā)給過(guò)去五年里發(fā)表在《人工智能研究雜志(JAIR)》上的優(yōu)秀論文。
2020 IJCAI-JAIR 最佳論文
論文地址:https://www.jair.org/index.php/jair/article/view/11175
論文摘要:該研究的主題是在高維連續(xù)環(huán)境中構(gòu)造抽象表征以進(jìn)行規(guī)劃。研究者假設(shè)一個(gè)具有高級(jí)操作集合的智能體,并構(gòu)造可證明的表征以評(píng)估由操作序列組成的規(guī)劃。
研究者首先考慮確定性規(guī)劃的情況,并表明相關(guān)計(jì)算涉及對(duì)狀態(tài)集執(zhí)行的集合操作。該研究定義了對(duì)于規(guī)劃來(lái)說(shuō)必需和足夠的特定集合,并利用它們構(gòu)建可證明適用于確定性規(guī)劃的基礎(chǔ)(grounded)抽象符號(hào)表征。結(jié)果表征可用 PPDL 表示。該研究為 Playroom 域構(gòu)建了一個(gè)表征,并使用現(xiàn)成的規(guī)劃程序以毫秒為單位對(duì)其進(jìn)行求解。
然后,該研究擴(kuò)展至概率規(guī)劃,其中需要將狀態(tài)集泛化至狀態(tài)分布。該研究確定了規(guī)劃所需的特定分布,并使用它們構(gòu)建一種基礎(chǔ)的抽象符號(hào)表征,以正確地預(yù)估任何規(guī)劃的預(yù)估回報(bào)和成功概率。此外,該研究表明學(xué)習(xí)相關(guān)概率分布和概率密度估計(jì)與概率分類的特定實(shí)例相對(duì)應(yīng)。該研究構(gòu)建了一個(gè)能夠自主學(xué)習(xí)計(jì)算機(jī)游戲域的正確抽象表征并迅速解決它的智能體。
最后,研究者利用這些技術(shù)創(chuàng)建了一個(gè)物理機(jī)器人系統(tǒng),該系統(tǒng)可以直接從感覺(jué)運(yùn)動(dòng)數(shù)據(jù)(包括點(diǎn)云、位置映射和關(guān)節(jié)角度等)自主學(xué)習(xí)其移動(dòng)操作任務(wù)符號(hào)表征,然后使用該表征進(jìn)行規(guī)劃,這些結(jié)果共同建立了高層行為與抽象表征、構(gòu)建可證明的抽象表征的具體理論基礎(chǔ)以及自主學(xué)習(xí)抽象高層表征的實(shí)際機(jī)制之間的原理性聯(lián)系。
最佳論文榮譽(yù)提名
IJCAI 2020 最佳論文榮譽(yù)提名獎(jiǎng)由 2015 年發(fā)表在 JAIR 上的論文《Coactive Learning》摘得,兩位作者分別來(lái)自領(lǐng)英和康奈爾大學(xué)。
論文鏈接:https://jair.org/index.php/jair/article/view/10939/26066
論文摘要:在本文中,兩位研究者提出將強(qiáng)制學(xué)習(xí)(Coactive Learning)作為學(xué)習(xí)系統(tǒng)與人類用戶之間交互的模型,這兩者具有向用戶提供最大效用結(jié)果的共同目標(biāo)。強(qiáng)制學(xué)習(xí)模型中的交互采取以下形式:在每一步驟中,系統(tǒng)(如搜索引擎)接收文本(如查詢)并預(yù)測(cè)對(duì)象(如排名);如有必要,用戶做出響應(yīng)糾正系統(tǒng),以反饋稍有改善(并不一定是最優(yōu))的對(duì)象。
他們認(rèn)為,與專家模型中需要的最優(yōu)反饋或者強(qiáng)盜學(xué)習(xí)(bandit learning)中需要的基數(shù)評(píng)估不同,這種偏好反饋可以通過(guò)可觀察的用戶行為(如網(wǎng)頁(yè)搜索中的點(diǎn)擊)來(lái)實(shí)現(xiàn)大量地推理。盡管對(duì)反饋的要求比較寬松,該研究表明現(xiàn)有很多在線學(xué)習(xí)算法都有可能適應(yīng)這種強(qiáng)制學(xué)習(xí)框架。特別地,研究者提供的算法在基數(shù)效用方面實(shí)現(xiàn)了 O(1/ √ T) 的平均后悔,盡管學(xué)習(xí)算法從未直接觀察基數(shù)效用值。此外還提供了一種λ- 強(qiáng)凸損失函數(shù)情況下平均后悔為 O(log(T)/T) 的算法。大量的實(shí)證研究驗(yàn)證了該研究中模型和算法在電影推薦任務(wù)和網(wǎng)頁(yè)搜索排名中的適用性。
該研究強(qiáng)制學(xué)習(xí)算法的通用模板。
AIJ 獎(jiǎng) Artificial Intelligence Journal Awards
AIJ 突出論文獎(jiǎng)(AIJ Prominent Paper Award)表彰不早于 7 年內(nèi)發(fā)表在 AI 期刊上,并且具有很高的重要性以及影響力的論文研究。
2020 AIJ 突出論文獎(jiǎng)
《Conflict-Based Search for Optimal Multi-Agent Pathfinding》
論文地址:https://www.sciencedirect.com/science/article/pii/S0004370214001386
論文摘要:在多智能體路徑規(guī)劃(MAPF)中,給定一組智能體,每個(gè)智能體都有各自的起始位置和目標(biāo)位置。該任務(wù)要為所有的智能體找到路徑,同時(shí)避免沖突。在之前的研究中,研究人員為此問(wèn)題而進(jìn)行的大多數(shù)工作都以最佳方式將多個(gè)單獨(dú)的智能體視為單聯(lián)合智能體,然后使用 A *算法的單智能體搜索變體。
本文提出了基于沖突的搜索(CBS),一種新的最優(yōu)多智能體路徑規(guī)劃算法。CBS 是一種兩級(jí)(two-level)算法,該算法不會(huì)將問(wèn)題轉(zhuǎn)換為單個(gè)聯(lián)合智能體模型。該方法在高層級(jí)上對(duì)沖突樹(CT)進(jìn)行搜索,沖突樹是基于單獨(dú)的智能體之間的沖突建立的。CT 中的每個(gè)節(jié)點(diǎn)代表了一組對(duì)智能體動(dòng)作的約束。在低層級(jí)上,執(zhí)行快速單智能體搜索以滿足高層級(jí) CT 節(jié)點(diǎn)施加的約束。在很多情況下,這種兩層級(jí)形式使得 CBS 需要檢查的狀態(tài)少于 A * 算法,但結(jié)果仍然保持最佳。該研究對(duì) CBS 進(jìn)行了分析,并描述了其優(yōu)點(diǎn)和缺點(diǎn)。
此外,該研究還提出了元智能體 CBS(Meta-Agent CBS,MA-CBS)算法。MA-CBS 是 CBS 的一種泛化形式。不同于基礎(chǔ) CBS,MA-CBS 不受限于低級(jí)別的單智能體搜索。相反,MA-CBS 允許將智能體合并為聯(lián)合智能體的小組。這緩解了基礎(chǔ) CBS 一些缺點(diǎn),并進(jìn)一步提高了性能。
MA-CBS 是一個(gè)可以建立在任何最佳和完整的 MAPF 解算器之上的框架,并且可以提升其性能。在多種問(wèn)題上的實(shí)驗(yàn)結(jié)果表明,與以前的方法相比,該方法的速度提高了一個(gè)數(shù)量級(jí)。
AIJ 經(jīng)典論文獎(jiǎng)(AIJ Classic Paper Award)會(huì)頒發(fā)至少 15 年前在 AI 期刊上發(fā)表的優(yōu)秀論文,其影響力要顯著且卓越。
2020 AIJ 經(jīng)典論文獎(jiǎng)
Temporal Constraint Networks
論文地址:https://www.sciencedirect.com/science/article/abs/pii/0004370291900066
論文摘要:該論文將基于網(wǎng)絡(luò)的約束滿足方法擴(kuò)展為包含連續(xù)變量,從而提供了一個(gè)處理時(shí)間約束的框架。在這個(gè)被稱為時(shí)間約束滿足問(wèn)題(TCSP)的框架中,變量代表時(shí)間點(diǎn),時(shí)間信息由一組一元和二元約束表示,每個(gè)約束都指定了一組允許的間隔。
該框架的獨(dú)特之處在于允許處理度量標(biāo)準(zhǔn)信息,即評(píng)估事件之間的時(shí)間差。該研究提出了用于執(zhí)行以下推理任務(wù)的算法:找到給定事件可能發(fā)生的所有可行時(shí)間,找到兩個(gè)給定事件之間的所有可能關(guān)系,并生成一個(gè)或多個(gè)與所提供信息一致的場(chǎng)景。
該研究還區(qū)分了簡(jiǎn)單時(shí)間問(wèn)題(STPs)和一般時(shí)間問(wèn)題,前者對(duì)任何一對(duì)時(shí)間點(diǎn)最多允許一個(gè)間隔約束。研究證明,包含 Vilain 和 Kautz 點(diǎn)代數(shù)的主要部分的 STP 可以在多項(xiàng)式時(shí)間內(nèi)求解。
對(duì)于一般的 TCSPs,論文提出了一種分解方案,該方案執(zhí)行所考慮的三個(gè)推理任務(wù),并引入各種技術(shù)來(lái)提高其效率。此外,論文還研究了路徑一致性算法作為時(shí)間問(wèn)題預(yù)處理的適用性,證明了它們的可終止性(termination )和并限制了它們的復(fù)雜性。
目前,IJCAI 2020 的其他獎(jiǎng)項(xiàng)也已全部公布,包括卓越研究獎(jiǎng)(Research Excellence Award)、計(jì)算機(jī)與思想獎(jiǎng)(Computer and Thought Award)、約翰麥卡錫獎(jiǎng)(John McCarthy Award)以及杰出服務(wù)獎(jiǎng)(Donald E. Walker Distinguished Service Award)。香港科技大學(xué)的楊強(qiáng)教授是本次 IJCAI 獎(jiǎng)項(xiàng)評(píng)選委員會(huì)的成員之一。
卓越研究獎(jiǎng)
卓越研究獎(jiǎng)旨在表彰在整個(gè)職業(yè)生涯中一直進(jìn)行高質(zhì)量研究并取得若干重大成果的科學(xué)家,往屆獲獎(jiǎng)?wù)甙?Marvin Minsky (1991)、Judea Pearl (1999)、 Geoffrey E. Hinton (2005)、 Michael I. Jordan (2016), 和 Jitendra Malik (2018) 等人工智能領(lǐng)域最杰出的科學(xué)家。
2020 年的卓越研究獎(jiǎng)得主為 Eugene Freuder,他是愛爾蘭科克大學(xué)的計(jì)算機(jī)科學(xué)和信息技術(shù)名譽(yù)教授,因其在基于約束的推理和問(wèn)題解決方面的開創(chuàng)性研究而被公認(rèn)。
計(jì)算機(jī)與思想獎(jiǎng)
IJCAI 計(jì)算機(jī)與思想獎(jiǎng)主要頒發(fā)給人工智能領(lǐng)域的杰出青年科學(xué)家。這一獎(jiǎng)項(xiàng)是根據(jù)《計(jì)算機(jī)和思想》這本書(編輯為 Edward Feigenbaum 和 Julian Feldman)的版稅設(shè)立的,目前由 IJCAI 基金資助。
2020 IJCAI 計(jì)算機(jī)與思想獎(jiǎng)的獲得者是 Piotr Skowron,他是華沙大學(xué)數(shù)學(xué)、信息學(xué)、機(jī)械學(xué)院助理教授,因其計(jì)算社會(huì)選擇和委員會(huì)選舉理論方面的貢獻(xiàn)而被公認(rèn)。
約翰麥卡錫獎(jiǎng)
約翰麥卡錫獎(jiǎng)旨在表彰那些拿到博士學(xué)位 15-25 年之間、在人工智能領(lǐng)域做出卓越貢獻(xiàn)的職業(yè)生涯中期研究人員。該獎(jiǎng)項(xiàng)以人工智能先驅(qū) John McCarthy 的名字命名。該獎(jiǎng)項(xiàng)的設(shè)立受到了麥卡錫家族的支持,往年的獲得者有 Bart Selman (2015)、
2020 年約翰麥卡錫獎(jiǎng)的獲得者是 Daniela Rus,她是麻省理工學(xué)院電子工程和計(jì)算機(jī)科學(xué) Andrew and Erna Viterbi 教授和 CSAIL 實(shí)驗(yàn)室主任。Rus 教授因在自動(dòng)化科學(xué)與工程方面的貢獻(xiàn)及多智能體算法的研究而得到公認(rèn)。
杰出服務(wù)獎(jiǎng)
IJCAI 杰出服務(wù)獎(jiǎng)設(shè)立于 1979 年,旨在表彰為 AI 領(lǐng)域做出貢獻(xiàn)并提供服務(wù)的資深科學(xué)家。IJCAI-2020 杰出服務(wù)獎(jiǎng)的獲得者是 Toby Walsh,新南威爾士大學(xué)人工智能科學(xué)教授,他是澳大利亞聯(lián)邦科學(xué)與工業(yè)研究組織 (CSIRO)Data61 算法決策理論組的領(lǐng)導(dǎo)者,因其在人工智能領(lǐng)域廣泛的貢獻(xiàn)和服務(wù)而獲得認(rèn)可。
上周開始的 IJCAI 2020 大會(huì),是在為去年疫情延期的活動(dòng)「補(bǔ)交作業(yè)」,今年還有一場(chǎng) IJCAI根據(jù)計(jì)劃,IJCAI 2021 會(huì)在今年的 8 月在加拿大蒙特利爾舉行。
此前大會(huì)官方正式宣布南京大學(xué)的周志華教授為 IJCAI 2021 程序主席,這也是 IJCAI 歷史上首次由華人擔(dān)任程序主席一職。此外,程序委員會(huì)成員還包括多位華人學(xué)者:
字節(jié)跳動(dòng) AI Lab 負(fù)責(zé)人李航
東南大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院教授、博士生導(dǎo)師張敏靈
南京大學(xué)人工智能學(xué)院教授俞揚(yáng)
北京大學(xué)智能科學(xué)系教授林宙辰
斯坦福大學(xué)計(jì)算機(jī)科學(xué)系助理教授吳佳俊
卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)系助理教授方飛
清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系助理研究員劉知遠(yuǎn)
南京大學(xué)計(jì)算機(jī)系博士生譚志豪
此前,IJCAI 2021 的論文投稿日程已經(jīng)公布,這個(gè)月正好也是投稿 deadline,今年的大會(huì),你投稿了嗎?