展會信息港展會大全

如果讓人類和AI擼一局LOL,有勝率嗎?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2020-10-28 20:43:03   瀏覽:6674次  

導(dǎo)讀:進入主題,今天我們將討論主題:如果使用人工智能玩LOL,它可以輕松贏得世界冠軍嗎? 一、人工智能技術(shù)和游戲的歷史 讓我們把時間追溯到1950年,當時人工智能的重要概念 Turing Test首次出現(xiàn)。如果仔細考慮一下,您會發(fā)現(xiàn)圖靈測試的項目本質(zhì)上是一種模仿對抗...

進入主題,今天我們將討論主題:如果使用人工智能玩LOL,它可以輕松贏得世界冠軍嗎?

一、人工智能技術(shù)和游戲的歷史

讓我們把時間追溯到1950年,當時人工智能的重要概念“ Turing Test”首次出現(xiàn)。如果仔細考慮一下,您會發(fā)現(xiàn)圖靈測試的項目本質(zhì)上是一種模仿對抗游戲。人工智能開始模仿人類說話,人類如何區(qū)分人工智能和人類本身,兩者開始相互競爭。

pic01 圖靈測試

2013年,Google宣布使用Deepmind深度學(xué)習技術(shù)來打破Atari游戲,人們開始關(guān)注深度學(xué)習技術(shù)。什么是雅達利?這個名字聽起來很奇怪,但是您必須熟悉它:

pic02 Atari

是的,Google在深度學(xué)習的早期就使用游戲來訓(xùn)練AI。據(jù)了解,在Alphago出現(xiàn)之前,谷歌一直使用Atari游戲來訓(xùn)練AI。

然后在2016年,Alpha Dog席卷了全球象棋選手。實際上,它也在名為Go的游戲中運行,并且地圖為19x19網(wǎng)格。

2019年,在暴雪嘉年華的現(xiàn)場星際爭霸游戲中,AlphaStar擊敗了職業(yè)玩家Serral并取得了很大的成績。

pic03 星際爭霸

此時,您將發(fā)現(xiàn)AI技術(shù)開發(fā)的整個歷史都嵌套在游戲開發(fā)的歷史中。

由于Go,Chess和RTS游戲可以幫助研究AI技術(shù),因此根據(jù)這種邏輯,LOL和“吃雞”又是什么游戲呢? (斗地主不是問題)

第二,人工智能能否在LOL中贏得冠軍?

讓我從結(jié)論開始:我暫時不能,但可以預(yù)見未來。

在分析此問題之前,讓我們澄清一下LOL本質(zhì)上是什么樣的游戲。 LOL的游戲設(shè)計師似乎想模擬一場局部戰(zhàn)爭。由于這是一次模擬戰(zhàn)爭,因此必須分為戰(zhàn)略層面和戰(zhàn)術(shù)層面。

pic04 戰(zhàn)略與戰(zhàn)術(shù)

首先,就戰(zhàn)術(shù)而言,我認為不使用某些機器學(xué)習方法可能會很好。作為像Alphago這樣的superAI,它的響應(yīng)能力幾乎是飛秒,并且位置和運動A僅受網(wǎng)絡(luò)速度的限制,因此基本上只有adc可以殺死他。使用多種技能來近距離平倉基本上是一種幻想。在卡片視覺控制或閃爍強力控制(例如Pan Sen w)的才能中,Lacus的q技能完全沒用。這是代碼比人更好的地方。犯錯的是人,代碼永遠不會出錯。

pic05 著名場景

但是為什么還沒有出色的LOL AI出現(xiàn)呢?因為人工智能缺乏戰(zhàn)略層面的東西。通常,在玩LOL時,我可能會做出以下戰(zhàn)略決策:開發(fā),攻擊,檢測,協(xié)助和撤退。大家都知道,我不會詳細說明這些。 Alphago之所以能夠成功,是因為Go是一款完整的信息游戲,因此有人說Moba在戰(zhàn)爭迷霧中已成為一種不完整的信息游戲。如果計算機看不到我在做什么,它將無法以我為目標。這絕對是不對的。

由于我們提到了不完全的信息博弈,因此貝葉斯告訴我們?nèi)匀豢梢杂幸粋最優(yōu)方案。為了便于理解,您可以考慮遇到中路錯過時的處理方式。我要么有遠見,然后繼續(xù)安心發(fā)展,要么我沒有遠見,然后回到塔樓躲起來。當我們將AI放入LOL時,它需要始終感知當前的游戲情況,做出下一步?jīng)Q定,走或停,進攻或后退,要使用的技能以及放置位置。這些決策通常可以基于當前的知識和計算能力量化為概率。這真的是不可能的,不是因為有蒙特卡洛,如果我不知道的話,我會再嘗試幾次來了解概率。換言之,人工智能可以模仿人類去猜測并作出最有利可圖的決定?梢詫I設(shè)計成比您和我更詭計多端的設(shè)計。

三、那么玩游戲如何改善AI技術(shù)?

“我們最需要強調(diào)的是游戲AI研究的深刻意義,遠遠超過游戲本身。這是一個充滿挑戰(zhàn)和令人興奮的研究主題。研究的積累經(jīng)驗,方法和結(jié)論可以在更廣泛和更廣泛的范圍內(nèi)使用。 -reaching范圍的使用:首先,它是開放虛擬世界與現(xiàn)實世界之間的障礙,以增強物理世界的能力,例如無人駕駛汽車和機器人的發(fā)展;其次,在游戲中研究智能對話或?qū)⒊蔀槿斯ぶ悄艿闹匾緩;第三,研究游戲中的人員,代理商和環(huán)境之間的相互作用可以使諸如智能城市之類的復(fù)雜而深遠的項目受益。”

-騰訊人工智能實驗室機器學(xué)習中心負責人劉涵

人工智能具有三項重要的能力:感知,判斷和對話。

Alpha Gou看起來很聰明,但在現(xiàn)實世界中,Go板只是2D圖像數(shù)據(jù)。它反映了游戲獲勝率中的每一步,從而“感知”了每一步的含義。棋盤上的棋子越來越多,感知環(huán)境也越來越復(fù)雜。

以游戲“ Doom”為例。讓AI玩這個游戲,它感覺是一個2D游戲屏幕,面對屏幕,它需要感知環(huán)境中每個元素的含義以提高獲勝率。只是這個游戲環(huán)境比Alphago面對的19X19電路板要復(fù)雜得多。

pic06 毀滅戰(zhàn)士

這其實更加接近物理世界。

在我們的現(xiàn)實生活中,對無人駕駛車輛物體的識別,相機所感知的僅僅是二維圖片。因此,如果游戲場景中的對象與現(xiàn)實非常相似,則它們可能是通用的。

像《俠盜獵車手》這類游戲,讓AI去控制主角,然后就可以訓(xùn)練他的認知能力并為AI創(chuàng)建世界觀。

pic07 俠盜獵車手

聽起來像是胡說八道嗎?抱歉,無人駕駛汽車的先驅(qū)特斯拉確實使用了專門設(shè)計的虛擬訓(xùn)練場來連續(xù)練習AI,以便它可以在短時間內(nèi)準確識別各種物體和緊急情況。甚至由馬斯克建立的實驗室OpenAI,也真正學(xué)習了去年通過“俠盜獵車手”學(xué)到的一套自動駕駛系統(tǒng)。據(jù)稱,每個人都可以只用一臺計算機和一套正版游戲就可以開發(fā)自動駕駛系統(tǒng)!沒錯,實際上是我們玩過的俠盜獵車手,沒想到。

pic08 GTA

人工智能可以通過游戲?qū)W習知覺,并且人工智能的決策是相同的。

在現(xiàn)實世界中,無人駕駛汽車需要根據(jù)實時感知做出決策,無論是向左轉(zhuǎn)還是向右轉(zhuǎn),加速還是制動。此邏輯在游戲中也有效。面對復(fù)雜的游戲環(huán)境,人工智能需要始終做出決策以確保游戲的勝利。

如果將AI放入LOL,則它需要始終感知當前的游戲情況,對下一步進行決策,前進或停止,進攻或后退,要使用的技能以及放置位置。

除了感知和決策外,對話也是AI技術(shù)應(yīng)用程序的一項重要功能,并且可以通過游戲來改善這些功能。例如,在著名的電影《她》中,愛上男主角的人工智能本身就是對白游戲。

pic9 “她”

在AI游戲使用人機對話,甚至直接將AI放入模擬對話游戲中。它可以幫助學(xué)習和理解人類自然語言的產(chǎn)生原理。

四,附言

簡而言之,研究游戲AI很困難,但并非不可能。對游戲AI的研究不是要制作功能更強大的游戲插件,而是要使用游戲環(huán)境來研究任何環(huán)境的復(fù)雜交互。將來,這些研究結(jié)果可能會應(yīng)用于物理世界的各個方面,這將是基礎(chǔ)和長期的。

實際上,對于AI而言,請仔細考慮一下,我們的物理世界不是為此而玩的游戲嗎?

“自動駕駛游戲”的勝利條件是無意外到達目的地。

“圍棋”中要想勝利,必須確保贏的概率走向。

“人機對話游戲”的勝利條件是使人與AI難以區(qū)分。

尾:對于人類來說,這個“世界”不也是我們大腦正在玩的復(fù)雜游戲嗎?


贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港