智汇工业-智慧工业、智能制造及工业智能、工业互联门户网站,专业的工业“互联网+”传媒

Facebook開(kāi)源游戲平臺(tái)ELF,簡(jiǎn)化版《星際爭(zhēng)霸》完美測(cè)試人工智能

來(lái)源:網(wǎng)絡(luò)

點(diǎn)擊:1659

A+ A-

所屬頻道:新聞中心

關(guān)鍵詞: 游戲平臺(tái),人工智能

    游戲是人工智能研究的完美實(shí)驗(yàn)環(huán)境。在游戲環(huán)境中,可用于訓(xùn)練人工智能模型的數(shù)據(jù)是近乎無(wú)限、低成本、可復(fù)制,相比現(xiàn)實(shí)世界的經(jīng)驗(yàn)更容易獲得。這些特點(diǎn)正幫助 Facebook 人工智能實(shí)驗(yàn)室(FAIR)探索一些短期目標(biāo),如復(fù)雜游戲環(huán)境中多個(gè)人工智能的能力;以及長(zhǎng)期目標(biāo):讓人工智能應(yīng)對(duì)現(xiàn)實(shí)世界的挑戰(zhàn)。游戲研究可以幫助我們構(gòu)建能夠進(jìn)行計(jì)劃、具有理性、自我導(dǎo)航、解決問(wèn)題、合作與交流的人工智能。

    盡管使用游戲進(jìn)行訓(xùn)練能夠帶來(lái)多種好處,但研究者們?cè)谟螒颦h(huán)境中進(jìn)行探索可能會(huì)遇到很多困難。由于目前機(jī)器學(xué)習(xí)算法的諸多限制,訓(xùn)練需要成百上千的游戲局?jǐn)?shù),這需要大量的計(jì)算資源,如配備大量 CPU、GPU 或定制硬件的高性能計(jì)算平臺(tái)。此外,這些算法是復(fù)雜而難以進(jìn)行微調(diào)的。而隨著訓(xùn)練環(huán)境中增加更多的人工智能代理,這些變量將更加難以控制。

    為了解決這些問(wèn)題,讓所有人都能參與人工智能的研究。FAIR 團(tuán)隊(duì)創(chuàng)造了 ELF:一個(gè)大范圍、輕量級(jí)且易于使用的游戲研究平臺(tái)。ELF 可以讓研究者們?cè)诓煌挠螒颦h(huán)境中測(cè)試他們的算法,其中包括桌游、Atari 游戲(通過(guò) Arcade Learning Environment),以及定制的即時(shí)戰(zhàn)略游戲(RTS)。它們可以運(yùn)行在帶有 GPU 的筆記本電腦上,而且支持在更為復(fù)雜的游戲環(huán)境中訓(xùn)練 AI,例如即時(shí)戰(zhàn)略游戲——僅僅使用 6 塊 CPU,一塊 GPU,花上一天時(shí)間。

    FAIR 的研究者們將 ELF 的界面設(shè)計(jì)得易于使用:ELF 在 C/C++界面中運(yùn)行所有游戲,自動(dòng)處理并發(fā)問(wèn)題如多線程/多任務(wù)。另外,ELF 還有一個(gè)純凈的 Python 用戶界面,提供了一批可供訓(xùn)練的游戲狀態(tài)。ELF 也支持游戲以外的用途,它包括物理引擎等組件,可以模擬現(xiàn)實(shí)世界的環(huán)境。

    目前,ELF 平臺(tái)已經(jīng)開(kāi)源,開(kāi)發(fā)者和研究者們可以在 GitHub 中找到它: 

    https://github.com/facebookresearch/ELF

    相關(guān)論文也已發(fā)表在 arXiv 中:https://arxiv.org/abs/1707.01067

    架構(gòu)

    blob.png

    ELF 的架構(gòu)相對(duì)簡(jiǎn)單,它包含一個(gè)能夠主持多個(gè)在 C++端運(yùn)行并發(fā)游戲示例的模擬器,同時(shí)在 Python 端與 AI 模型(深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等)溝通。

    與其他在一個(gè)界面包含單個(gè)游戲的 AI 平臺(tái)不同,ELF 能把一批游戲包括進(jìn)一個(gè) Python 界面。這使得模型和強(qiáng)化學(xué)習(xí)算法能夠在每次迭代中包含一批游戲狀態(tài),降低了訓(xùn)練模型所需的時(shí)間。

    我們也在游戲推斷和參與者模型(actor model) 之間建立配對(duì)靈活性。使用該框架,非常容易用一個(gè)參與者模型配對(duì)特定的游戲示例,或者一個(gè)示例配對(duì)許多參與者模型,或者許多示例配對(duì)一個(gè)參與者模型。這樣的靈活性能夠快速的構(gòu)建算法原型,幫助研究員更快地理解哪個(gè)模型有更好的表現(xiàn)。

    在 FAIR 早期的實(shí)驗(yàn)中,ELF 能進(jìn)行更快的模擬,使用同樣數(shù)量的 CPU 和 GPU 相比于 OpenAI Gym 玩 Atari 游戲可以提高 30% 的訓(xùn)練速度。當(dāng)增加更多的核心之后,ELF 每核的幀率保持穩(wěn)定。

    1499657686992015114.png


    Mini-RTS:實(shí)時(shí)策略游戲進(jìn)行研究

    ELF 平臺(tái)包括一個(gè)名為 Mini-RTS 的實(shí)時(shí)策略引擎與環(huán)境。我們寫(xiě) Mini-RTS 是為了幫助測(cè)試 ELF,它非常的快,在 Macbook Pro 上每核每秒運(yùn)行 4 萬(wàn)幀。它能捕捉實(shí)時(shí)策略游戲的關(guān)鍵動(dòng)態(tài):兩個(gè)玩家同時(shí)收集資源、建立設(shè)施、探索未知領(lǐng)地,并嘗試控制地圖上的領(lǐng)地。此外,該引擎能夠加速人工智能研究:完美的保存、加載、回放,完全可接入其游戲內(nèi)部狀態(tài),多個(gè)內(nèi)建式角色 AI,調(diào)試可視化、人類-AI 界面,等等。作為基準(zhǔn),我們?cè)?Mini-RTS 上訓(xùn)練的人工智能展現(xiàn)出了驚人的結(jié)果,它可以在 70% 的對(duì)局中擊敗內(nèi)建式 AI。這些結(jié)果顯示,訓(xùn)練人工智能完成任務(wù),并在相對(duì)復(fù)雜的策略環(huán)境中優(yōu)先排序行為是可能的。

    有了 ELF 平臺(tái),我們期待它能幫助計(jì)算機(jī)處理指數(shù)級(jí)行為空間、長(zhǎng)期延時(shí)獎(jiǎng)勵(lì)和不完美信息。

    1499657587869085855.png

    論文:ELF: An Extensive, Lightweight and Flexible Research Platform for Real-time Strategy Games

    1499657623234019507.png

    摘要:在本論文中,我們提出了 ELF,一個(gè)大范圍、輕量級(jí)且易于使用的強(qiáng)化學(xué)習(xí)研究平臺(tái)。在 ELF 中,我們可以通過(guò)高度定制化的即時(shí)戰(zhàn)略游戲(RTS)引擎,實(shí)現(xiàn)三種游戲環(huán)境(Mini-RTS、奪旗游戲和塔防游戲)。Mini-RTS 是簡(jiǎn)化版的《星際爭(zhēng)霸》,捕捉游戲動(dòng)態(tài),并可以在 MacBook Pro 筆記本上以每核心 40K 幀率(FPS)的速度運(yùn)行。結(jié)合現(xiàn)代強(qiáng)化學(xué)習(xí)的方法,該系統(tǒng)可以在一天內(nèi)使用 6 塊 CPU 和 1 塊 GPU 對(duì)內(nèi)置 AI 進(jìn)行端到端的訓(xùn)練。

    此外,我們的平臺(tái)在環(huán)境代理通信拓?fù)洹?qiáng)化學(xué)習(xí)方法選擇、游戲參數(shù)調(diào)整等方面上是靈活的,而且可以承載現(xiàn)有的 C/C++游戲環(huán)境如 Arcade Learning Environment。通過(guò) ELF,我們徹底探索了訓(xùn)練環(huán)境,并展示了 Leaky ReLU 和 Batch Normalization 與長(zhǎng)期訓(xùn)練和漸進(jìn)式課程體系的結(jié)合超過(guò)了基于規(guī)則的內(nèi)建 AI,在超過(guò) 70% 的 Mini-RTS 游戲中獲得了勝利。它在其他兩種游戲中也能達(dá)到相似的水平。在游戲的 Replay 中,我們可以看到人工智能代理展示了有趣的策略。ELF 和它的強(qiáng)化學(xué)習(xí)平臺(tái)將會(huì)開(kāi)源。

    (審核編輯: 林靜)

    聲明:除特別說(shuō)明之外,新聞內(nèi)容及圖片均來(lái)自網(wǎng)絡(luò)及各大主流媒體。版權(quán)歸原作者所有。如認(rèn)為內(nèi)容侵權(quán),請(qǐng)聯(lián)系我們刪除。

    主站蜘蛛池模板: 武汉防雷检测_防雷工程设计施工_防雷设备材料_湖北普天科技有限公司 | 噪声治理,消声器,隔声屏障,隔声罩,噪声控制,降噪,空调降噪,水泵噪声治理,冷却塔噪声治理-北京华清恒业环保设备有限公司 | 智能电磁流量计-超声波流量计-涡街流量计-液体涡轮流量计-大连计测机器有限公司 | 优质课网_收录全国及各省市最新优质课视频,说课视频,名师课例课堂实录,高效课堂教学视频,观摩展示公开示范优秀课视频,教学大赛视频! | 济南时代,济南时代试验机,试金老品牌-济南时代试验机技术有限公司 | 上海珑析仪表有限公司 | 宿州电机维修厂家,大型电机维修及二手电机修理到安徽鑫瑞特电机装备有限公司 | 自动隔油提升设备,消防稳压一体设备,苏州不锈钢消防水箱,污水提升设备厂家,无负压变频供水设备厂家-苏州脉泉供水设备有限公司 | 昆明子弟食品有限公司| 在线式风速仪_直读式流速仪-北京亚欧德鹏科技有限公司 | 上海前 傲信息技术有限公司-企业信息化建设及品牌推广服务商 | 晶圆盒垫纸|铝线棒精益管|防静电接地系统工程-上海德拉电子科技有限公司 | 厦门,泉州自助餐上门|生日自助餐|婚礼自助餐|公司聚会自助餐|户外烧烤|冷餐|茶歇外卖配送-福建非选餐饮公司 | 圆柱模板_圆柱木模板_方柱加固件_建材板材网 | 医疗器械招标网—打造医械厂家专业服务平台 | 石笼网|镀锌石笼网|石笼网价格|包胶涂塑石笼网箱-河北海峰石笼网厂 | 长焦监控摄像机-热成像夜视仪-激光云台-深圳红阳信息科技有限公司 | 黑料网 - 黑料大事记-黑料门 黑料社最新 今日黑料 热门黑料 最新反差免费-黑料网今日黑料首页_黑料网 - 黑料大事记-黑料门 黑料社最新 今日黑料 热门黑料 最新反差免费-黑料网今日黑料首页 | 中国焊接协会网站—中国焊接信息网;焊接行业最权威访问量最大的专业网站:焊接信息、焊接材料,焊接机器,焊接设备,焊机,焊材,辅助设备,焊机配件,仪器仪表,电动工具,钎焊,送丝机,表面处理,自动化专机,焊锡丝,助焊剂 | 江苏广分检测技术有限公司、电力安全工具检测、苏州绝缘工具检测、昆山电力安全工具检测-广分检测技术(苏州)有限公司 | 郑州润滑油展-第16届中国润滑油、脂及汽车养护展览会-2025年5月27-28日-郑州国际会展中心 | 专业提供医疗器械,医疗设备,进口国产医疗设备,医疗耗材采购,医疗设备厂家等医疗器械信息-上海聚慕医疗器械有限公司 | 桁架楼承板_钢筋桁架楼承板厂家-山东新材料科技 | 无线|远传|刷卡|光电直读水表_插卡电表[计量准确] | 郑州环球重工机械有限公司建筑垃圾处理专题网站 | 希希助培是专业的教育信息化全场景服务商,为教育培训机构提供教务管理、招生营销、财务管理、家校互动等 | 热水工程|空气能热水工程|超低温采暖工程|太阳能热水工程|空气源热泵厂家|炬邦热能设备有限公司 热熔钻孔机【优质厂家】_多年热熔钻设备研发制造经验 | 昆山开曼流体系统科技有限公司 | 济南晨阳科技有限公司-锅巴生产设备-夹心米果设备-膨化食品机械 集装箱零配件_不锈钢丝绳厂家_镀锌铁链条_合页非标件定制_上海英鑫多实业有限公司 | 西宁佳越信息科技发展有限公司-| 潍坊沃林机械设备有限公司-牵引式风送果园打药机,悬挂式风送果园喷雾机,自走式果树喷药机,车载式风送远程喷雾机-潍坊沃林机械设备有限公司-牵引式风送果园打药机,悬挂式风送果园喷雾机,自走式果树喷药机,车载式风送远程喷雾机 潍坊网络推广,临沂360推广,东营360推广,枣庄360推广,潍坊网站建设,潍坊网络公司,潍坊360搜索,潍坊APP开发,潍坊360推广,潍坊360代理,潍坊点睛网络科技有限公司 | 临沂人才网_临沂招聘网_【官方网站】| 三轴伺服机械手_五轴伺服机械手_注塑机械手_东莞市浩能自动化机械有限公司 | 消泡剂厂家-水处理消泡剂-有机硅消泡剂-广东广州多美多消泡剂厂家 | 山东国新起重机械有限公司,国新起重,起重设备,起重机械,山东起重机厂家,行车,龙门吊 | 无锡大型数控龙门铣,喷涂加工,回火抛丸加工,精密不锈钢焊接机床身机床底座制造加工-无锡美高帝机械有限公司 | 冷藏车厂家-小型冷藏车价格_4.2米冷藏车价格-程力冷藏车厂家 | 墙板_户外墙板_ASA共挤户外墙板-康亿家生态木业集团 | 首页|广东蒙泰高新纤维股份有限公司|丙纶细旦丝|丙纶异形丝|丙纶FDY网络丝 - 广东蒙泰高新纤维股份有限公司 | 丝杆升降机-蜗轮丝杆升降机-电动推杆-德州市金宇机械有限公司 | 西安宣传片拍摄,陕西艺景网络科技有限公司资料备份,西安影视公司,视频拍摄制作,抖音视频制作,纪录片拍摄西安短视频摄影团队,西安抖音视频拍摄 |