英國《自然》雜志近日發表一項人工智能研究成果:美國團隊報告了一類增強學習,可回溯過去、解決復雜任務,真正改善了對復雜環境的探索方式,有望應用于機器人、語言理解和藥物設計領域。這類算法被統稱為“Go-Explore”,其已經在一款經典游戲的算法挑戰中得分超過了人類玩家和先進的人工智能系統。該成果被認為正朝著實現真正“智能學習體”邁出了重要一步。
增強學習,可讓人工智能系統通過探索和理解復雜環境來進行決策,并學習如何以優的方式獲得獎勵。獎勵可以包括機器人抵達特定位置或是在電腦游戲中達到一定的等級。然而,當遇到很少給予反饋的復雜環境時,現階段的加強學習算法就很容易碰壁,這讓人工智能專家們非常苦惱。
國內多數初創公司一般在各自應用領域擁有優勢技術資源,針對某一細分領域單點突破,深度挖掘,通過技術的不斷提升來獲取市場份額。其中,曠視科技以深度學習、計算機視覺為核心技術,不斷擴展其在視覺識別及深度學習領域優勢,現以累積提供超過150億次數據服務,成為目前世界大智能數據提供方之一。在健康醫療領域,人工智能應用已經非常廣泛,從應用場景來看主要分成了虛擬助理、醫學影像、藥物挖掘、營養學、生物技術、急救室/醫院管理、健康管理、精神健康、可穿戴設備、風險管理和病理學共11個領域;大數醫達和康夫子就是專注醫療健康類的虛擬助理研發企業。
在智能投顧領域,邏輯是借助人工智能技術和大數據分析,機器人結合投資者的財務狀況、風險偏好、理財目標等,通過已搭建的數據模型和后臺算法為投資者提供量身定制的資產投資組合建議。國內陸續出現了彌財、藍海財富、積木盒子等第三方智能投顧平臺,以及京東智投、企名片、同花順為代表的互聯網公司研發的智能投顧平臺。
在智能教育領域,如學霸君等,通過拍照搜題進行在線答疑自動批改作業等,借助智能圖像識別技術,學生遇到難題時只需要用手機拍照上傳到云端,系統在一到兩秒內就可以反饋出答案和解題思路;另外,科大訊飛、清睿教育開發出的語音測評軟件,能夠很快對發音進行測評并指出發音不準的地方。
在智能法務領域,直接的應用如智能法務助手,“合同家”通過合同工具積累數據,為企業提供基于大數據和人工智能的法務解決方案。
在智能駕駛領域,當屬目前火熱的應用領域,如馭勢科技、Momenta、圖森互聯等通過人工智能技術解放人力、降低交通事故率等,相信未來智能駕駛會讓我們的出行變得更加安全、智能化。
美國“OpenAI”是由諸多硅谷巨頭聯合建立的人工智能非營利組織,推動者包括美國創業孵化器Y Combinator總裁薩姆·阿爾特曼、美國太空技術探索公司(SpaceX)創始人埃隆·馬斯克等,其目標是希望能夠預防人工智能的災難性影響,并推動人工智能發揮積極作用。此次,“OpenAI”的科學家艾德蘭·艾克菲特、朱斯特·赫伊津哈及團隊,提出了有效探索面臨的兩個主要障礙,并設計了一類算法來解決這些障礙。
研究人員表示,“Go-Explore”可以對環境進行全面探索,同時構建一個檔案庫來記住它去過的地方,確保自己不會忘記通往有望成功的期中階段或是終勝利(獎勵)的路線。其在雅達利經典游戲中的得分,超過了人類玩家和先進的人工智能系統,研究人員用這類算法,解決了之前未能解決的2600個雅達利游戲,驗證了這類算法的潛力。“Go-Explore”在算法挑戰《蒙特祖馬的復仇》中的得分是之前的4倍,在另一個算法挑戰《瑪雅人的冒險》中的得分也超過了人類玩家的平均水平。而相對的,此前的算法一分都拿不到。
“Go-Explore”算法還能完成一個模擬機器人任務,在這項任務中,它必須用機械臂把東西撿起來并放到4個架子中的一個架子上,其中兩個架子被關在兩扇門的后面。
研究人員指出,記住并回到有望成功的探索區域的簡單原則是一種強大、通用的探索方法。他們認為新的算法有望應用于機器人、語言理解和藥物設計。
(原標題:AI向“智能學習體”邁進 應用前景更為廣闊)
版權與免責聲明:
凡本站注明“來源:智能制造網”的所有作品,均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品,未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網”。違反上述聲明者,本站將追究其相關法律責任。
本站轉載并注明自其它來源(非智能制造網)的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網”,本站將依法追究責任。
鑒于本站稿件來源廣泛、數量較多,如涉及作品內容、版權等問題,請與本站聯系并提供相關證明材料:聯系電話:0571-89719789;郵箱:[email protected]。