機(jī)械社區(qū)

 找回密碼
 注冊會員

QQ登錄

只需一步,快速開始

搜索
查看: 4370|回復(fù): 11
打印 上一主題 下一主題

突發(fā)奇想,如果使用2臺alphaGO主機(jī),使用同樣的算法和策略,互奕一局,結(jié)局如何?

[復(fù)制鏈接]
跳轉(zhuǎn)到指定樓層
1#
發(fā)表于 2016-3-10 18:31:07 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
這個是不是有點自相矛盾的味道?? 但是我對結(jié)果很感興趣
回復(fù)

使用道具 舉報

2#
發(fā)表于 2016-3-10 18:42:38 | 只看該作者
這算是“迭代”嗎,昨天也想到這個了
6 {+ i- v+ f. m7 Z- t以后辦圍棋賽,可以分設(shè)AI組與人類組,

點評

這東西只要勝一次,以后就會無敵的,跟人不同,人是有年紀(jì)的,到一個年紀(jì)會出昏招,而這東西是學(xué)了所有‘?dāng)≌摺钠遄V,做‘博弈統(tǒng)計’,用概率跟你玩,你肯定就沒戲了,如果留下一個高手是‘勝者’,則可以再撐  發(fā)表于 2016-3-10 18:51
回復(fù) 支持 2 反對 0

使用道具 舉報

3#
發(fā)表于 2016-3-10 18:42:49 | 只看該作者
勝負(fù)五五開吧
回復(fù) 支持 2 反對 0

使用道具 舉報

4#
發(fā)表于 2016-3-10 18:46:55 | 只看該作者
早已經(jīng)自我進(jìn)化3000多萬局啦2 V2 t! I% R% Y( X* U; ?/ `

5 Y" ^# e  p- W9 t4 q靠人來比試獲取電腦算法經(jīng)驗值的速度太慢8 f6 g! o: y- _8 O! d8 n* H
回復(fù) 支持 1 反對 1

使用道具 舉報

5#
發(fā)表于 2016-3-10 18:47:33 | 只看該作者
不會的,依然是一方贏,并且肯定是一方贏,毫無疑問,& L& i% p8 |# ^1 U% a% p: M7 T

" T  U/ w2 G2 P, n, @6 q6 o因為每個系統(tǒng)是一個小組,其‘策略’是完全不同的,就是那個‘總策略’的算法與智商水平,決定了誰是贏家,這家伙假如到賭場,肯定被‘勸阻’的,跟山本一個級別,山本就進(jìn)不了賭場,) a! q5 g# U& O7 b, g

. r  Z. f$ C' p3 E這個,就跟我玩自動裝配是一個道理,你裝配車的路徑每個人算法是不同的,最終效率是不同的,
4 F  d4 N1 w# [% e8 v8 D5 K) M: r4 W) \3 ?5 S, Q
古狗其實就是向全世界宣布,阿拉是‘老大’,以前是IBM是老大,再后來是洛馬,! m( g7 t& i; u2 D  M! |

* G) N- T# ^* o# n; p" i洛馬被熊給戲了一次,丟了大面子,但迅速就找回來了,依然用170飛,就是‘挑戰(zhàn)與賭氣’,哈哈,# l- t! |8 m, B$ V

1 K8 q4 C0 X  b4 b, R跑速度與航程,跑不過諾格,有點‘丟分兒’哈哈,
+ G% R0 P/ k# r1 M) Y# {, P3 m4 G# D+ s/ A! |
總體說水平,可能現(xiàn)在還是洛馬第一,古狗大概排第二,因為洛馬玩這些東西的人,是古狗的好多倍,但也不排除古狗里面有一個‘絕世天才’,跟布勞恩一樣的家伙,( A/ P: H7 _8 c3 X* Y

! P* d% w2 c/ w  N& L; q, \就像中國專家希望在‘神農(nóng)架’里面找的‘非凡者’,哈哈,他們跟俺說這些,俺哈哈大笑,
5 w# B0 H$ N# |2 O5 M% n% c( x* f$ [
中米社會條件不同,論侃,米國肯定不是對手,哈哈,

點評

聯(lián)系這個想到波士頓動力的那個機(jī)器人,結(jié)合起來是相當(dāng)驚人的東西,可以做很多事情  發(fā)表于 2016-3-11 08:23
回復(fù) 支持 2 反對 0

使用道具 舉報

6#
 樓主| 發(fā)表于 2016-3-10 18:48:23 | 只看該作者
滅嘎嘎 發(fā)表于 2016-3-10 18:42 ( ~; K9 t* L# _3 o2 ~( c/ i9 I
勝負(fù)五五開吧
. G7 r. ^6 G1 r& N2 a4 O* W
我曾經(jīng)在一臺雙路E5 2680 v2的主機(jī)上,使用軟件對軟件下象棋,總計25盤,本來我以為,這個應(yīng)該遵循p=0.5的0-1分布,但是,結(jié)果讓人意想不到,紅對藍(lán),紅勝22盤
: ~9 V- [& ], _& e, e

點評

同樣軟件嗎?如果是這樣,紅藍(lán)算法肯定有區(qū)別!  發(fā)表于 2016-3-10 19:59
回復(fù) 支持 反對

使用道具 舉報

7#
 樓主| 發(fā)表于 2016-3-10 18:49:40 | 只看該作者
2266998 發(fā)表于 2016-3-10 18:47
: `; D# n8 ~# [, p- B! H. X不會的,依然是一方贏,并且肯定是一方贏,毫無疑問,
+ Y; F: p* A. E5 k- w: M0 A+ q0 J# _" T; u4 Y- j
因為每個系統(tǒng)是一個小組,其‘策略’是完全不同的 ...
( E/ K1 T' u, ?$ G& y
我曾經(jīng)在一臺雙路E5 2680 v2的主機(jī)上,使用軟件對軟件下象棋,總計25盤,本來我以為,這個應(yīng)該遵循p=0.5的0-1分布,但是,結(jié)果讓人意想不到,紅對藍(lán),紅勝22盤;看來就像8爺所說的那樣,還是一方贏
+ T4 t" t8 f0 B

點評

當(dāng)年買了給妹妹做渲染用的,有64G ECC內(nèi)存,總價3萬吧  發(fā)表于 2016-3-10 18:59
雙cpu、e5、2680v2工作站服務(wù)器級,20核40線程,這配置超萬把了。  發(fā)表于 2016-3-10 18:58
機(jī)器這個東西,是贏者恒贏的,必須留下一個家伙,是贏機(jī)器的,沒有這個家伙,機(jī)器就把所有人當(dāng)作‘?dāng)ⅰ,其運算邏輯與‘博弈概率’就回到最后被它打敗的那個家伙的算法去了,因為其它家伙都輸給這家伙,  發(fā)表于 2016-3-10 18:55
回復(fù) 支持 反對

使用道具 舉報

8#
發(fā)表于 2016-3-10 19:30:11 | 只看該作者
馬上fps,rts游戲也要沒意思了,阿爾法狗下一個目標(biāo)就是星際爭霸。, k( U* ?. r0 A5 m/ |

' y8 k$ M1 d7 ^* V* [幸好我已經(jīng)是劇情黨了。
回復(fù) 支持 反對

使用道具 舉報

9#
發(fā)表于 2016-3-10 19:34:25 | 只看該作者
看了下DeepMind團(tuán)隊發(fā)表在Nature上的文章,AlphaGO深度學(xué)習(xí)、蒙特卡羅樹狀搜索、自我進(jìn)化三大招齊出。換句話說,最開始的時候AlphaGO并不會下棋,怎么走完全靠隨機(jī)蒙,那些蒙對的走法會記憶下來,那些蒙錯的走法會淘汰,這就是訓(xùn)練。等下次再對弈時,就會使用上次蒙對的走法。經(jīng)過上萬次甚至甚至上億次的訓(xùn)練淘汰,水平會不斷上升,也就實現(xiàn)了自我進(jìn)化。
7 h8 V- l- |7 U! |/ f8 r3 D根據(jù)這個原理,兩個AlphaGO對弈,總會有一個獲勝,獲勝的新的走法會保留,失敗的會淘汰,實現(xiàn)進(jìn)化。這很像人類的自然進(jìn)化法則,這也正是AkphaGO厲害的地方。* I" E1 Y/ i& V5 g! O. F3 u6 y' `
事實上目前AlphaGO的技能很大程度上都是通過自己左右互搏學(xué)習(xí)到的。

點評

好可怕!  發(fā)表于 2016-3-11 11:56
原來是這樣!  發(fā)表于 2016-3-11 08:20

評分

參與人數(shù) 2威望 +2 收起 理由
不懂的太多xx + 1
愛貓人士薛定諤 + 1

查看全部評分

回復(fù) 支持 反對

使用道具 舉報

10#
發(fā)表于 2016-3-11 09:43:48 | 只看該作者
外太空這要這家伙去開疆拓土,進(jìn)化吧
回復(fù) 支持 反對

使用道具 舉報

您需要登錄后才可以回帖 登錄 | 注冊會員

本版積分規(guī)則

小黑屋|手機(jī)版|Archiver|機(jī)械社區(qū) ( 京ICP備10217105號-1,京ICP證050210號,浙公網(wǎng)安備33038202004372號 )

GMT+8, 2024-11-8 16:58 , Processed in 0.062846 second(s), 15 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

© 2001-2017 Comsenz Inc.

快速回復(fù) 返回頂部 返回列表