果然听汪潮一说,黄明海和沈知文都停下了筷子,看着吴哲。汪潮则是贼兮兮的又夹了一大块金枪鱼肉。
吴哲敲了下汪潮的筷子,笑骂了句:“就你事多!”
我过这东西本来就要和沈知文好好聊聊,倒也没什么。
组织了下语言,他才缓缓开。
“可以设计成双层结构,一层大量矩阵数字作为输入,通过非线性激活方法取权重,造成另一层数据集合作为输出,基本上和生物神经大脑工作原理一样。”
几人愣了下,有点明白又不是很明白。
沈知文是对计算机最熟悉的,思考了会明显有领悟。可还是提出疑问道:“生物神经工作的程序我们不说,算法怎么解决?用什么样的算法?”
“蒙特卡罗算法听过吧?也就是统计模拟法。”
说到数学,汪潮可就有点精神了。总算是把他从美食上的注意力给拉了回来。
当即有点不信的说道:“这是种模糊性算法,能行吗?当然只要数据够多,他的判定还是相当准的。”
“那就要你们去探索了,我就给个思路你们。最重要的就是深度学习。”吴哲也只会给一个思路,他要帮他们什么都做了,那这科研成果算谁的?
这下,沈知文哪还吃的下饭,拉住还想再吃两口的汪潮。
暴力胁迫下,那是没人权的。反对?反对无效。
“知文,你让我想想?想想?”汪潮脑子有点懵,这正开心的吃着大龙虾呢?
“深度学习?就是迭代,不停的迭代是能达到这个目的的。”汪潮闭眼喃喃说道。
“实现的工具呢?”沈知文紧跟了一句。
“有了,拿纸和笔过来。”汪潮猛地睁开眼睛,随手打了个响指。
接过纸笔,汪潮开始写公式,嘴上也开始和大家解释。
“从根节点,也就是要做决策的局面R出发向下选择一个最急迫需要被拓展的节点T;局面R是第一个被检查的节点,被检查的节点如果存在一个没有被评价过的招式那么被检查的节点在执行得到的新局面就是我们所需要展开的T;那么利用ucb公式得到一个拥有最大ucb值的可行招式,并且对新局面再次进行检查-——嗯,这里的公式可以简化一下-——”
写了满满两大张,汪潮复查了两遍,没问题。逻辑能自洽。忍不住叉腰长叹道:“我真他妈是个天才,以前怎么没想到呢?”
“这就完事了?我看看呢?”黄明海也凑了过来。
“完事?你想屁吃呢?”汪潮臭屁的说了声,“这些就只是一个开始,让我们能从零开始的起步。”
接着又解释道:“这是个系统工程,还不知道能不能赶上知文的这次大赛?喂!老三,要是没赶上你可不能怪我。我脑子里有大体的框架,但真的非常的难弄。”
沈知文郑重的说道:“没事,不参加大赛都行。我有预感,这应该是我以后的研究方向。”