第215章 金泰熙的面试(2/2)
到了排练室,班行远再次和乐队和歌手老师做了沟通就上楼了,有左宏元老师在不用他操心。而且也不需要他参加排练,他在这里意义不大。
在研究院讨论了一个上午,大模型各个方面的工作逐渐成型。首先定下来的就是加速卡的方案,这个其实很简单,把原来科学计算的那个拿来修改一下就好了。把Fp64模块大幅精简,然后通过对程序计算类型进行分析合理分配4位、8位、16位和32位计算单元的数量就行了。
当然也有困难,就是那个基板内存封装的事情。计算机分部对这个多层芯片叠加的方案大加赞赏,认为非常可行。当然了内存芯片肯定要专门设计,现有的可没办法叠在一起。计算机科学家认为这个方案非常完美,首先把内存封装在基板上距离计算核心近了,数据交换速度自然就提升了,信号传输是需要时间的,距离短了更容易提速。
第二就是多层内存芯片叠加规避了基板面积小的缺点,最大化的增加了容量,干活的积极性非常高,准备大干特干。很多时候只是一个想法,有了突破口其实在技术上并不是多难实现,无非就是多实验,钱到位了试的多了也就做出来了。
软件组的任务也定了下来,修改软件的功能。最初设计的是处理语言学的工作,肯定要增加别的功能,根据不同的应用方向成立了小组。
要做的事情很多,比如,如何提高不同加速卡之间的信息交换速度、完善开发工具……这些都是研究院一直在做的,直接拿来用就好了。
最后下来发现训练组和测试组无事可做了。大模型在蛋白质计算中心的运行速度最快,但是那边的工作更重要,没办法占用。
眼看着因为硬件的原因工作没办法开展,两个小组的人无比郁闷。最后化悲愤为力量主动协助其它小组开展研究。新的专用芯片早一天出来就能早一天开展工作。
其实设计这种专用芯片目前来看在经济上是不怎么划算的,应用范围太窄了。不过研究院可不考虑这个,亲眼见过那个人工智能应用后非常确信发展成熟后应用极广,现在不赚钱不等于以后不赚钱,做技术储备呗。
班行远自己也领导一个小组,研究进一步对算法进行优化,降低对算力的需求。他有一个想法,打算借鉴大脑处理信息的方式。这个大模型在处理的时候是同时对整篇的资料进行处理,对算力的要求非常高。人脑不是这种方式,别的先不说,首先就不能完整准确的记住那么多东西,只能同时处理一小段的内容。而且不会对所有的信息全部处理,是根据工作的需要提取出需要的或是感兴趣的来处理。
班行远要做的是在数学上证明这种办法的可行性,并计算出收益,也就是可以降低多少算力需求,提升多少效率。在此基础上对算法做进一步的优化。当然了具体的工作也不用他去做,给出整个工作的框架和思路就好了。班行远把做研究当作是放松,比起他要处理的工作做这些计算不要太轻松,至少不会觉得心累。
上午快十一点的时候金泰熙返回自己的办公室,有很多事情还等着自己做呢。最重要的就是大模型项目的计划书得经过金泰熙批准后才能开始实施。既然把研究院交到了妻子的手里班行远是不会越俎代庖的,制度是怎么样的就怎么执行,也只是问起一些技术问题的时候做一下解释。
这帮科学家显然摸透了金泰熙的性子,准备了两个方案。第一个方案看完之后金泰熙的分贝立刻就高了:“什么?你们要建一个规模十倍于蛋白质结构项目的计算中心!不行,绝对不行,我去哪里给你们弄每天1000万的电费!这个大数据模型是个什么东西,需要下这么大的功夫。”