老赵那边非常利索地把服务器的账号密码发了过来,顺便还非常贴心地把江大自己开发的服务器登录器也发了一个过来。
苏飞按照Linux系统的操作命令,先登陆上去看了看配置,这不看不知道,一看吓一跳。
老赵分给他的这台服务器插了四张显卡,清一色的3080ti,苏飞查了下型号,这一张就得近万,而作为核心与这四张显卡协同运算的cpu那就更了不得了。
他不由得有些感叹,老赵啊老赵,你年轻的时候是得多大牛,这都退居二线了,手里还富得流油。
苏飞敢打包票,就这四张3080ti的配置,就能抵得上江大不少教授实验室的资源了。
不过这四张卡有两张已经在运作了,估计是其他学生申请了学校的服务器,在跑实验。
既然有了这种配置,苏飞也算是有底气了,他根据自己的模型单元构建起了一个模型结构,然后挑选了人工智能领域中非常典型及复杂的任务,机器翻译。
其实就是语言翻译,目前为止使用的各种翻译软件其核心技术就是基于机器翻译。
这其实还是自然语言处理领域,但又不局限于自然语言处理,因为机器翻译是公认的大数据训练,其训练的复杂度和图领域不相上下,这也就代表着这个实验任务能在很大程度上反应论文模型在人工智能领域的性能。
而苏飞思前想后,决定采取现在国际上公认的两个机器翻译标准任务,将英语翻译成德语以及法语的BLEU任务和WMT任务,这两个翻译任务是目前最有说服力的实验,现在甚至有一个实时榜单专门对这两个任务打榜,在人工智能领域几乎无人不知无人不晓。
所以,苏飞要在最有公信力的任务上下手,做到一击毙命。
在他熬夜修仙两天后,终于辛辛苦苦把自己的模型构建出来了,但应用到这俩任务上去时,他却傻眼了。
“卧槽,这训练一轮就得半小时?”
要知道,人工智能领域的训练轮数都是1000次打底,像机器翻译这种2000次都是常态的。
“这起码得4、50天才能训完啊……”
这简直就离谱,一篇论文耗时最长的居然是任务训练,而最为核心的模型构建只花了几天时间。
而且,在训练中途出了啥岔子,比如说有其他同学一不小心占用了他这张显卡的计算资源,导致程序崩溃,他的模型数据一旦没保存下来,那就得重新训练。
还有一个很重要的问题是,万一训练出来的性能没有想象中的好,苏飞还得调节参数,再训练一次,这时间跨度就未免太长了。
苏飞思考良久,只得又去找VX里的那个中年秃头大叔。
【老赵,能不能再给我台服务器。】
【咋滴了,刚给你的那台服务器出啥岔子了?】
【显卡有些不够用。】
【要几张显卡。】
苏飞想要在一周左右训练完,这么一算……
【8张3080ti。】
那边发来一个小企鹅头掉了的表情包。
【你当我是提款童子?前天不刚让你给我低调点?!】
(本章未完,请点击下一页继续阅读)
最新网址:xiashukan.com