第一百二十四章 删除 路大头
七点半,十三楼还没几个人。
赵文渊推开十三楼办公室的玻璃门,走廊的灯还是感应模式,一段一段地亮起来。他把背包放在工位上,打开笔记本,先去茶水间接了一杯冰水。
这是他的习惯。早到一个半小时,利用安静的时间看数据。
模型的训练面板排在浏览器第一个标签页,昨晚跑的第六轮微调结果已经出了。
他点开损失曲线。
基本是平的。
和前天一样,和大前天一样,和上周一样,后训练走到这一步,就像拧毛巾里的水,最后几滴也拧干了。
赵文渊关掉面板,喝了一口冰水。
手机亮了一下,是lked的通知。
他一般不看lked,上面十条消息九条是猎头群发的模板,“高薪内推”“期待交流”,复制粘贴都懒得改名字。但这条不一样,发件人的主题里带着“nexai”的名字。
赵文渊点开了。
站内信,来自nexai的人才招募总监,不是群发模板,第一句话就写了他在谷歌时的研究方向,第二句提到了天工模型在代码生成领域所取得的成就——昨天才刚刚在官网上公布。
信息大意是:nexai正在计划组建中国区研究团队,可能在海城或京城,看过他的背景,希望约时间聊聊。
赵文渊没有回复。
但他顺着信息里的链接点进了nexai的官网。
团队配置:四十多位研究员,核心成员来自openai、deepd、taaib。技术目标:最好的通用大模型。正在招的岗位——基座模型训练。
每一条都踩在他心里最痒的地方。
他当然不想跳槽,但他真羡慕那些资源。他手上十几个人,每天只能在后训练的天花板底下磨那点提升。
走廊那头响起了脚步声,赵文渊赶紧关掉页面。
九点差一刻,十三楼已经坐了一半人。
小牛端着咖啡拐过来:“赵哥,昨晚的消融实验跑完了,结果在共享盘里。”
“看过了。”赵文渊说。
小牛愣了一下:“你几点看的?”
“早晨。”
小牛张了张嘴,没吭声,转身回了工位。
旁边的小郭在调数据清洗脚本,扭头问他怎么处理多语言混合的token切分,赵文渊走过去看了一眼屏幕,指了指第三行:“这里换个模式,先跑一版看效果。”
小郭点头,开始改。
赵文渊站在工位过道中间,扫了一圈。
十三个人,大部分是他亲自面试挑的。小牛是他在交大时候的师弟,小郭是面试时唯一一个敢当面就跟他争论采样策略的。角落里两个新来的数据工程师对着屏幕标注,头都不抬。
八点五十三。
赵文渊合上笔记本,拿起手机,下楼。
敲门的时候,韩路一已经在了。
桌上有一杯没喝完的咖啡,笔记本开着但屏幕灭了。韩路一的眼神发亮。
“坐。”韩路一关上门。
赵文渊在办公桌对面坐下。
没有寒暄。
“我想做通用基础模型
章节内容不完整,请退出阅读模式查看完整内容!