第二百二十五章 Lv.4的新能力 路大头
天的收尾要做。
怎么突然就升级了?
韩路一思索了一下,突然有了个想法。
莫非是鼎盛那边的大模型先训练好了?
他心里知道鼎盛会用自己训练用的标注数据去训练他们自己的大模型,也为此做了准备。
但是他没想到,偷去的数据,也能被视界视为升级的标准吗?
还挺包容的。
不过鼎盛的模型对他的威胁不算大,毕竟汤圆base已经基本达到了国际一流,他的标注数据也基本是侧重于中文的意图理解,鼎盛拿到的数据也是他精心筛选过的残缺版。
综合来看,鼎盛即使率先发布,也只是能猖狂一时,让他们去吸引一下国际上竞争对手的目光也不是坏事。
只是,如果他的猜测是正确的话,现在要做的事情就是尽快收集鼎盛违规使用源智科技私有数据的证据链。
毕竟,他们做没做是一件事,能不能告赢是另一件事。
韩路一暂时放下对视界升级的思考,把精力重新放回到眼前的工作上来。
视界升级是好事,但工作还是得做。
现在给汤圆做后训练的是八万多条中文标注数据,想要让汤圆能顺利接住kaiwu的流量,还需要同等量级的英文标注,韩路一现在连个零头还没肝出来呢。
至少有一个好处,精力值上限提高,标注数据时就可以一次干得更久了——等等,这似乎也不一定是好处?
韩路一自嘲地笑了一下,把目光放在屏幕上。
这是一份英文的语料,是赵文渊从数据公司买来的,记录了用户的工具使用行为,用于进行sft微调。
「用户输入:帮我做一个周会纪要模板
生成结果:正式会议记录模板,含参会人、议题、行动项负责人、截止日期、下次会议时间
用户实际行为:删掉了参会人列表和正式结构,只保留行动项,手动加了“已做的决定”和“待解决的问题”两个字段,把“待解决的问题”挪到最上面,重新生成过一次」
视界的信息在英文语料上弹了出来,真实意图的判断也同步生成。
不需要费力去阅读和理解,意思自然出现在了韩路一的脑海中。
“真实意图:用户不是会议组织者,而是参会者。他所在的团队习惯在会议上做决定但不通知所有人,他需要的是一份个人备忘录,用来追踪哪些决定跟他有关、哪些问题会影响他的工作。把“待解决问题“放在最前面,说明他长期处于等别人决策后才能推进工作的处境,这份模板是他给自己建的催办记录。”
领会了其中的意图,韩路一摇了摇头。
这些是海外职场的真实困境,虽然是英文写出来的,但是似乎和中国的打工人也没什么不同。
四海之内皆牛马。
心念一动,标注的文档里多了一行字。
等等!
刚才发生了什么?
韩路一整个人猛地一惊,后背一阵发凉。
他刚才人坐在椅子上,两只手放在大腿上,既没碰鼠标,也没碰键盘。
但是他心里想的内容直接出现在电脑屏幕上。
定了定神,韩
章节内容不完整,请退出阅读模式查看完整内容!