“你说这是……”
刘安临两眼上翻,重新翘腿坐在老板椅上:“明白了吗?明白了就赶快去处理。”
吴恩德眼中充满了痛苦、不解、愤怒,他原本认为千寻的种种乱象,是大周商业环境下的不得已,千寻只能和光同尘,都是下面的这些职业经理人为了业绩所做出的道德交换。
原来,千寻就是这个环境的缔造者之一。
吴恩德重重的喘了两口气:“我不同意,如果你们坚持,我会辞职。”
刘安临面色一动:“好吧,Andrew,既然如此,从即刻起,由Shawn傅远生接替你的工作。同时,由于你的不配合,你必须签署保密协议后,才能离开公司。”
说罢,刘安临按了下按钮,从门外进来两个五大三粗的保安和三名看上去就像HR的年轻人。
两名保安一左一右架起吴恩德,吴恩德大惊:“刘安临!你干什么!这是绑架!”
“这不是绑架,这只是为了公司机密不会外泄而采取的必要措施。”
“Jolin,让安全部把吴恩德的全部电脑收走,里面所有信息都要检查。Andrew,在审查结束并签完保密协议后,你可以随时离开。”
——
三藩市先锋大厦。
先锋大厦说是大厦,实际只有三层楼,看上去就像刷了蓝绿色漆面的老工厂。
二层的一侧,二十多个衣冠不整蓬头垢面的年轻人或三三两两或各自为战,眼睛都盯着面前的数块电脑屏幕,
“成功了?”穿着一件黑T恤的埃隆马斯克双臂抱胸,头发凌乱。
“没有,训练损失值始终是一条线,失败了。”伊利亚虽然面无表情,但眼中却闪过一丝失望。
“Fxxk!!!橘子在这种学习率下,为什么不会梯度爆炸?”布洛克曼气愤的锤了一下桌子,“他们是怎么做到的?除了注意力机制,他们一定还使用了其他机制!”
半个月了,他们自从拿到橘子大模型内测权限后第二天,就展开了对橘子大模型的逆向工程。
这种逆向太难了,毕竟橘子大模型的运行是在柚子科技服务器上的,而不是在openAI的电脑本地。
但从接口和数据上,其实是能看出一些端倪的。
而且经过柚子科技的证实,橘子大模型在架构上融入了注意力机制。
注意力机制并非AI研究的热门方向,准确的说,这个机制是前年才刚刚被蒙特利尔大学的德米特里巴赫达瑙在一篇关于机器翻译的论文中偶然间提到的。
这个机制解决了序列到序列模型在处理长序列时的信息压缩问题。
但也仅此而已,并没有掀起太大的水花。
可随着两周前柚子科技公开证实了其开发的橘子大模型中应用了注意力机制,巴赫达瑙两年前发的这篇论文一下子火了起来。
短短两周时间,引用量就多了好几百。
目前所有深度学习领域的开发者,都在研究,如何应用注意力机制开发出类似橘子的大模型。
而就在柚子科技结束橘子大模型的内测,宣布一周后将进行规模为三万人的大型公测的当天下午,一记重磅炸弹再次炸沉了科技圈。
“千寻宣布,完成全球首个AGI——“闻君一言”的开发,“闻君一言”将同样于一周后开始公测。”
“据千寻内部透露,现在千寻高度怀疑橘子大模型就是柚子科技窃取了‘闻君一言’的代码做出的套壳产品,橘子大模型与‘闻君一言’高度相似,目前正在搜集相关证据”
“千寻AI负责人吴恩德闪电离职,疑似与柚子科技存在利益输送!”
“吴恩德发布声明,并未负责过‘闻君一言’的开发工作,拒绝对此发表任何意见。”
……
千寻的公告及公告中所附的“闻君一言”宣传影像,就像一颗数千万吨的深水炸弹,一经发布,就掀起了一场海啸。
柚子科技怎么没有回应?
难道真的是他们抄袭了千寻的产品?
“我就说嘛,一个小公司,怎么可能做出这种产品,肯定是偷的,上次fb也说他们是偷的。”
“让子弹再飞一会儿。”
“飞个屁啊,用屁股想都能想明白。”
“如果真的是柚子科技窃取了千寻的技术,为什么阿法狗的时候千寻没有发声?”
“估计当时千寻还没有找到证据吧。”
“千寻也不是什么好鸟,卖“聊吧”是永远的污点,抛开事实不谈,这一波我站柚子科技。”
“楼上是柚黑吧?”
……
“无耻!”华泽成恼火的一摔鼠标,“老板,我认为我们应该马上回应。”
“不急。”方豫拿着两个手机,脸上带着坏笑,一边用小号在网上支持千寻,有理有据的分析一定是柚子科技偷了千寻的技术。
一边用另一个手机打开柚子科技的官微,手指轻点,转发了千寻公告的同时,添加上了一张柚子科技前几天去大阪环球影城团建的照片。
照片上包括方豫在内的柚子科技全体员工都在,每个人都穿着哈利波特的魔法袍。
就连柚子,都被方豫当成cos道具举在手上。
方豫在屏幕上轻点几下,写了三个字。
有意思。
千寻啊千寻,先送你道开胃菜。
过一个月,老子的搜索引擎和浏览器搞好了,再送你归西!
之所以废掉前面一章,是发现照原来的细纲写的话,这本书可能就崩了。
因为我根本就没去过墨西哥和中美洲,根本不了解那边。
细心地书友应该能发现,我写的东西,其实在很多细节上,甚至包括路名、门牌号都是有据可查的。
例如千寻的办公地点、会议室名字、老板办公室的楼层。
再例如斯嘉丽当时在纽约和洛圣都的住所在哪里,有多大,什么样。
为的就是塑造出真实感。
但由于墨西哥我是真不了解,所以写不出来真实感。
但好在终于发现了问题,把墨西哥剧情变成暗线后,一下子就开朗了。
如果把这条线继续强写下去,估计我就该写崩了。
这条线还是会存在,只不过会作为背景记录一下,不会实写了。
可惜了,之前找了那么多拉丁美女的资料,好多都是95后。
我个人是很喜欢拉丁美女的,虽然皮肤黑了点,但身材相貌都是我的菜。
而且拉丁美女有个好处,身上的体毛没有那么茂密和粗硬,和黄种人比较接近。
白人的体毛是真的扎啊,尤其很多人采用刮刀刮体毛,不用蜜蜡和激光,蹭上去就跟搓澡巾似的,感受不好。
第277章 红彤彤的前程
尽管信心满满,但能够这么顺利的就取得橘子大模型的源代码,还是让Madeline喜出望外。
千寻的安全部门手里有大量的0day漏洞(被黑客发现的,开发者和用户不知道的漏洞),他们所制作的木马就是利用了linux系统中的几个0day漏洞来远程执行代码并获取权限。
千寻根本没有等太久,那个加密包第二天就被柚子科技解密调用了,里面果然是橘子大模型内测后的修复版本。
吴恩德离开后,接替他工作的傅远生虽然满嘴军令状,但心里其实还是忐忑的。
他是内行,虽然此前没有接触过橘子大模型这种类型的神经网络,但BP、LSTM、CNN、RNN、DNN、Seq2Seq等模型还是玩的很熟的。
无论什么神经网络,本质上都没有删除数据这么一说,只能重新训练。
深度学习并不是把数据资料存在某些地方供神经网络调用,而是让神经网络“学习”这些内容,学习后的东西会导致“神经突触”的变化,而大模型的“神经突触”,就是所谓的“参数”。
这些参数的数值变化和相互的连接,就像人类学习的时候神经突触的连接一样,意味着大模型真正“掌握”了训练的知识。
比如一个参数13B(130亿)的大模型,存在一块硬盘上,可能大小有20个G。
让它接受2个T的数据训练后,可能它的大小还是20个G。
大小没有什么变化,但这2个T的资料它却已经完全掌握了。
但既然是模仿人类神经形成的人工智能模型,其实也存在了人类智能的某些问题。
比如说“遗忘”的问题,就是明明学了,过一阵时间之后却发现AI把学过的东西忘了。
AI过度训练后,可能会出现对新数据“想当然”的现象。
就像人类面对新生事物时,明明什么都不明白,却用过往经验进行解释,这在AI领域中叫“过度拟合”。
一堂课老师讲了半本书,前三页你还能听明白,到后面就是听天书,对于AI来说,就是“信息过载。”
人类接触到的信息是片面的情况下,就会导致认知偏差,AI的数据如果集中存在某一种意识形态的内容,同样会导致认知偏差。
林林总总。
更有甚者,原本是个好模型,别人训练都没事,你来训练,要么无法收敛得到结果(可以理解为学不会),要么灾难性遗忘,要么梯度爆炸或消失。
在架构和参数没有太大改动的情况下,能不能训练出可用的大模型,甚至是一门玄学。
AI的训练与调优充满了复杂性和不可预测性。
有时候,一个微小的参数调整或数据处理步骤的变化,就能导致训练结果的巨大差异。
就算傅远生严格按照科学的方法调整超参数,精心选择数据集,并使用最先进的硬件设备,但他仍旧没有足够的信心在短短的一两周时间内,把橘子大模型重新训练一遍去除柚子科技的所有痕迹。
但成了的话,自己可就是AGI之父啊!
升职加薪啊!
成为世界第一的AI权威啊!
又有几个人能抵挡这样的诱惑呢?
而且千寻早就准备好了,如果柚子科技那边反击,甚至放出橘子大模型是他们自我研发的实锤,千寻也不怕。
掌握了十几亿经费的公关一号位可不是吃素的!
哼!
入关之后,自有大儒为我辩经。
先搅浑水,过上半年再持续的岁月史书,柚子科技没多久就成了历史笑柄了!
傅远生实际上手之后,更是喜出望外感觉自己天命加身。
这个橘子大模型和柚子训练框架太踏妈好用了。
无论用什么策略调整参数,几乎训练效果都很好,效率奇高。
应该三天就能完成一轮训练。
公测版本的橘子大模型相较内测版的130亿参数又做了倍计的提升,足足有1500亿的参数。
傅远生指挥自己三个忠实走狗,四个人开始关在小黑屋里闭关,一边去除橘子大模型内的柚子科技的痕迹,针对性的调整参数,一边进行重复训练,尽可能的覆盖这个大模型原本学习的知识。
尤其是那种“你是谁创造的?”之类的问题,必须对大模型进行监督学习,让其遇到类似的问题都能回答是“我是‘闻君一言’,是一个AI助手,千寻公司创造了我。”