学霸的黑科技面板 第47节

  【数学:3级(1000/10000),注:数学3级,已经具备数学家的天赋和思维能力,全方位提升思维,反应,记忆力等基础天赋】

  【计算机学:2级(418/1000)】

  ...

  【可分配积分:0点】

  【特殊物品:学术腐败刻录(未绑定指定对象)X1】

  升级完之后,钱益明显感觉自己整个人迎来了一次蜕变,思维更加的深刻,清晰。

  除了数学水平的提升,计算机学理论水平同样巨大的提升。

  在其余三人继续APP的后天维护和推广运营的时候,钱益率先开始了具体项目的落实。

  AI大模型的微调训练,最大的困难就是资金。

  尤其是企业级的运用,按照钱益想要达到的效果,如果常规采用阿里云服务,训练微调70B模型,至少300万。

  这还是相对简单的微调训练,像一些国外公司全参数微调,通过多卡A100,都是上千万美元上下的。

  这也是如今国外AI大模型走的歪路,笃定的以为只有堆GPU,砸海量的资金,才能够获得更先进更强的AI大模型。

  钱益现在准备走的方向,还是希望优化算法,通过更轻量化的训练成本,更少的GPU方案。

  有了三级的数学能力之后,钱益开始了新的数学算法的理论突破,同时加入自己全新的改良式自注意力机制,改良式多头注意力机制。

  在参数的数据保护上,运用了隐私计算学的全新技术,为了能够提升训练速度和训练效率,钱益参考了联邦学习平台的概念,采用了分布式训练方案。

  同时,为了能够让自己部署的AI大模型,能够更深度,更专业的大纲生成,钱益着重编写了三个微调方法:

  1.监督微调:使用书籍片段与对应大纲标签训练,如输入“极限定义章节”→输出“1.1数列极限(ε-N定义)”...

  2.偏好微调:人工标注大纲质量,层级清晰度,优化模型对于逻辑关系的捕捉。(当然,最关键的还是要建立在全新的改良式注意力机制上。)

  3.强化学习:添加奖励模型,惩罚生成错误的大纲分支...

  花了一天时间,钱益将整个训练和微调方案设计完毕。

  有了具体的落地方案后,钱益将公司的天使投资人,冷静,王冰冰叫了过来,三个人开了一个领导层的会议。

  员工层的陈剑和唐嘉祺两人留守值班。

  钱益将罗列好的训练和微调计划,发给了两个天使投资人。

  “按照我目前的计划,由于前期的资金有限,所以只能够走低成本方案,通过已经开源的项目进行微调训练。”

  毕竟,如果完全靠自己去架构一个新的AI大模型,需要的资源,资金,硬件设备,人员配置等都是海量的,钱益目前还不具备。

  冷静对于这方面略有了解:

  “钱益,如果你准备采用开源授权框架的话,有一个问题,就是对于用户规模是有限制的,免费版月活用户数小于7亿用户。而且,按照开源协议,是需要将微调模型修改部分,进行代码开源的。同时保证训练的数据需要无争议,符合数据规范。”

  “这些你有考虑过么?”

  对于冷静的疑问,钱益早有了应对。

  “按照我们幕布APP目前的发展,达到月活7亿用户还有很长的路。而且,这只是我们第一次的创业,只是一个积累经验,积累原始资金的阶段。后续真的等幕布发展起来,有了资金之后,我会尝试开发一个属于自己的AI大模型。”

  听到钱益有些近乎狂妄的话,冷静沉默了一会,想想这短短几个月钱益的成长,谁敢说不可能呢?

  “至于,修改部分的代码需要开源,那就更不是事情了。我的全新模块,如果能够启发和推动AI大模型的发展,那可是好事情。对于我个人的声望和知名度都是意义非凡的。”

  有了黑科技面板,钱益不会敝帚自珍,他有着绝对的自信。

  而且,有了这种革命性的开源项目背书,之后,对于筹措资金,开展合作都是有着积极意义的。

  之前,李院士,高院士有意给自己筹建一个隐私计算学研究中心,这也算是自己给他们的一粒定心丸!让他们能够更加坚定的投资和培养自己。

  王冰冰对于钱益早就是盲目的崇拜了,说啥是啥。

  冷静看着志气高远的钱益,同样有些重新认识眼前这个年轻人,虽然比自己年级小了点,但是依旧充满了吸引力和魅力!

  “好,既然决定了,那我们就按照这个方向走。你说说接下来,需要我们做什么。”

  钱益找来两个小富婆,当然是为了讨钱了。

  “我罗列了下,虽然经过我的优化和分布式训练方案,依旧需要一大笔资金。”

  “首先是云服务租赁,多卡A100,需要15万元/月,好在经过我的优化加速,预计5周就可以完成训练。”

  “由于,我们需要着重的针对大学生群体,以数学,物理,计算机学等为主要方向,所以对于模型的要求还是很高的。为了能够更好的解决抽象概念的理解,需要精选一批学科经典教材进行训练。”

  “所以,还需要聘任一批学科内的专家作为顾问精选出至少5000本教材书籍,这部分书籍的人工标注工作,仅仅靠我们工作室是不可能完成的,所以需要外包,这个人工标注费,我大概咨询了下,需要70-80万。”

  “至于学科专家的话,至少10万。”

  “加上其他零零散散的费用,我合计了下,最省,最省的情况下,至少需要180万。之前,我从360科技拿了50万预付款,剩下的50万还要等项目结束。”

  “算上冰冰,冷老师,以及竞赛的奖金,我们公司账上现在只剩下了45万。”

  “最好的情况下,我向王总预支剩下的50万,算上幕布APP的会员收入,我们现阶段还差不少钱。”

  听到钱益的资金缺口,冷静立马拿出了手机,开始了计算手上的理财产品,准备提现出来部分。

  王冰冰同样拿出了手机进行了操作。

  没多久,两个红颜知己,全部拿出了自己的诚意。

第73章 数据暴增!

  “钱益,我可以再投入50万资金,不过要下周三全部给你。”

  冷静对于物质的要求不高,不是很注重赚钱,上班也没几年,加上有些是定期,能够拿出来的就这么多。

  “钱益,我这边能够凑出30万,你先用着。等周末我回趟家,看看能不能再给你弄个一百万来。”

  “好,有了这些钱,我们肯定能完成这次的微调训练了。”

  钱益立马和三人开始重新的拟定追加投资协议。

  在三人完成股东会议之后,钱益也给360科技的王彭总打了电话,商议一番之后,王彭承诺在下周一打款。

  “钱益,你真的不考虑,我个人投资吗。别说五十万,就算是五百万也不是问题的。”

  王彭非常看好钱益,只是,钱益很清楚,幕布APP本身的价值,以及背后的这个全新的AI功能,AI大模型的全新模块和算法框架,价值巨大!尽量不要去碰资本。

  搞定了资金之后,钱益开始了全新的模块,算法等的代码编写。

  同步的,接下来一个多月,钱益准备围绕这几个全新技术模块,撰写论文,以及安排修改部分代码的开源公布。

  【检测到你将要改变AI大模型的发展方向,新任务:开源社区巨头。完成相关的论文发表,以及论坛上开源代码公布,形成世界领域内的影响力。任务奖励:1,积分(视完成综合评定),2,10%黑科技技术。】

  接下来几天,工作室之中,众人各司其职。

  由于大家除了工作室的任务外,还有学业要兼顾,好在钱益大部分的专业课都豁免了,而唐嘉祺研究生的时间更为充裕,王冰冰也进入了大四,所以,整个项目组还是能够运转下来。

  唐嘉祺也起到中流砥柱的作用,大部分都是他在后台值守。

  唐嘉祺也是第一次负责这么一个划时代的项目。这几天,一边时刻监测幕布APP,一边对模型微调训练进行值守。

  从刚开始接到林教授的通知,来钱益课题组,到现在的具体工作几天下来,唐嘉祺的心态完全变了。

  一开始,或多或少,他还是有些担忧的,毕竟这个项目的主要成员,除了钱益名声在外,其余的陈剑,王冰冰根本就查无此人,还都是本科生。

  但是,接触下来,他发现这个课题组,有了钱益这种定海神针,其余人,自己和陈剑几人毫无差别,就算是丢一个博士过来,一样的结果,就是来抱大腿的!

  就好比曾经篮球场上的奥尼尔对于乔丹的评价:我奶奶和乔丹一起都能夺冠。

  唐嘉祺非常感谢林教授给了自己这样一个机会,也越发的勤勉,尽可能的做好辅助工作。

  唐嘉祺拿着开会笔记,认真的执行钱益的安排:

  算法与数据监控,数据清洗与隔离,访问控制....

  每一个点,他都一丝不苟的做着。

  “钱益真的太厉害了。这些全新的技术和模块,等项目结束论文发表之后,绝对会让AI领域的权威们大惊失色。”

  更让唐嘉祺激动的是,自己虽然就做了一些辅助工作,但是钱益已经承诺了,之后等论文发表之后,会给自己挂上二作,三作的头衔。

  这对于自己之后的求职和发展都有着巨大的加成!

  在唐嘉祺继续关注幕布APP,记录数据的时候,葛雪恒给唐嘉祺发来了微信。

  “老唐,你最近几天都在那个小学弟的工作室当牛马啊?就为了一千块钱一个月,你至于么。”

  “告诉你个好消息,接下来院里面有一个重点的校级课题,楚校长的女儿牵头的,我准备加入课题组。你要是有兴趣的,现在还有机会,我给你要个位置。”

  “看在多年兄弟的份上,我可是提醒你了。之前数学建模大赛让数院出了风头,这次的项目楚校长非常重视,是要去评奖的,你明白我的意思吧?”

  看到葛雪恒的信息,要是放在以前,唐嘉祺还真的会想办法加入。但是,经过跟钱益的这段时间的深入接触,他哪里还会去跟着楚月团队。

  唐嘉祺没有时间回复,略微扫了一眼,还是先完成幕布APP的后台数据统计,第一时间抄送到工作群里面。

  “最新数据用户下载量突破10万,注册用户数突破3500+”

  “大模型的微调训练,我已经按照钱益的交待,暂时没有任何的问题。”

  完成了工作之后,唐嘉祺才给葛雪恒回了一条。

  “不用了。我在钱益工作室做的挺好的,有始有终。恭喜你加入新项目。”

  见到唐嘉祺的回复,葛雪恒不免有些轻嘲,老实人就是这样子,为了一点体面,被一个小学弟架在那里。加入了,就觉得不好意思退出。

  这几天,他可是留意着唐嘉祺的行踪,基本上都是在钱益的工作室加班,这操劳程度何必呢。

  唐嘉祺都成为了核心主力,这样的项目组又能够有什么前途,还没有学校的经费支持。

  到时候,辛辛苦苦几个月,就拿到千百块钱,什么都得不到。

  葛雪恒有些怒其不争的说了一句:

  “你呀,就是太实诚。一点都不会审时度势,我可是提醒过你了。希望你到时候不要后悔。”

  接下来的几天,王冰冰和冷静的资金陆续到位,王彭那边的五十万也提前打过来。

  整个项目终于可以高枕无忧的完成迭代优化。

  ...

  ...

  抖音,老登读书会账号,几天内发布了三条读书推荐的视频。

  按照以前的更新频率,一周能够有一本书的推荐就已经很不错,但是这几天突然的频繁更新,让粉丝们受宠若惊。

  “哎呦,老登这是磕了什么仙丹了,这更新也太给力了。”

  “大家发现没有,这三条视频之中的书本大纲的罗列,思维导图的整理,比以前清晰了太多。”

  “楼上说的还真是,这三条视频的介绍,还真用了一个全新的软件么。这思维导图非常简洁。”

  “老登,你是不是用了什么黑科技?推荐推荐呗,我在复习考研,很想有一款好的能够罗列大纲和搭建思维导图的工具。”

  不一会,老登回复了这个读者。

  “要不说群众的眼睛是雪亮的。这几天还真是托了这款全新APP的福,效率大提升。我只需要自己罗列大纲,一键能够生成思维导图。工具推荐:幕布!”

  仅仅过去三个小时,这个回复置顶,点赞破万。

  老登读书会可是有着几百万的粉丝,流量可想而知。

首节 上一节 47/114下一节 尾节 目录