下一章 上一章 目录 设置
13、光芒难掩 ...
-
清华园的自习室总是座无虚席,夜晚的灯光下,是一片埋头苦读的宁静。
林如意特意选了个最角落的位置,摊开《人工智能导论》的教材,眉头却微微蹙起——并非因为难题,
而是她必须强迫自己以“初学者的笨拙”方式来理解这些她早已在商业实践中运用过的概念。
“这里……卡住了吗?”一个温和的声音在旁边响起。
林如意抬头,看见陆子明端着两杯热饮,站在桌旁,眼中带着友善的笑意。
他将其中一杯桂圆红枣茶轻轻推到她面前,“晚上喝点热的,对女孩子好。”
“谢谢。”林如意有些意外,连忙接过,指尖传来的温热让她因刻意“扮蠢”而有些发冷的心稍稍一暖。
陆子明很自然地在她旁边的空位坐下,没有靠得太近,保持着恰到好处的距离。
“是看到特征值分解这里了?”他目光扫过她摊开的书页,一语中的。
林如意心里一惊,她确实是在这里“表演”卡壳。
她赶紧低下头,让头发遮住侧脸,用犹豫的语气说:“嗯……感觉,有点抽象,不知道怎么用……”
“这个确实容易懵。”陆子明了然地笑了,没有丝毫的不耐烦。
他拿出自己的笔记本——上面是清晰工整的思维导图和代码示例,并非死记硬背的概念。
“别把它想得太复杂。”他将笔记本转向她,声音放得更缓,像在讲述一个有趣的故事,
“我们可以把它想象成……嗯,就像在一堆混乱的声音里,精准识别出是谁在说话。这个技术,其实就是帮AI抓住那个最核心、最有特征的‘声音’。”
他用笔在纸上勾勒出简单的示意图,“你看,把这些杂乱的数据(声音),通过这个数学工具(分解),就能提炼出关键信息(是谁)。
你之前在军训时反应那么快,其实你的大脑就在下意识做类似的事情——过滤掉无用信息,抓住关键动作。”
他这个巧妙的比喻,将冰冷的数学与她展现过的身手联系起来,瞬间击中了林如意的思维核心。
她眼中难以自制地闪过一丝恍然与赞赏,这和她处理商业数据、洞察市场本质的逻辑,何其相似!
这一闪而过的灵光,没能逃过陆子明的眼睛。
他微微一怔,心中那种“她绝不普通”的感觉再次浮现。一个真正懵懂的学生,不会有这种瞬间洞穿本质的眼神。
但他什么也没问,只是顺着这个比喻,继续耐心地讲解下去,引导她“自己”得出结论。
在他的引导下,林如意“艰难”地“理解”了这个概念。
她适时地露出一个如释重负的、带着感激和些许腼腆的笑容:“我……我好像有点明白了。谢谢你,陆同学,你讲得比书上清楚多了。”
“能帮到你就好。”陆子明看着她终于“舒展”的眉头,自己也笑了起来,那笑容干净而真诚,
“以后有什么问题,随时可以问我。学习嘛,互相讨论才能进步。”
离开自习室时,夜风已带凉意。陆子明很自然地走在她外侧半步的位置,是一个既能交谈又不会让她感到压迫的距离。
“其实,”他忽然开口,语气轻松,“你不用那么紧张的。
霍老师他只是要求比较高,人并不坏。你……很聪明,只是可能还没适应大学的节奏。”
林如意的心轻轻一颤。这是第一次,有人对她说“你狠聪明,而在陆子明这里,她感受到的却是被“看见”的温暖和被肯定的尊重。
“嗯,我会努力的。”她轻声回应,这一次,声音里的感激真实了几分。
看着林如意走向宿舍楼的背影,陆子明站在路灯下,没有立刻离开。
他回想着她听到精妙比喻时那双骤然明亮的眼睛,那绝不是一双平庸的眼睛。
这个叫林如意的女孩,像一颗刻意隐匿在云层后的星辰。
他并不知道她为何要隐藏自己的光芒,但他能感觉到那微光之下,蕴藏着怎样惊人的能量。
而他,不介意在云层散开之前,成为那个在黑暗中,最先为她递上一盏灯的人。
为了避开霍奇骏可能出现的实验室,陆子明将小组讨论的地点改在了图书馆一间僻静的研讨室里。
没有了那座“冰山”带来的无形压力,赵伟明显放松了许多,连敲键盘的声音都响亮了些。
他们的课题进展得还算顺利,陆子明负责的核心模型架构稳健,赵伟爬取的数据也足够丰富。
然而,在特征工程的最后阶段,他们遇到了一个棘手的问题——数据稀疏性。
他们使用的论文数据集里,某些关键特征
(如“参考文献数量”、“合作作者数量”)的分布极不均匀,大量论文的数值集中在低位,
但又有少数论文拥有极高的数值,形成了一条长长的“尾巴”。
“这样直接扔进模型,效果肯定很差。”赵伟盯着屏幕上的分布图,
抓了抓头发,“这些极端值就像是噪音,会把模型带偏的。可如果直接截断或者删除,又会损失很多信息。”
陆子明也蹙着眉,他尝试了几种常见的处理方法,比如取对数(log变换),但效果都不理想。
取对数后,分布形态有所改善,但那些极端值依然像顽固的礁石,影响着整体的平滑度。
“或许可以试试……缩尾处理(Winsorization)?”陆子明提出一个方案,
但语气并不十分确定,这通常用于金融数据,在学术文本特征上应用效果未知。
“或者用分位数变换?”赵伟补充道,但同样面露难色,“那个复杂度比较高,我们时间可能不够。”
研讨室陷入了短暂的沉默,两人对着屏幕上的数据分布图,都有些一筹莫展。
林如意坐在一旁,安静地整理着分配给她的可视化图表。
听着他们的讨论,看着那张熟悉的、让她在商业数据中处理过无数次的“长尾分布图”,
她的手指无意识地在桌面上轻轻敲击着,这是她思考棘手问题时的小习惯。
眼看两人就要在一个并不算复杂的问题上耗费大量时间,一种源于顶尖管理者效率本能的不耐烦,
混合着对技术问题的纯粹专注,让她几乎忘记了伪装。
“为什么不试试Box-Cox变换?”
一个清晰、冷静,甚至带着一丝不容置疑的笃定的声音,打破了沉默。
陆子明和赵伟同时一愣,齐刷刷地转过头,看向声音的来源——林如意。
她似乎也意识到自己失言了,眼神闪过一丝慌乱,但很快被她压下。
她没有抬头,目光依旧落在自己的笔记本上,仿佛刚才那句话只是随口的自言自语,但语气却不由自主地带着解释的意味:
“缩尾太粗暴,会损失极端情况的信息,而学术创新往往就藏在极端里。
分位数变换确实好,但对于我们这个阶段的数据量和任务来说,有点杀鸡用牛刀。”
她顿了顿,语速不快,却每个字都敲在点子上:
“Box-Cox变换能找到数据到正态分布的最优幂变换,能更好地压缩分布的长尾,同时保留数值间的相对关系。
它有一个参数λ需要确定,可以用最大似然估计来优化……这,这应该比你们刚才讨论的方法,更合适一些。”
说完这番话,研讨室里陷入了比刚才更深沉的寂静。
赵伟的嘴巴微微张开,看着林如意的眼神像是第一次认识她。
Box-Cox变换?最大似然估计优化λ?这是一个在课堂上支支吾吾、连基础概念都说不清楚的“学渣”能脱口而出的东西?
陆子明心中的震撼远比赵伟更甚。他清楚地记得她之前在霍奇骏课堂上的
“愚笨”表现,与此刻这个思路清晰、一针见血地指出最佳技术路径的女孩,简直判若两人!
她不仅知道这个方法,甚至精准地分析了其他方法的劣势和这个方法的优势及实现关键!
那不是死记硬背能得来的知识,那是建立在深刻理解之上的、一种近乎本能的技术选型能力和工程权衡思维。
“林……林如意,”赵伟结结巴巴地开口,“你……你怎么懂这些?”
林如意的心猛地一跳,暗叫不好。她强迫自己抬起头,脸上努力挤出一个有些僵硬、带着羞怯和不确定的笑容:
“我……我前几天在图书馆,偶然翻到一本讲特征工程的书,上面正好提到了这个……我,我就是随便说说,不一定对的……”
这个解释苍白无力。
陆子明深深地看了她一眼,没有戳穿。
他转过头,对还在发愣的赵伟说:“就按林如意说的试试。赵伟,你查一下Scikit-learn里Box-Cox变换的API,我们马上实现。”
“哦……好,好的!”赵伟从震惊中回过神,立刻开始操作。
陆子明则重新看向林如意,目光复杂,里面充满了探究、疑惑,以及一丝更加坚定的欣赏。
他将一杯温水推到她面前,声音温和却意有所指:
“谢谢你,如意。你帮了我们大忙。”
“有时候,‘偶然’看到的知识,恰恰能解决最关键的问题。你的……直觉,很准。”
林如意接过水杯,指尖微凉。她知道,陆子明不是霍奇骏,他不会用冰冷的审问逼迫她,
但他那双温和的眼睛,仿佛能看透她层层包裹的伪装,看到下面那不安分的、闪烁着智慧光芒的灵魂。
她低下头,小口地喝着水,心中五味杂陈。
又失控了。
在陆子明和赵伟面前,她辛苦维持的“平庸”面具,因为一个技术问题,再次裂开了一道缝隙。
而这一次,目睹这一切的,是两位对她抱有善意的同学。
这道缝隙,是会很快愈合,还是会越来越大,最终让她无所遁形?
她不知道。
她只知道,在真正属于她的领域里,要完全隐藏自己的光芒,比她想象中要困难得多。
而陆子明那探究的目光,也让她意识到,在这个校园里,她需要警惕的,或许并不仅仅是一个霍奇骏。