落基山脉的冬日,将世界简化成了黑白二色,皑皑白雪复盖了每一寸山岩与树林。
查尔斯那间隐于山间的木屋,烟囱里持续飘出缕缕轻烟。
木屋内与屋外的酷寒截然不同,壁炉里的火焰欢快地跳跃着,燃烧的松木发出啪的轻响,将跃动的橘红色光芒铺满整个房间,也在查尔斯专注的脸上投下明明暗暗的影子。
他坐在壁炉前一张宽大的铺着厚实狼皮的扶手椅里,膝上摊开着那本公司用的通信笔记本。
此刻,纸张上浮现出的不再是墨水字迹,而是象素画一般的佩内洛的面容投影。
可视通话这个项目测试了很久,但问题不断,画面卡得厉害,声音也时断时续。
“————基本情况就是这样,查尔斯。”
“乌摸————里奇教授,在获得了部里的[杂音]授权后,对梅林系统提出了新的功能须求。”
“她希望系统能够增加一个————作业抄袭判定的功能。”
查尔斯无奈地用回文本对话模式,让她重新汇报。
很快,佩内洛重新汇报,乌姆里奇需要梅林系统安装一个功能。
“可以。”查尔斯回复道,“增加查重功能,在技术上是可行的。
“你回复她,我们会进行开发。”
“原则是,想速度快,得加钱。”
查尔斯发送消息之后,静静地靠在椅子上,炉火的光芒在他深邃的眼眸中跳动,拿起一旁碟子里几颗红宝石留下的坚果,边吃边思考。
乌姆里奇的目的,埃莉诺早一步告诉他。
对于乌姆里奇会利用系统来巩固权力,他并不意外。
抄袭检测,这本身倒不是一个坏主意,至少从技术角度来看,有其价值。
查尔斯对乌姆里奇的动作不再理会,开始进入具体的技术规划层面。
几个小时后,他心中有了底,下达技术指示。
关于这个查重系统,内核技术原理可以围绕两点构建:
其一,基于字符串比较的连续重复字符数”检测,这是基础,将提交的文本与数据库中的内容进行逐字比对。
并设置一个关键阈值,比如默认连续六个及以上单词完全一致或高度相似,即触发标记,并计入整体重复率。
还需要设置一个专业词组库,像专业术语这类固定搭配,应视作一个独立词汇单位进行计算,避免误判。
其二,基于语义识别的“智能比对”,这是更进阶的层面。
系统需尝试理解句子的内核语义,而不仅仅是表面的字符匹配。
即便用户替换了同义词、调整了语序,若句子的主旨逻辑与原文高度雷同,系统也应有能力识别为“语义重复”。
这项技术更具深度,也需要持续的演进,目标是让简单的、机械性的“同义词替换”伎俩逐渐失效。
“具体的研发工作,交给路易。”查尔斯最后写道,“他在魔法人工智能领域的积累,最适合负责这个模块的搭建。”
他的指示条理分明,既考虑了现实的可行性,也指明了未来迭代的方向。
第二天上班的佩内洛在通信笔记本另一端认真记录着,然后发到技术部门。
任务很快下达至法尔巴顿城堡的内核研发区。
他收到了查尔斯的技术概要,研究了一天,下班前拿起羽毛笔,开始给查尔斯写一封极其冗长,事无巨细的技术沟通信。
信中,他详细探讨了“高度相似”的定义边界,提出了数种构建“专业词组库”的编码方案等内容。
在信件的最后,他的笔锋一转,提出了一个技术之外的问题:“查尔斯,关于我们正在构建的整个魔法人工智能框架,我有些许拙见。”
“此类技术,其应用前景绝不仅限于霍格沃茨的作业审查和菜谱、魔药研究。”
“未来,在诸多领域,必然可以看到它的身影。”
“其潜力,或许堪比当初飞路网的出现,将深刻改变巫师处理信息的方式。”
“鉴于此,我冒昧提议一是否应考虑,将魔法人工智能”相关的研发与业务,独立成为一家新的公司?”
“这有助于更专注地深耕此领域,吸引特定人才,也能在资本和合作层面拥有更灵活的运作空间。”
落基山脉的木屋里,查尔斯读着路易的信,最后脸上露出一丝微笑。
他对路易提及此事并不意外。
当年公司初创时就莫斯、基托夫和路易,再加之多比。
那时只有寥寥数人,怀揣着模糊但激动人心的想法。
如今,公司早已膨胀成一个庞然大物。<