与其给AI喂数据,不如教AI学科学
物理学界有一个广为流传的笑话,仿佛诉说着自然界的一切奥秘似乎早已被揭示,并发表在某个遥远的苏联期刊上,只是我们尚未知晓。尽管这听起来有些夸张,但这个笑话却精准地反映了当前知识的状态。知识的海洋已经无比庞大,且正在以惊人的速度膨胀。以全球最大且应用最广的论文预印本网站arXiv为例,仅2021年,发表的科学论文数量预计超过19万篇,而这仅仅是科学文献的冰山一角。
显然,我们并不清楚自己究竟知道多少,因为我们所处的领域只是知识海洋中的一小部分。除了期刊论文外,还有博士论文、实验笔记、幻灯片、白皮书、技术笔记和报告等等堆积如山的文献。在这海量的文献中,隐藏着许多问题的答案、被忽视或遗忘的重要发现以及潜在的联系。
人工智能为解决这一问题提供了潜在的可能。如今,算法已经能够独立分析文本,挖掘词句间的联系,进而推动知识的发现。如果我们不改变几百年来的传统科学写作方式,就很难取得更大的突破。
尽管文本挖掘面临诸多挑战,如获取全文和法律问题,但其最大的难题在于人工智能对概念及其关系的理解仍然有限。行业内的文本挖掘技术面临着数据的偏差问题,例如所选择分析的论文的偏向性。对于人工智能来说,理解科学论文是一项艰巨的任务,即使对于非专业的人类读者也是如此。每个学科的专业术语差异巨大,一个词汇在不同领域甚至可能有截然不同的含义。这使得全面检索相关文献变得困难重重。
鉴于此,我们需要使科学文献更加计算机可读,并用一种特定的编程语言重新编写它们,也就是要用一种机器可以理解的语言来“教”它们科学。这一过程的乏味和枯燥都是暂时的,但它具有可持续性。新的概念可以直接添加到机器可理解的库中。随着机器学习的科学知识增多,它们可以帮助科学家组织逻辑论证,发现错误、矛盾、抄袭和重复,并揭示不同知识间的联系。真正掌握科学的机器将在未来成为人类科学家的重要助手。
数学家们已经开始这一跨学科的尝试。他们使用Lean语言编写定理和证明来“教学”计算机数学。Lean是一种辅助证明语言,能够以对象的形式引入数学概念。它可以根据已知对象判断语句的正确性,从而帮助数学家验证证明并发现逻辑漏洞。随着Lean吸收的数学知识不断增长,其能力也将越来越强。帝国理工学院的Xena项目致力于将本科数学课程的所有知识输入Lean系统。未来,这种辅助证明工具或许能验证逻辑、检索知识并帮助数学家进行更深入的研究。
虽然将Lean语言应用于其他学科更具挑战,但许多学科如STEM领域都有潜力采用这种方法。我们可以定制类似于Lean的语言,融入特定领域的独特特点。科学概念的定义比数学更为复杂,需要背景知识、直观表达和解释。这正是为什么量子力学虽有明确的数学表达,仍需要无数论文和教科书来解释的原因。将科学的这些微妙之处传授给机器是一项挑战,但最终目的是帮助人类科学家改进并完善这些微妙之处,更清晰地表达它们。机器可能会更准确地理解和解释这些科学概念,尤其是当这些概念与人类直觉相悖时,机器可以更好地将它们与背景相结合进行解释。
随着人类与机器共同掌握的这种新语言的发展,各领域专门的词汇库可能会逐渐出现。虽然目前我们尚未拥有这种语言,但当这项技术成熟时,它的市场潜力将是巨大的。Xena项目已经证明,互联网原住民可以快速学习这种新语言,即使他们没有先前的编程经验。对于某些科学家来说,这种语言甚至可能比写英语散文更为直接有效,因为英语并非他们的母语。这将帮助他们更好地组织和表达思想。解释器可以将Lean语言翻译回数学或其他语言,就像将一种新语言翻译成英语或其他任何熟悉的母语一样。
将现有的大量知识翻译成机器语言是艰巨的任务也是巨大的挑战但也并非遥不可及的目标。从互联网到arXiv等预印本服务器科学家们不断发明共享知识的新方法这为将科学知识翻译成机器语言铺平了道路因此让每位科学家为构建机器可读的科学知识库做出一点贡献并非遥不可及的幻想随着技术的不断进步本科课程的知识也可以被传授给机器包括那些看似晦涩难懂的领域知识逐渐转化成为可传授的知识财富并持续为人类研究事业提供强大的助力与支持实现人类与机器的相互理解与沟通成为科技进步发展的必经之路为科学研究事业的进步添砖加瓦!互联网的诞生(World Wide Wed),其初衷是为了促进全球范围内的科学信息共享与交流。这一宏伟目标的实现,不仅需要众多研究人员的集体努力,也需要投入大量的时间和金钱。面对日益增长的庞大科学知识库,我们亟需探索新的方式来提高效率,避免在重复已知的道路上浪费宝贵的时间和资源。
在这个过程中,研究生们扮演着至关重要的角色。他们可以将课题相关的知识输入到互联网的广阔平台中,让全球的科学家们共享这些宝贵的学术成果。而研究者们则可以直接用新的语言撰写他们的研究成果,推动科学进步的步伐不断加快。未来科学的繁荣,将离不开人类与机器的共同合作与努力。在这个充满机遇与挑战的时代,我们期待着人类智慧与机器能力的完美结合,共同推动科学的进步与发展。
人工智能培训
- 与其给AI喂数据,不如教AI学科学
- 未来搜索引擎长啥样?智能化搜索机器人带来的
- 机器换人人去何处职教何为
- 马斯克宣布!xAI将开源聊天机器人Grok,开源与闭
- IDEA大会开启AI思想盛宴 沈向洋理事长发布六大前
- 空客AIRBUS与飞思德携手:虚拟验证技术引领航空
- Intel视角驾驶技术未来趋势与竞争格局分析2025
- 占领欧美草坪,中国割草机器人出海扬帆
- 暂停!银行机器人理财尴尬落幕?
- 碧桂园博智林建筑机器人来袭 建造智能化势在必
- 工业机器人精密减速器技术前沿解析
- 他研自主定位导航芯片 为机器人装“小脑” 百元
- 以后救命靠AI:它已开始颠覆医院 这五个领域首
- 数字经济“灯塔”引路 美云智数落地企业数字化
- 电商大量应用仓库机器人拣货 真会让大量人失业
- 中美巨头纷纷布局AI加速项目,到底这块蛋糕甜在