AI驱动化学研究变革

2023-10-23 10:21:19 来源: 瞭望 2023年第43期

  

中国科学院院士杨金龙

“物质世界丰富而复杂,要研究物质转化的内在规律,仅靠化学家在实验室解析表达远远不够。对重要化学问题开展研究还需要发展新理论和新方法。”随着人工智能技术的加持,精准智能化学曙光已现

在化学合成中,AI驱动的机器人平台已经能够在数天内完成原本数十年的实验任务,极大地提升了化学研究的速度和精度

单分子器件通过分子对外加刺激的响应来工作,通过施加电压或光照,可以改变分子内部的电荷分布或触发其特定振动模式,从而调控其导电性、光学特性等,实现所需功能

  文 |《瞭望》新闻周刊记者 扈永顺

  

  当前,化学科研范式正在发生一场深刻变革。

  化学是研究物质变化的一门科学,主要目的是创造物质和控制物质的转化。传统化学研究中,科研人员要在实验室用各种试剂通过不断试错研发出新材料。计算机技术的迅猛发展和广泛应用,加速了化学研究蓬勃发展。

  “物质世界丰富而复杂,要研究物质转化的内在规律,仅靠化学家在实验室解析表达远远不够。对重要化学问题开展研究还需要发展新理论和新方法。”中国科学院院士、中国科学技术大学副校长杨金龙告诉《瞭望》新闻周刊记者。

  计算机的计算和模拟能力,能够对化学反应的过程进行理论预测和实验解释。而随着人工智能技术的加持,精准智能化学曙光已现,化学研究将更加“智能”。例如合成一种催化剂,依靠人工实验不可能穷尽几千万种材料实现催化剂的最佳比例合成,但采用智能计算的方法就可以在各种化学元素中筛选出合适的配比。

  精准智能化学研究能够实现高度可控、可调、可预测、更高选择性、更高精度、更高效、更经济以及更加环境友好的成果,进而推动测量科学、可持续材料、信息材料、药物、能源、环境科学和其他化学及化学相关领域的发展和创新。近年来,杨金龙率领团队在新型功能材料的设计与模拟、表面单分子量子行为的表征与调控等方面取得了原创性和系统性成果。

  “在AI技术快速发展的驱动下,我们有理由期待在化学研究领域涌现出更多的创新成果。”杨金龙说。

  精准化学是未来化学发展重要方向

  《瞭望》:你是如何理解精准化学这一概念的?

  杨金龙:精准代表了化学领域未来的研究方向,它强调过程和结果的可控性、可预测性和准确性。

  首先,要在化学研究中获得更加精准的科学数据。一是理论计算模拟需要能在使用尽可能少的计算资源的情况下模拟得到复杂化学体系的电子结构以及动力学行为。二是需要发展先进的表征技术对分子体系在原位工况条件下进行高精度的表征实验。这样,我们才能获得精准的化学数据,在此基础上构建更加真实、准确的物理化学模型,理解更加复杂的内在规律。下一步,通过对复杂规律的理解,提升我们对化学反应路径以及分子性质的精准控制能力。从精准的化学数据到精准的调控能力,是精准化学的内涵所在。

  近年来,已报道的围绕精准化学的前沿研究成果越来越多。今年,我担任创刊主编的新刊《精准化学》已正式出版,希望能为研究工作提供一个交流平台。

  《瞭望》:如何才能提高化学研究的精准化水平?

  杨金龙:提高化学研究的精准化水平是一个复杂且多层面的任务。为此需要从以下方面持续努力:

  一是发展高效的精准理论方法与程序。为了获得分子体系精确的能量以及性质,所需的计算量随分子尺寸的增大指数增加。因此在实际计算模拟中,通常会引入各种近似值,但这些近似值对某些体系会带来严重的误差。为此,需要发展新的方法,在可以承受的计算资源条件下获得尽可能精确的计算模拟结果。

  量子计算机的出现有望为这一方向带来突破性的进展。量子计算机能够大幅提高电子结构计算的效率,我们在这方面已有布局:一方面,积极发展计算方法,将现有的普通超算方法“移植”到量子计算机上,为量子计算机时代的量子化学打好基础;另一方面,寻找一个特定体系,即那些在经典计算机上做不了或非常难解决的问题,在量子计算机上能很快解决,为未来量子计算机在材料领域的应用奠定基础。

  二是发展工况条件下的精准表征方法。为了从实验上获得原子尺度的精准化学细节,通常需要超低温、超高真空的条件。而真实的化学过程往往发生在常温常压甚至高温高压下。发展新的表征手段,在工况条件下获得尽可能多的关于体系结构、性质与动力学行为的数据是精准化学的重要目标。

  三是发展智能化学方法。人工智能目前已经广泛应用于科学研究的方方面面。从大数据中产生化学智能,是实现精准化学目标的关键。在理论模拟和实验表征获得大量精准的数据以后,需要从这些数据中提炼规律、产生化学智能,进而实现对化学过程进行精准调控。

  总结而言,提高化学研究的精准化水平是一个综合性的挑战,需要我们在多个方面进行努力和创新。通过这些策略,我们不仅能够更精准地进行化学研究,同时也为化学领域的进一步发展奠定坚实的基础。

在北京举行的 2023 中国科幻大会科幻产业新技术

新产品展中展出的智能量子计算机 MOSS(2023 年 5 月 30 日摄)陈钟昊摄 / 本刊

  从大数据中产生化学智能

  《瞭望》:人工智能将对精准化学研究带来哪些改变?

  杨金龙:随着人工智能与大数据技术的发展,AI for Science已开始在诸多科研领域发挥重要作用。对于化学尤其是精准化学研究,AI技术也将带来重要影响,无论是在新材料发现、模拟准确性、合成路径优化,还是在实验自动化方面,它都在推动着精准化学的进步。

  一是提高计算模拟的准确性。AI可以在计算模拟中起到加速器的作用,特别是在处理电子结构中的复杂相互作用时。传统的电子结构计算需要大量计算资源,而AI通过神经网络和其他机器学习技术,能够在短时间内给出更准确的模拟结果。同时,复杂AI模型强大的表达能力可以用来进行波函数高效采样,得到体系精准的能量和性质。

  二是促进化学合成路线的智能优化。化学合成路线的选择和优化涉及诸多变量,从原料、反应条件到设备选择。AI能够从海量文献和实验数据中,挖掘出最佳合成路线,预测最佳反应条件,从而降低成本,提高研究效率。

  三是实现实验室操作的自动化和高通量筛选。结合机器视觉和AI技术,实验设备可以实现智能化操作,提高实验效率。尤其在化学合成中,AI驱动的机器人平台已经能够在数天内完成原本数十年的实验任务,极大地提升了化学研究的速度和精度。

  四是加速新材料的研发。传统的材料研发往往基于试错法,费时费力。而AI能快速检索、分析数以百万计的化学数据,提供材料性质的预测,并推荐潜在的新材料。这种智能化筛选模式将提高新材料的发现速度和精确性。

  《瞭望》:怎样构建基于大数据的精准智能化学系统?

  杨金龙:为构建基于大数据的精准智能化学系统,我们需进行以下工作:

  第一,精准收集与整理数据后,进行数据清洗与质量控制。首要任务是系统地收集化学数据,涵盖反应条件、产物特性、材料性能等;其次,源于文献、实验日志、仪器记录或计算模拟的数据,需经过筛选、整理和标准化,方便后续操作;再者,原始数据往往混杂有误差或缺项,数据清洗、异常值处理、缺失值填补和错误纠正都是确保数据质量的必要步骤。

  第二,构建高效的数据存储与管理系统,提高数据的安全性、可靠性和快速检索能力,同时要考虑数据的备份及恢复机制。

  第三,构建精准化学人工智能大模型。首先要将数据转化为易于模型处理的形式,选取数据中的关键特征降低问题的维度,从而大幅提升模型性能,并减轻计算任务。其次,根据研究目标,选择适合的机器学习或深度学习模型。随后,利用已整理的数据进行训练,并调整模型参数以追求最优效果。再者,系统地评估模型效果,利用独立测试集检查模型的准确性和泛化能力。若模型表现未达预期,应根据反馈调整并持续优化。

  我们现在正在构建一种大参数模型,严格求解薛定谔方程。一旦求解出薛定谔方程,便可了解微观物质的性质。换句话说,就可以知道化学反应的结果,这是一项激动人心的工作。

  第四,进行精准智能化学系统的持续学习与迭代。化学研究是一个不断进化的领域,建立的精准智能化学系统应具备持续学习能力,能够吸收新知识、更新数据和模型,保持其准确性和前瞻性。

  综合看来,精准智能化学系统的构建涉及从数据采集到模型优化的全流程。这不仅要求对数据的严格处理和模型的精心选择,更需要保障数据的安全和系统的持续更新。只有这样,才能在精准化学领域真正实现智能化研究,持续推动科研进步。

  探索分子世界的奥秘

  《瞭望》:你带领团队在单分子器件研究方面走到了世界前列,单分子器件是如何工作的,与我们现有的器件工作原理有哪些不同?

  杨金龙:集成电路的器件如今已经做到了几个纳米的尺度,但站在量子力学的角度,这些器件尺度的最终极限是单个分子甚至单个原子。单分子器件由单个分子构成,其功能由该分子的属性决定。例如,我们可以利用特定有机分子的光电特性来打造光电器件,或使用分子的磁学特性来构建磁存储器件。一般说来,单分子器件通过分子对外加刺激的响应来工作,通过施加电压或光照,可以改变分子内部的电荷分布或触发其特定振动模式,从而调控其导电性、光学特性等,实现所需功能。

  为了调控单分子器件的性能,需要对分子的性质以及响应行为有深刻的理解,这是单分子科学的研究内容,通常需要进行高精度的理论计算模拟和实验表征来开展研究。经常使用的仪器设备包括扫描隧道显微镜(STM)和原子力显微镜(AFM)等,可以对单个分子进行高精度成像和操作。

  与传统器件相比,单分子器件的独特之处在于其灵活的可调控性与多样性。现有的器件,虽然尺寸越来越小,但还是利用的半导体材料的体相性质,因此其工作原理不随尺寸变化。而单分子器件的工作原理由分子本身的性质决定。原则上可以设计出许多原理各异的单分子器件。同时,单分子器件也更容易实现多功能集成。

  总之,单分子器件因其独特的工作原理与广阔的应用前景,为我们提供了深入探究物质行为和开发下一代纳米技术的机会,对未来的科学研究与技术应用均具有深远意义。

  《瞭望》:你带领团队在单分子器件研究方面取得的成果将来会产生哪些应用?

  杨金龙:自2001年以来,我们团队在单分子器件研究中取得了一些突破,这些研究除了帮助开发新型单分子器件外,还加深了我们对分子体系的理解。

  首先,我们成功地“拍摄”出能够分辨碳60化学键的单分子图像。碳60是一种非金属单质,化学式为C60,是由60个碳原子构成的分子,这是世界上首次直接观察到分子内部结构的尝试。随后于2005年,我们利用STM针尖对吸附于金属表面的钴酞菁分子进行了“单分子手术”,这一创新手段使我们成为首个实现对单分子自旋态控制的团队,大大拓展了人们对分子体系进行操控的能力。2013年,我们再次刷新纪录,实现了亚纳米级分辨率的单分子光学拉曼成像,实现了高空间分辨和化学分辨的结合。

  除了这些显著的技术突破,我们团队也始终致力于发展新的理论和方法。在新概念方面,我们引入了双极磁性半导体,可以在此基础上通过电场控制自旋极化方向,为实现利用自旋自由度的电子学器件的发展提供了新的方向。

  此外,我们还开发了电子结构计算新程序,在国产“神威·太湖之光”超级计算机上首次实现千万核心并行第一性原理计算模拟,随后在“海洋之光”上实现了二百五十万原子的电子结构计算。这相当于给科学家提供了一个强大的计算模拟工具,可以更准确地研究材料的性质和行为。理论计算方法还可以用来进行新药研发、材料设计以及复杂化学反应网络分析等,有望在药学、材料科学、催化技术、信息技术及能源转换等领域提供新的研究视角和强大工具。