介绍
近年来,区块链技术席卷全球,彻底改变了我们交易资产、管理数据和执行协议的方式。区块链最初由中本聪(Satoshi Nakamoto)为加密货币比特币开发,现已被应用于各种数据管理领域,例如简化汇款流程、增强食品可追溯性、保护电子健康记录、保护基因组数据隐私、训练人工智能、加强网络安全、应对气候变化以及支持临床试验(Chapron,2017 年;Grishin 等人,2019 年;Howson,2019 年;Wong 等人,2019 年;Krittanawong 等人,2020 年;Reina,2020 年)。
区块链是去中心化的、仅可追加的账本。它并非由一个中心化实体(例如银行)控制整个账本,而是由多方(节点)组成网络,维护同步、分布式且完全相同的记录。去中心化设计能够在单个节点丢失时保障账本的完整性。账本由存储数据(例如金融交易详情)的区块组成,并按时间顺序链接起来,形成一个隐喻性的区块链。区块链的仅可追加设计确保了账本的完整性、可追溯性,并且几乎防篡改。
尽管区块链已在众多行业中得到应用,但从未被用于直接研究生物机制。目前,区块链技术在生物学和医学领域的应用仅限于一些边缘应用,例如存储测序数据或防止临床试验数据被篡改。尽管计算生物学中长期存在的问题与区块链所解决的问题相似,但该技术从未被用于解答基础生物学问题。本文提出了一个利用区块链技术探索生物机制的概念框架。本文探讨了如何将去中心化、同步性、不变性和合约等原则应用于癌症进化和合成生物学。
去中心化账本与癌症演化建模
区块链的严格记录功能可用于探究癌症进化和谱系追踪。癌症的克隆进化表现出与区块链惊人相似的特征(图 1A)。癌细胞克隆以逐步、连续的方式累积遗传和表观遗传改变,在整个生长过程中受到达尔文式的自然选择。克隆结构涉及创始突变,例如急性淋巴细胞白血病中的ETV6-RUNX1融合,这种突变会驱动克隆扩增和随后的多样化( Greaves and Maley,2012)。将账本定义为癌症的完整历史,这个关键起源可以用区块链的创世块来表示。每个区块中的数据集都包含癌症状态随时间变化的快照,理想情况下是完整的单细胞组学特征。因此,将新区块附加到账本相当于将癌症状态的更新快照添加到癌症历史记录中。添加新区块至关重要,因为癌细胞不断受到动态进化压力的影响,包括资源竞争、微环境限制和治疗干预(Ferrando and López-Otín, 2017)。可以通过将每个细胞视为单独的节点并将连接视为细胞间关系来实现去中心化。重建分类账需要整合单个细胞的内在组学及其所有细胞间关系。在这个模型中,尽管细胞间存在异质性,但它们在重建癌症历史分类账方面是同步的。鉴于在表征细胞间通讯方面计算能力的显著进步,建立节点连接是现实的(Efremova et al., 2020)。
如何保证新添加的区块是癌症状态的准确更新快照?区块链的加密哈希和工作量证明机制可以保证进化轨迹得到忠实记录(时间、谱系和组学准确性)。加密哈希函数是单向函数(输入只能通过反复试验确定,而不能从输出中理性地确定),它将任意数据集映射到固定值,例如一串二进制数字。每个区块都包含前一个区块的哈希值及其自身唯一的哈希值,该哈希值是其固有数据和前一个哈希值的函数,从而实现仅可追加的链。加密哈希函数可以将单细胞组学特征映射到癌症的降维指纹。鉴于单细胞组学数据多模态整合计算方法方面取得的实质性进展(Efremova 和 Teichmann,2020),这种处理是现实可行的。区块的线性组织确保了在区块间时间范围内,癌症任意特征的变化(例如特定细胞信号通路的通量)可以通过比较区块“ n +1”和区块“ n ”的内容来确定。工作量证明规定哈希值需要满足某些条件,因此由于加密哈希函数的单向性,需要以暴力计算作为添加新区块的先决条件。由于调整哈希条件会调整添加新区块的难度,因此工作量证明可以确定区块间时间范围并调整癌症病史的时间分辨率。
通过建立高保真度的癌症史,癌症进化的区块链模型可能成为回顾性谱系追踪的有力模型。回顾性地重建细胞谱系信息对于理解人类疾病非常有价值,因为无法通过实验操作(Baron and van Oudenaarden, 2019)。自然发生的突变,如拷贝数变异、单核苷酸变异、LINE-1 转座、微卫星突变和线粒体 DNA 突变,可以作为内源性谱系条形码(Woodworth 等人,2017),这可以作为重建癌症史区块链的起点。将区块链模型与探测生物记忆的当前遗传方法(如 MemorySeq(Shaffer 等人,2020))相结合,可以扩展回顾性谱系追踪的全面性和实用性。
智能合约和生物布尔逻辑门
智能合约使区块链成为一个极具吸引力的平台,可用于为生物系统编码布尔逻辑门。智能合约最初由 Nick Szabo 提出,最终由 Vitalik Buterin 与以太坊区块链集成。智能合约是一种在满足特定条件后自动执行的协议,并具备区块链的所有基本特性,例如去中心化、不可篡改和有效性。例如,无需聘请房地产经纪人,区块链上的智能合约可以通过一份不会丢失或被欺诈性更改的协议自动处理房产出售。
智能合约和布尔逻辑门都具有条件性的核心原则。布尔逻辑将逻辑运算符(例如与 (AND)、或 (OR)、非 (NOT) 和异或 (XOR))应用于二进制值(真和假或 1 和 0)。智能合约通常使用过程式语言 Solidity 进行编程。过程式语言逐步概述了流程的执行方式,而声明式语言则定义了必须达到的目标。人们已做出巨大努力转向声明式编程,以创建基于逻辑的智能合约,这些合约比传统智能合约更不容易出错且歧义性更低(Idelberger 等人,2016 年;Hu 和 Zhong,2018 年)。
随着对分子机制和信号通路认识的快速增长,布尔逻辑门为建模复杂网络和提取相关生物关系提供了一种强大的方法(Morris 等人,2010 年)。除了建模和分析之外,布尔逻辑门对于合成生物系统和网络也是不可或缺的,具有广泛的应用,例如生物传感、制药和生物燃料(Khalil and Collins,2010 年)。布尔逻辑门由各种合成 DNA、RNA、蛋白质和感光分子实验编码(Miyamoto 等人,2013 年;Erbas-Cakmak 等人,2018 年)。重要的是,布尔逻辑门控促进了高度特异性和选择性疗法的开发,特别是单克隆抗体和嵌合抗原受体(CAR)T 细胞。基于磷酸化和非磷酸化状态之间的二元切换的条件功能 AND 门控抗体已经合成(Gunnoo 等人,2014 年)。多抗原靶向 CAR-T 细胞可以经过设计以表现出 AND、OR 和 NOT 逻辑门控,目的是限制抗原逃逸和毒性(Han 等人,2019 年)。
布尔逻辑门是合成生物学的核心,基于逻辑的智能合约为生化电路建模提供了一种新颖的计算方法。合成生物电路的核心组成部分是测定输出和性能,这通常是通过检测荧光报告基因来实现的(Brophy and Voigt, 2014)。然而,荧光报告基因具有局限性,例如需要人工过表达和易受蛋白质降解的影响。此外,编码更高级的输出(例如振荡,这需要抑制剂的共同表达(Gilad and Shapiro, 2017))并允许多路复用可能具有挑战性。由于智能合约可以消除第三方确认,因此基于逻辑的智能合约可以消除对单个生物布尔逻辑门下游的单个报告基因的需求,并将验证负担转移到基于区块链的全局报告基因(图 1B)。对生物布尔逻辑门正常运行的信心可以归因于对区块链的信任,例如,区块链可以设计为特定细胞状态的分类账。这种简化对于复杂网络而言非常有价值,并可能有助于设计动态和多路复用电路。正如近期利用机器学习算法设计基因电路的进展所证明的那样(Hiscock,2019),区块链等计算方法应与实验技术相结合,以最大限度地发挥合成生物学的能力。
讨论
区块链技术仍未得到充分开发。本文概述了“区块链生物学”的两种应用,即将区块链原理应用于直接研究和模拟生物机制。具体而言,本文提出了基于区块链的回顾性谱系追踪和多路复用生化回路监测。要将区块链技术推进到功能性计算生物学范式,仍需大量开发。例如,哪些数据应该放在链上,哪些应该放在链下?现有的实验方法将如何为生物学中的区块链模型提供信息?除了扩大区块链原理可应用于的生物学环境范围外,重要的方法开发也至关重要。从工作量证明与权益证明,到解决可扩展性的闪电网络,区块链基础设施的众多可能性已由多种形式的加密货币清晰地展现出来。对于区块链的巨大潜力而言,生物学仍然是一个未知领域,一个成熟的未来,值得逐步构建。
在中国点燃DeSci运动!
X: https://x.com/DeSciChina01。
TG: https://t.me/+5nvOutnXRJ44NDll 。
DC: https://discord.gg/amTF5umWdT。
微信: