Dent 中文站
你的位置:Dent 中文站 > FLDT中文网 >

[讨论]人类疾病与数学模型


发布日期:2025-01-04 15:50    点击次数:80
恩格斯说:“任何一门学科,只有当数学被引入之后,才能够称之为科学”。从理论上说,任何一种疾病,只要信息量足够多,都可以构建出一种数学模型,具体如细胞的代谢/信号转导通路,各种信息反馈模式,蛋白质互作等等……这些信息的积累,有助于疾病数学模型的建立。那么为什么要建立数学模型呢?建立数学模型有助于对疾病发病机制进行深入的研究,有助于疾病发生发展过程中的整体性思维的建立,有助于寻找新的药物作用靶点……但是数学建模也很复杂,是否能够完全体现复杂的生命现象?值得我们讨论。好难,但是还是得作很多疾病连动物模型都建不起来,人类所知道的这个信息量用来做数学模型就更难了。如果能够有某种疾病的数学模型能够被创造出来,估计也不太会是一元的和线形的数学范畴。难度好大啊!很多动物模型的疾病和人类疾病的差异也很大,虽然增加了信息量,但客观上也增加了数据的处理难度。数学建模常用的方法有什么?ppxx wrote:很多疾病连动物模型都建不起来,人类所知道的这个信息量用来做数学模型就更难了。如果能够有某种疾病的数学模型能够被创造出来,估计也不太会是一元的和线形的数学范畴。难度好大啊!生物体本身就是多元的非线性系统,其系统行为是生物体内各种分子相互作用“突生”出来的一种新属性,是无法从系统的各个组成部分的孤立行为中预测出来的;在生物体不同层次之间的行为不能进行简单的线性递推。也就是说,整体大于部分。数学模型的建立的确很难,但我感觉是一个趋势。我对这个问题很悲观,我对人类能否最终完全彻底的认识自己也很悲观。当然,如果真能这样,把一堆堆分子加起来就是一个人了。我还听说一种说法,什么都可以称得上是科学,唯独数学不能。它是用自己制造的规则自己转自己应邀来灌水,hehe。园主的思想可以算作是"老歌新唱"了在生物医学问题中引入数学模型应该说是长久以来的努力,尤其是在数量遗传学和生物数学领域,起源于上上个世纪了。上个世纪初,随着控制论系统论和信息论的相继提出,贝塔朗费、维纳等人开始了新的尝试,同时,以薛定谔为代表的物理学家们也加入了这个行列,希望能从生命现象中抽象出的数学物理模型中找到生命问题的答案,并期待着能从中寻找到新的物理学基本定律。从现在的观点和角度看,事实上,在当时分子生物学还没有建立起来,对于生命在分子水平上的认识还无从谈起的时候,这种努力在很大程度上无疑是徒劳的,但是这些尝试对于今天我们对这一问题的理解显然是有着深远影响的。之后,作为这种影响的一个层面的体现,HGP等一系列sequencing project的提出将生命科学全面推入了一个基于序列的时代,似乎突然之间核心问题变成了4进制和20进制两种编码方式的解读。正是这种最简化的模型将数学和信息科学运用到了前未所有的程度,也宣告了一个崭新的学科的诞生。从统计学、机器学习理论中直接借用的数学模型都获得了极大的成功,比如HMM、SVM、NN、BN、WL、RS等等等等,同时,由这些模型衍生出的算法及其实现使得计算机成为这一领域最重要的工具。于是,才有了今天的电子克隆,序列分析,结构预测,网络模拟(代谢、信号、互作)等常规方法和工具(当然还有待进一步完善发展)。这些无疑都是“大数学”对于生命科学的贡献。以上都是废话,大家原谅。有兴趣可以另题讨论。回到正题。园主提出的问题,建立可预测的疾病模型,在我个人看来是更高一个层次的命题了。我说的不是宏观上的,比如用回归分析等建模预测SARS在人群中的传染发病与流行,而是对于个人或者一类人群,通过对一维的遗传背景的分析,构建出四维的疾病“整体”模型。这无疑是一个极大的挑战,某种程度上可以说是一个“终极命题”,呵呵。我们都知道生命体是一个“巨系统”,在微观的混乱中却展示着宏观的秩序,类似于混沌系统,甚至复杂性还要高。对于混沌系统中的例如湍流问题,限于计算能力,对大一点的体系目前物理学中还没有很好的数学方法加以预测,类比到生命体,生物大分子的动态结构乃至蛋白质的折叠都属于这一类问题,目前是无法通过de novo的方法解决的,而这个问题在某种程度上又决定了生物大分子互作网络模拟的可行性,而互作网络可能又是建立整体模型所必不可少的。。。。:)那是不是说可用的疾病模型就无法建立了呢?当然不是。模型的本质是简化对象减少变量。由于生命系统的复杂性,使得算法实现很容易陷入NP困境,而过度的简化会导致计算结果偏差太大而失去意义,那么如何在计算量和结果的分辨率之间找到可接受的平衡点就是构建模型的关键了。对于这种模型的建立,据我所知,目前有这么几个方向的进展。一、基于知识的方法。建立数据库;对于疾病模型而言,就是大量收集病例,将基因型如SNP和mutation和疾病表型(四维的)对应起来,还包括组织病理切片,表达文库,芯片数据等等。然后将特定的病例与之对照并通过公式拟合。优点是对疾病的发病机制不需要太深入的研究,缺点是模型不具备可演绎性,也就缺乏理论意义。我所知道的对于caner,NIH有这么一个项目。二、半基于知识的。建立在对疾病发病机制很深入研究的基础上的,根据疾病相关核心基因/蛋白所参与的代谢、信号通路及互作网络,结合他们的时空表达等特性,构建从疾病的发生器到效应器的global network,从而预测其中任意的变化对整体的影响。对于diabetes疾病模型目前好像正在建立之中,模糊数学的方法在这种模型中起到了很关键的作用。三、其他方法。就是类似E-CELL和虚拟人计划,比较复杂,还处在理论阶段,暂时很难有大的进展。展望(终于写到这里了,累死偶了,hehe):对于单细胞乃至生命体内全组分的精确模拟在可以预见的将来将是一件“impossible mission”,但是在对分析的定量性以及定性分析结果的分辩率的要求不十分高的情况下,我们还是可以获得一些有价值的模型。比如对于一种疾病特定的基因型,可以预测该患者大约何时发病,可能有什么程度的表型,疾病的发展,选取什么治疗靶点、何时使用何种药物、何种治疗手段最有效,疗效评估。。。当然还远远不止这些。在这些模型的构建过程中,目前的主要的方法还是采用多元非线性系统近似划归线性规划的思路,常用的数学方法有贝叶思网络,吉布思统计,多元回归以及模糊数学的一些方法。由于生物系统具有良好的鲁棒性,如果选取的体系合适,应用现代控制理论例如鲁棒控制将可以很好的实现模型的简化完成定性或定量的分析,而针对非线性系统的控制也正是这一理论目前的研究热点。何毓琦先生(哈佛大学教授,美国工程院院士,中国两院外籍院士,国际控制界权威)认为bioinfor将是控制理论领域的有一个突破点,是相当有远见的!icesugar75 wrote:我还听说一种说法,什么都可以称得上是科学,唯独数学不能。它是用自己制造的规则自己转自己的确有这种说法,但表述有很多种方式,比如“数学是科学之父”,感情色彩明显就不同了,呵呵。举个例子,欧氏几何只需三大公理即可构造出完备的欧氏空间(当然,还需要所谓的理性或者说逻辑,所以哲学又被称为科学之母),然而所谓公理恰恰是不可证明的。代数学统计学中的许多定律比如极限定律都是不可证伪的,根据karl popper对于科学的定义,数学显然不能算作科学不过这个“名分”又有什么关系呢,数学就是数学。楚布衣 wrote:我对这个问题很悲观,我对人类能否最终完全彻底的认识自己也很悲观。当然,如果真能这样,把一堆堆分子加起来就是一个人了。 “变幻无常的现象徘徊着,你将定于永恒的思想。”您的帖子和您的签名档真是异曲同工,配合的天衣无缝好大的一个坑啊 的确,人类认识自我,特别是意识的奥秘,也许将是真正永恒困扰人类的终极问题。对于我们是否能够真正获得答案至今我也怀疑不已。其实这和人工智能能否自我升级的问题一脉相承,至少在哲学意义上。不过根据图灵机模型,这种自我升级是不可能的,或者说代价是纸带的无穷多。我不知道这是不是机器与人的根本差别。和很多人一样,感情上我无法接受“把一堆堆分子加起来就是一个人了”这种“极端的机械唯物论”,虽然我也找不出实质性的反驳的理由,因为在进化中生命似乎就是这么诞生的。呵呵,好像这种比较抽象的没有证据不能证实的东西,总是有很多人喜欢去想。小宋知道的不少哦,虽然未免悲观了一些。生命系统很复杂,混沌也好,多元非线性也好,尽管不可预测的东西很多,但事物的发展也不是一点规律都没有的。况且我并非想建立可预测的疾病模型(疾病可以预测,但不是我们现在要讨论的),我是希望能够基于已有知识的基础上,整合各种表达谱数据和蛋白互作数据,希望建立疾病发病机制/病程进展的数学模型,也就是你说的前两个方向,但难度也很大,数据的全面性/复杂度/简化度/……,个人感觉方向二是我感兴趣的地方,有时间的话多说些。记得我们的会员有一个签名:“人就是一堆蛋白质”,感受如何?二、半基于知识的。建立在对疾病发病机制很深入研究的基础上的,根据疾病相关核心基因/蛋白所参与的代谢、信号通路及互作网络,结合他们的时空表达等特性,构建从疾病的发生器到效应器的global network,从而预测其中任意的变化对整体的影响。对于diabetes疾病模型目前好像正在建立之中,模糊数学的方法在这种模型中起到了很关键的作用。---请问,在这种预测中,参数的设置很重要,所谓半基于知识,就是说也有未知的东西在里面,那么这种参数该如何设置呢?希望继续讨论下去。我先给园主推荐几篇文献吧,呵呵Gene expression phenotypic models that predict the activity of oncogenic pathways (Nature Genetics; 1061-4036; 20030600 ; 34卷2 期 ; 226-230 页;)Prediction of central nervous system embryonal tumour outcome based on gene expression (Nature; 0028-0836; 20020124 ; 415卷6870 期 ; 436-442 页)Gene expression profiling predicts clinical outcome of breast cancer (Nature; 0028-0836; 20020131 ; 415卷6871 期 ; 530-536 页)这就是近期发表在顶级杂志上的相关文章,很明显,距离园主的想法还有很大一段距离,但是,显然已经很困难了:)目前,整合表达谱数据和蛋白质互作数据的算法还非常的不完善,而且protein interaction主要还是在酵母蛋白质组中完成,相对来说human protein的数据还相当有限,所以在未来的一段时间内希望在人体中统一这两方面的数据进行预测还是有很大难度的,不过在9月这期的nature biotechnology中倒是有人开始在酵母和大肠杆菌中进行类似的尝试。已经下载上述文章,正在阅读,谢谢小宋!我感觉完全可以,数字人.可视人的建立已经充分说明这一点了,任何复杂的东西的是表面的,就象质能定律.那么简单就表达了,现在计算机这么快,完全可以This is a huge topic, which cannot be explained by one or two pages. However, we may introduce different theories to discuss."Disease progression can be defined in terms of changes in disease status asa function of time. Drug action reflects the effect of a drug on disease status.""Natural Disease Progress Models include "linear model" and "Asymptotic Model". A linear natural history model describes a constant rate of deterioration of diseasestatus. The rate of disease progression solely depends on the slope, whereasthe baseline disease status is defined by the parameter S0. Many studies assumea linear rate of disease progression because of the convenience of data analysis. Anasymptotic natural history model describes aworsening of disease status with anexponential time course approaching a steady state. The rate of disease progressiondepends on the progression half-life (TP) whereas the steady state depends on themaximum “burnt-out” disease status (Sss).Both the linear and asymptotic models represent the possible natural historyof disease progression without drug modification. However, these natural diseaseprogress models can be modified by drug treatments, and the modification dependson the type of treatment. In general, each parameter in a disease progress modelis a target for describing drug action."&&&&& "DRUG TREATMENT EFFECTS ON DISEASE PROGRESSION." Annu. Rev. Pharmacol. Toxicol. 2001. 41:625–59基因芯片技术可以说是人类疾病和数学模型相结合的一个很好的例子。芯片最早发表在nature 和science上的文章就是有关疾病的分型的,一个是AML与ALL的区别,另一个是淋巴瘤的分类。都是先得到不同标本的基因表达谱,然后通过计算不同标本间的差异,主要是应用了cluster方法对标本进行分类,这些可以说是人类疾病和数学模型相结合的很好的例子。举AML和ALL的分类来说,作者利用Affymetrix公司Hu6800芯片,通过对38个临床上明确诊断的急性白血病标本进行相邻分析(neighborhood analysis)筛选出50个相关性最强的基因作为预测基因,用于AML和ALL的分类。每个用于预测的基因具有不同的权重(weighted vote),权重的大小与基因的表达水平及此基因在分类中的作用密切相关。对于某个标本来说,当累加的权重超过一定的域值,就将其判为AML或ALL。通过此方法在已知和未知分类的标本中都得到很好的结果。然后通过自组成图 (self-organizing maps,SOM) 将标本进一步细分为AML,T系-ALL和B系-ALL。以上可以看出数学在人类疾病中发挥了多么重要的作用。一事请教microarray, 基因芯片会忽略其他细胞对测试细胞基因表达的调控吗?如果做组织microarray, 会影响实验的真实性吗?思路很好,但具体实现起来可能会有较大的难度,我个人觉得难度在于1、数据量不够,就像天天所说的,临床数据不完整,分子生物学数据太少,两者之间由于来源不同,很难统一;2、模型的建立(黑箱)很关键,主要是根据先验的生物学知识进行建模,但是对模型的模拟和改正可能会有过大的计算量,而且可能不能用现有数据很好的解释,这里可能会有数据质量的问题;3、对于可选的模型,要通过实验来验证,而这个过程也可能会很困难。请问一下,现在是否有在生理层次的疾病模型,答复enjoy,1、数据不少,进行性肌营养不良从18世纪就开始研究了。近代的分子生物学数据也很多(包括很多microarray数据),但数据的标准化设置不容易;2、我不是建模狂,现在看还是focus到节点的寻找/参数设置/节点基因功能类的划分上面,真要谈到建模我觉得很难,所以即使建的话,也不会是该类疾病完整的模型。(说白了,真的建了模型,最后无法符合实际,也要郁闷死)答复drugdealer :基因芯片不会忽略其他细胞对测试细胞基因表达谱的影响。这主要涉及标本真实性的问题。对于细胞株来说不存在这问题。而对于临床标本,特别是固体瘤标本,如何界定癌组织和癌旁组织是个关键。现在较多是通过切片来判定。如果在癌组织掺入较多的癌旁组织,则结果不能正确反映癌组织的表达谱。组织芯片主要用于蛋白表达研究,抗体筛选组织型特异研究等。芯片质量好,不会影响实验的真实性,现在比较好的组织芯片来自research genetics.To microarray: Many thanks!Just want to give another sample of the contribution of Mathematical Model."The traditional view of angiogenesis emphasizes proliferation and migration of vessel-wallassociated endothelial cells. However, circulating endothelial progenitor cells have recently beenshown to contribute to tumor angiogenesis. Here we quantify the relative contributions ofendothelial and endothelial progenitor cells to angiogenesis using a mathematical model. Themodel predicts that during the early stages of tumor growth, endothelial progenitors have asignificant impact on tumor growth and angiogenesis, mediated primarily by their localization inthe tumor, not by their proliferation. The model also shows that, as the tumor grows, endothelialprogenitors adhere preferentially near the tumor periphery, coincident with the location of highestvascular density, supporting their potential utility as vectors for targeted delivery of therapeutics.Model simulations of various anti-angiogenic strategies show that those therapies that effectivelytarget both endothelial and endothelial progenitor cells, either by restoring the balance betweenangiogenic stimulators and inhibitors or by targeting both types of cells directly, are most effectiveat delaying tumor growth. The combination of continuous low-dose chemotherapy andanti-angiogenic therapy is predicted to have the most significant effect on therapeutic outcome.The model offers new insight into tumor angiogenesis with implications for the rational design of anti-angiogenic therapy."&&&&&&&&Brian R. Stoll, Cristiano Migliorini, Ananth Kadambi, Lance L. Munn, andRakesh K. Jain "A Mathematical Model of the Contribution of EndothelialProgenitor Cells to Angiogenesis in Tumors: Implications forAnti-Angiogenic Therapy" / Blood / prepublished online May 29, 2003; DOI 10.1182/blood-2003-02-0365This is a big topic and also a very interesting one. as to the discussion of the natural history of disease,communicable diseases in particular, could anyone introduce some models or some papers or books even, with regards to this? Weibull distribution,exponential distribution and more?“人是一堆蛋白质”绝不等于“一堆蛋白质就是人”。蛋白质从一级结构到二、三、四级结构,量上没有发生什么变化,却发生了质的变化。蛋白质可以用空间构像的改变来存贮和传递信息,想起来就是一件美妙的事情。用数学公式来描述疾病,我相信是绝对可以的。从加速度,万有引力到相对论,这不过是几个简单的公式就可以描述宇宙运动的“根”。DNA仅由4种碱基构成,人类蛋白质也就20种氨基酸。生命大概也就是一、两个公式吧。cool topic,shining ideas补充两点:1,模型不一定限于数学模型,其它基于知识表示体系的如semantic network模型也具有很强的表达能力2,我近来对 多智能体系统 (multi-agent system, MAS) 建模 比较感兴趣,有兴趣的同仁可以探讨探讨。参考>



Powered by Dent 中文站 @2013-2022 RSS地图 HTML地图

Copyright Powered by365站群 © 2013-2024