发新话题
打印

生物医学知识整合论漫谈2

生物医学知识整合论漫谈2

理性与非理性的转化,物数学

从每天清晨6:00起,上海地铁一号线A站逐渐热闹起来,人们从四面八方不断汇集而来。7:00以后形成高峰,到8:30以后才会逐渐冷清下来。对地铁站的自行车停放区的管理员来说,各辆自行车何时进场是随机的或非理性的(irrational),即他无法用理性进行判断某辆自行车今天是否会来,更无法判断它何时进场。但在6:00-7:30时段自行车数量是递增的(线性的或非线性的),并且每天按照同样规律变化着。因此在这一时段,根据停放区内自行车数量或密度,聪明的管理员无须看他的手表就能判断出时间。很明显,这里一个非理性问题转化成另一个理性(rational)判断问题。
此事为管理员的一个深谙数学之道的朋友发现,它把时间与停放区的自行车数量一一对应起来,画出了曲线并据此给出了一个经验公式:根据自行车数量判断时间。并告诉管理员这是一个由物理现象导出的数学算子。但提醒他如把这个算子用到B地铁站,曲线也许需要作些修正。
沉醉于医学信息学而不能自拔的老包获知此事,顿觉豁然洞开:(1)机体的令人眼花缭乱的数学原则只能由机体自己做主,欧几里得,毕达哥拉斯,希尔伯特,罗巴切夫斯基等数学大师只能“敲敲边鼓”;(2)这些数学原则比一般数学原则具有更强的个性,有高度的环境依赖性;(3)这些形形色色的数学原则及其差异和关系,有可能引出更深更广的机体其他的原理。他于是自作主张地把它定名为物数学


(纯属虚构的科学故事)

[ 本帖最后由 老包 于 2006-10-25 18:02 编辑 ]

TOP

数学大师们的疑惑:

谁知此事通过时空隧道传到数学大师们的耳朵里。数学大师们听到这一番离奇的说法后哈哈大笑,质问道:“老包老包,个性很强的计算原则也能算数学?!”
老包听后不慌不忙地辩解说:“令人尊敬的大师们,我从小就仰慕你们的天才,你们高度抽象、高度普适性的数学理论常常让我叹为观止。但在漫长的生命进化过程中,高度复合产生了千变万化的个性,而当你们在作高度抽象时必须牺牲大量的个性,因此你们的数学离它们(个性)太远。而且,我告诉你们,我们的时代拥有几乎是无穷无尽的计算机和网络存储能力,有无与伦比的运算速度,因此我们这个时代已经无须畏避个性,相反我们要越来越趋近个性。这是大师们你们的时代无法想象的。”
大师们觉得物数学的提法虽然看似荒唐无稽,仔细想来也不无道理,倒不如观其行,察其效,采取乐观其成的态度为好。

(纯属虚构的科学故事,其实关于物数学大师们什么都没有说!)

[ 本帖最后由 老包 于 2006-10-25 16:00 编辑 ]

TOP

有意思,支持包老师所做的探索!

创新理想,拥抱未来

电子病历研究中心

www.china-ehr.com  

TOP

人类环境保护事业的先驱者瑞秋. 卡森(Rachel Carson)的话常会深深地打动我:

“I have felt bound by a solemn obligation to do what I could——if I didn’t at least try, I could never be happy again in nature.”
“我感到自己肩负着一种神圣的职责,所以我倾我所能而为之——如果连努力都没有尝试付出,那我就永远不会再有真正的快乐。”

TOP

定义属性的概念确定性与物理确定性



事物的可判定性(如诊断的明确性)首先决定于事物的定义属性的可确定性,其次是决定于物理可确定性。我们已经讨论过,所谓定义属性是指某类事物的必须属性,意即如果该属性不存在,那么该类别也不复存在。
所谓定义属性的可确定性是指属性本身的定义是否明确。它其实包括了两个层次的意思,概念层次的明确性和物理层次的明确性。
概念层次的明确性指概念定义中的子概念是否明确,例如一些疼痛的分类“钝痛”、“锐痛”、“灼痛”、“刺痛”、“隐痛”、“绞痛”、“胀痛”等概念的文字性定义就难以明确,因为其子概念“钝”、“锐”、“刺”、“灼”、“隐”……等是一些物理行为,本身就难以作出文字定义,即所谓“只可意会,不可言传”。
即使在概念层次的文字定义是明确的,在物理层次(如病人或医生的感觉层次)往往难以区分。例如有些中医属性如滑脉(定义为“往来流利,应指圆滑,如珠走盘的脉象”),芤脉(定义为脉博浮大而软,按之中空如葱管),虽然文字符号级的定义似乎“言之凿凿”,但医生在诊脉时的物理感觉毕竟是难以鉴别的。
如果一些病症的鉴别诊断依赖于上述这些明确性较低的属性,将导致诊断上的不确定性。
相反,一些属性不仅本身的文字定义十分明确,并且通过一系列物理条件的限定可以保证其物理确定性。例如实验室检查“清洁中段尿培养菌落数≥105/ml”就是这类属性。
一般认为临床上如发现泌尿系统症状如尿频、尿急、尿痛,并实验室检查清洁中段尿培养菌落数≥105/ml,即可诊断为尿路感染;也有专家认为即使未发现泌尿系统症状,但如果“连续两次清洁中段尿培养,两次菌落数≥105/ml,且为同一菌株”,也可诊断为尿路感染[***]。
既然在没有泌尿系统症状尿频、尿急、尿痛的情况下也可诊断尿路感染,所以严格讲尿频、尿急、尿痛不是尿路感染的定义属性,而“清洁中段尿培养菌落数≥105/ml”是尿路感染的定义属性。
“清洁中段尿培养菌落数≥105/ml”这一属性不仅概念级文字定义十分明确(因为其子概念“清洁中段尿培养”、“菌落数”、“105/ml”都是定性或定量明确的)。那么,它的物理实现是否明确呢?因为临床环境宽广而复杂,对概念定义上十分确定的属性,仍然必须严格地控制其物理环境,以保证其物理确定性得以体现。为此,临床医学对其作了如下限定:(1)尿细菌培养前至少5天以上未应用抗菌素;(2)用清晨第一次尿,以保证尿在膀胱中停留6~8小时;(3)保证尿标本清洁,采标本前需充分清洗阴部,包皮,消毒尿道口,并留取中段尿;(4)取标本后应在一小时之内作细菌培养(否则应放置在4℃冰箱内)[****]。
因此可以认为“清洁中段尿培养菌落数≥105/ml”这一定义属性在概念层次和物理层次充分地保证了尿路感染诊断的确定性。



摘自:包含飞:<生物医学知识整合论>

[ 本帖最后由 老包 于 2007-7-15 10:28 编辑 ]

TOP

上段文字已经进一步加工!

TOP

包老的意思是要对中医标准化还是要从中医众多的表面现象中找出本质规律?

TOP

回复 #7 mojuncong 的帖子

你说得很对!我非常同意。

但这张贴子不是谈这个问题,不过举个例子,其实西医同样的例子也很多。这贴子的主题是谈论“概念定义”和“物理指定”二类不确定性。

我认为中医的标准化必须先从中医的临床实践中挖掘和提取出其认知科学和信息学本质。我要求的研究生必须作最认真的工作(不敢讲最好的工作),他们也确实做了很多又意义的工作。

但问题是我总觉得中医的主体似乎并不想认真地探索,因为信口开河要轻松的多!

TOP

一个古老的故事:盲人与大象

中国有一个家喻户晓的古老的故事。说有一天五个盲人感摸一头大象,每个人都得出了自己的关于“大象象什么”的结论。触摸大象鼻子的盲人说“大象象一根管子!”,而握着大象尾巴的盲人说“大象象一根绳子!”,另外三个盲人分别得出的结论是大象象“柱子”,“墙”,“风扇”,因为他们各自在触摸大象的腿,身体和耳朵(见图1A)。
这个故事告诉人们如果把事物局部当成事物全部,将是多么荒唐无稽啊。
然而进入信息时代以后,事情却发生了变化。盲人们学会了实体,语义关系,知识整合等概念和科学,他们以最合理的方式把各自掌握的数据整合起来,并且得到了新的结论,“大象中心是‘一堵墙’;‘一根管子’和‘二把扇子’在前;‘一根绳子’在后;‘四根柱子’在下”。
你看,经过知识整合,虽然我们的盲人小组拥有的数据并没有多大变化,但他们对大象的理解却进了一大步,更为接近真实的大象(见图1B)。
故事当然是虚构的。笔者的意图是通过这个故事说明探讨生物医学知识整合论(BMKI)对全面理解生物系统和人体系统是何等重要。我们不能万世不变地把我们的目光聚集在越来越微小,越来越详尽的生命系统的细节上。我们应该分出一部分注意力和精力关注已被我们发现的海量的,异质的,离散的数据,信息和知识,探讨如下的问题:我们能不能重新把它们组装起来?在这条前无古人的新的探索之路上我们究竟会遇到何种难以逾越的障碍或知识黑洞?多大程度上我们可以达到目的?我们应在何处开始我们的茫茫征途?……
每当我们因种种原因而感到失望和沮丧的时候,我劝大家记起这一原理:所有我们遇到的生物医学数据,信息和知识,不管它们出自何时,何处,何种方法,都无一例外地源自那棵唯一的生物进化树上。



摘自:包含飞:<生物医学知识整合论>

[ 本帖最后由 老包 于 2007-7-21 12:34 编辑 ]

TOP

我看了一个关于软件工程的评论,感觉多少有点启发

这个问题很复杂,恕在下自不量力说几句。
软件工程的目标是最小的成本、最高的质量、最短的开发时间开发软件产品。眼下流行的各种软件工程方法对这个目标的实现都差强人意。以RUP为代表的重量方法用来做计划、准备的时间太多,真正用在开发的精力却很少,以为只要企业保证软件过程的实施,其他的事情都好办,这种极端压抑人性的方法不会取得很好效果。轻量方法要好一些,毕竟绝大部分注意力都在开发上,大家都很喜欢,可是仅依靠少数几个人,对付不了大型项目。当然,大家都在改进各自的缺点,吸收对方的优点。
G.Booch说过,自动化不足是软件开发过程中大量问题存在的重要原因,在下深以为然,并且认为是最小的成本、最高的质量、最短的开发时间之目标难以实现的根本原因。因此,将来的软件工程必然要发展到以软件自动化技术为核心的阶段——4GL时代。
为什么4GL时代还没有来临,这是因为软件自动化太困难,眼下所取得的成果局限在某些很窄的领域内,达不到实际项目要求,而且这种技术太难理解,需要对理论的深入学习,一般的开发人员难以接受。软件自动化技术没有大发展的重要愿意是目前描述动作语义的技术都很低级,因此即便用形式化方法作设计也是很费时间的,虽然可以提高一定的效率,但是还是远远不够的。
为了解决这个问题,只有从利用以前的成果入手了,也就是复用构件,但不是用今天的构件技术。将来,实现了机器检索的大型构件库,这是计算机实现对构件的查找、转配等自动化的构件库,不是今天的手工构件库。但这样的构件库为什么没有出现,还是老问题,我们还没有一个很理想的描述动作语义的方法,计算机无法判定两个构件或规约和构件之间是否等价,或者有等价的成分,当然也就无法进行自动检索了。
虽然有很多困难,但我相信将来软件工程的发展方向必将是高度自动化的构件式开发方法。
上面说的,完全是个人观点,也许不足采信。

TOP

目前来说,敏捷方法还是有一定的实用价值.
既要灵活,又要效率,更要约束,这几个问题组合起来,就很难处理了,如果没有新的理论出现或者技术上的突破,估计开发不会有质的变化.目前能做的,只是小打小闹式的局部改进.
日本的第五代计算机是以逻辑推理为主要运算方式的,但没有理论基础的支持,终究不能成功.
每天的工作就是HIS,今天你HIS了吗?

TOP

不同的尺度看到了不同的意义(来自宣国荣教授的ppt文件):
(参考:M. Vetterli,”Wavelets and Subband Coding “, Prentice Hall PTR, 1995                   p.11)
思考一下生物医学信息学的意义吧!

[ 本帖最后由 老包 于 2007-9-2 11:35 编辑 ]
附件: 您所在的用户组无法下载或查看附件

TOP

发新话题