数学是思维的花朵。抽象和严谨璀璨出智慧的光彩,哲理与深邃演绎着思想的高妙。能够在数学的世界里踔厉奋发独树一帜的人,可谓之人杰。
中国科学院院士徐宗本就是这样的精英。
徐宗本,陕西商洛人。商山洛水蕴灵秀,淳朴坚韧养慧根。这位来自陕南山区的“砍柴娃”,从西北大学学士到西安交通大学博士——我国“文革”后第一批培养的计算数学专业博士。因为先天的禀赋,更因为对数学的热爱与执着,徐宗本在数学的海洋里尽情遨游,不断有新的发现和斩获。由于成绩突出,1987年破格晋升为副教授,1990年再次破格晋升为教授。
这一年,徐宗本35岁。
为了开阔眼界,“强基固本”,徐宗本又负笈英伦,从事博士后研究。在香港中文大学、香港理工大学历练5年后,又到中国科学院应用数学研究所做高级访问学者。进而,被意大利Napoli大学、英国Essex大学聘为访问教授。这样的工作经历,为他回国后在西安交通大学取得一系列成果大有裨益。
博士论文崭露头角,辛勤耕耘持续推进。徐宗本在科学的原野里探索着,发现着······蓦然回首,自己栽植的那些幼苗已然气象葳蕤,蔚为壮观。
1987年,徐宗本长达200多页的博士论文《单调映像方程解的近似和构造可解性理论》,以严密的推理、独特的创意、精妙的算法在泛函分析领域引起轰动,当时被认为无论在思想方法上,还是在理论构架上,都超越了国内外同行的同类工作。这些深刻卓越的理论研究,为他后来在相关数学理论、机器学习领域的厚积薄发,取得系统性创新成果夯实了基础。
基于对基础数学的深入研究和敏锐感悟,徐宗本以其他十多篇论文为支撑的“Banach空间的不等式特征”理论,很大程度上将Hilbert空间特征理论推广到了Banach空间,发现并证明了机器学习的“徐-罗奇”定理,解决了神经网络与模拟演化计算中的一些困难问题。这个理论虽不及哥德巴赫猜想那么著名,但也以“优美的结果、完善的结论”而被持续广泛应用于数学分析、机器学习、逼近论和控制论等,成为在非欧框架下机器学习研究的基本分析工具之一。
徐宗本认为,评判一个学术成果的标准,要看是否为所从事的学科留下一点经得起时间检验、永恒的、有价值的东西,使别人能沿着你所开创的领域追随研究。在信息处理领域,他独立于西方学者发现了压缩感知的L(1/2)正则化框架,并系统建立了稀疏信息处理的L(1/2)正则化理论。这个理论为稀疏合成孔径雷达成像提供了重要的实现途径,被国内外专家评价为“是创世纪的工作”。为稀疏微波成像新体制提供了重要基础,被国家安全重大基础研究项目采用,在军事侦测、地球遥感等国家重大需求应用中发挥着重要作用。
此后,徐宗本着眼于数学与信息科学的结合,在计算智能与机器学领域不断开拓,先后解决了一系列困扰科学界的理论问题。他发现了神经网络不同模型化表示之间的稳定不变性,解决了霍尔弗尔德网络的稳定性判定问题,证明了BP算法的收敛性,解决了BP训练可行性问题,提出了模拟进化计算的随机过程框架,解决了公理化描述问题。相关论文被《自然》杂志评价并列为代表作。
凭着高超的天赋和勇毅的坚持,徐宗本迎来了人生的高光时刻。高光,一点点地廓清迷雾,前方,就是浩瀚星辰。
自古以来,中国人对于数学特具禀赋,中国应当出大数学家!比如《周髀》,早在公元前1世纪就介绍了勾股定理。成书于一千五百年前的《孙子算经》,首创余数定理。五世纪的祖冲之算出来的圆周率,比德国人奥托早出一千年多。南宋大数学家秦九韶《数书九章》中的联立一次方程式的解法,比意大利大数学家欧拉早出五百多年。元代大数学家朱世杰在《四元玉鉴》中对多元高次方程的解法,比法国大数学家毕朱早出四百多年。
今天,徐宗本来了。怀抱“学好数理化,走遍天下都不怕”的理想与自信,徐宗本在数学的高原上奋力登攀。累吗?想想小时候的苦日子,咬紧牙关也要坚持下来。“什么是坚持?”对于童年时代的徐宗本来说:“就是背红薯时摔得满身是伤,也要咬牙忍痛将散落的红薯一一拾起,继续背回家。”少年时代,就是“背着沉重的驮架在七八十里的山路上艰难前行,累到极点时想歇一下,却找不到支点,唯有心一横,咬着牙坚持。”正是这种坚持,从小就教会了他勇于承担,坚韧不拔。在攀登数学高峰的旅程中,上一个台阶,刷新一个记录;跨一道堎坎,打通一个关节;越一处险关,链接一个榫卯。所有障碍都是线索,所有陷阱都是路径。风暴来临,雨雪交加,千仞峭壁,万丈潭深······从天上飞,从水中游,从洞里钻。“树上开花”“无中生有”“围魏救赵”······三韬六略,秘法绝招,古今中外,碧落黄泉,条条大路通罗马,处处鲜花为我开!他只知攀登,在千仞深渊之上;他只管攀登,在无限风光之间。数字、符号、引理、公式,优化、组合、逻辑、推理。不经意间,天朗气清,云开雾散——“尽日寻春不见春,芒鞋踏遍陇头云。归来笑拈梅花嗅,春到人间已三分”。他终于登上了一座座山峰。
2007年,徐宗本被聘为首席科学家主持国家重大基础计划(973)项目:基于视觉认知的非结构信息处理基础理论与关键技术;基于认知与非欧式框架的数据建模基础理论研究获得“国家自然科学奖”二等奖。
2008年,徐宗本获得中国应用数学的最高奖——CSIAM苏步青应用数学奖。
2009年申请中国科学院院士,成为有效候选人。
2010年8月19日至27日,被誉为数学界的奥林匹克盛会——第26届国际数学家大会在印度海德拉巴举行。大会除了颁发菲尔兹奖等数学界重要奖项,还邀请杰出数学家作特邀报告。其45分钟报告由国际数学联盟指定若干世界著名数学家组成的程序委员会,根据近四年数学科学国际前沿工作中相关领域的重大成果与进展确定。徐宗本作为“科学与技术中的数学”领域的代表接受世界数学家大会组委会主席M.S.Raghunathan教授的邀请,以“数据建模的L1/2正则化理论”为主题作45分钟报告。在我国,徐宗本是继华罗庚、吴文俊、陈景润、冯康、张恭庆、马志明、田刚、陈志明之后享此殊荣的第九位数学家。
2011年,徐宗本再次获得国家科技进步二等奖,并当选中国科学院院士。
2014年,以他的理论为基础的全球首部稀疏微波成像论证原理样机试飞成功。
数学才是技术的最核心部分。同样是做科学研究,为什么不做到最有价值?那就必须与国家需求相结合,围绕国之大者开展创新与服务。
“大数据”作为一种概念和思潮由计算领域发端,之后逐渐延伸到科学和商业领域。近年来,大数据相关技术、产品、应用和标准快速发展,逐渐形成了覆盖数据基础设施、数据分析、数据应用、数据资源、开源平台与工具等板块的大数据产业格局,历经从基础技术和基础设施、分析方法与技术、行业领域应用、大数据治理到数据生态体系的变迁。当前,我国仍面临着大数据核心技术受制于人的困境,高端芯片、操作系统、工业设计软件等均是我国被“卡脖子”的短板,需要坚定不移走自主创新之路,加大力度解决自主可控问题。
经过深入的调查研究,徐宗本认为这种技术发展模式面临一系列重大挑战,如数据模型独立,数据难以关联共享;负载类型不同、冷热数据不同,难以优化调度不同硬件资源;以计算为中心的数据处理模式,常常需要执行海量数据“搬家”操作,导致性能瓶颈等。在大数据应用需求驱动下,计算技术体系有必要进行重构,以数据为中心的新型大数据系统技术成为重要方向,信息技术体系将从“计算为中心”向“数据为中心”转型,新的基础理论和核心技术问题仍有待探索和破解。
“我提出来了一套和常人完全不一样的数据挖掘方法,就是通过模拟人的视觉怎么处理问题的几个典型算法,比如说视觉聚类器,视觉分类机还有信息融合的‘响尾蛇模式’等等,这些算法在数学与工程领域都非常广泛的应用”。徐宗本一边演示一边介绍:“画面中看似混杂无序的小碎片,经过成倍数据的叠加,最后形成一张大象的图像。当数据达到量变和质变的临界点时,人们可以清晰看到数据背后的故事,这就是大数据。而数据如果不相关联和分析,就无法创造更大的价值,好比有人只看到大象的鼻子,有人只琢磨大象的尾巴,但是怎么也看不到大象的整体。”目前国内大数据产业链条存在缺乏健壮性、完整性的问题。做大数据首先要明确目标,“数据是基础,平台是支撑,分析是核心,赚钱是王道。对于大数据产业而言,数据就是基本的生产资料,而平台为收集存储数据提供支撑,最为核心的是分析,通过对数据的具体加工解决实际问题,进而变现创造价值。”数据是资料的数字化,是以编码形成存在的信息载体。大数据则是大而复杂的数据,具有海量性、时变性、异构性、分布性的特征。在大数据产业价值链上,存储只是一部分,如果缺乏分析挖掘能力,并形成数据产品,就好比只买米不做饭。只有掌握关键核心技术的自主权、先进数字技术产业的主导权,才能把握数字经济发展的主动权。解决关键核心技术“卡脖子”问题,必须营造一个多主体协同、多要素融通、制度环境充满活力的创新生态系统,持续激发创新的内在潜力。
为什么大数据能产生价值?徐宗本的看法是,这与四个大数据原理有关。首先是量变质变原理,积累的数据量足够充分后,可以解决具体问题。第二个是关联聚合原理,比如研究大象,如果一个人只盯着大象的鼻子、尾巴,你观察20年,积累再多数据,也不能反映原来的面貌。数据只有聚合才能产生价值,共享则能放大价值。另外还有“分析出价值”原理,目前各地建立了太多数据中心,甚至出现产能过剩的问题。如果数据只存储不加以分析,则变不了现。最后,数据本身拥有的可复制、可重用、可加工的特点,使得数据的价值能够随着扩散的范围而增大。这就是效用倍增原理。
在一次政府组织的讲座中,徐宗本深入浅出地演讲让人们茅塞顿开:大数据带来的是思维的改变,能够为我们提供社会科学方法论。现在企业做商业分析更多的还是基于业内数据分析。举个例子,比如我开了一家火锅店,目的是提高营业额。大数据怎么来帮忙呢?如果只是分析一天有多少顾客量,点了什么菜,消费额多少,这并不足为奇。需要注意的是,人们吃火锅跟天气、地域、小区周围有关。如果你收集和分析了天气数据、人口分布数据等,你就可以知道天马上冷了,人们想吃火锅了,哪里的人最喜欢吃麻辣火锅,店铺周围的小区住户是什么人,这样利用不同数据能够提高我们的效率和服务。信息技术的革命性发展,使得人类社会已进入大数据时代。大数据泛指一个时代、一项技术、一种文化、一个挑战,通常用三句话概括:拥有大数据是时代特征、解读大数据是时代任务、应用大数据是时代机遇。在他看来,大数据的价值有四个方面值得关注。第一,提供社会科学的方法论:实现基于数据的决策,支持管理科学与实践的革命;第二,提供科学研究的新范式:支持基于数据的科学发现;第三,形成高新科技的新领域:推动行业深化发展并形成大数据产业;第四,形成社会进步的新引擎:深刻改变人们的思维、生产、生活方式,推动社会进步。
前不久,国家发改委正式批复筹建西安交大“大数据算法与分析技术国家工程实验室”,为我省数据科学及相关学科迎来新的发展机遇。
基于“人一眼能看出空间图像的模式和结构”的观察,徐宗本研究团队系统发展了基于视觉认知的数据挖掘新原理与新方法,先后提出了聚类分析的视觉聚类器,判别分析的视觉分类机和基干复眼模型的快速物体轮廓识别等算法。其研究成果还在更宽的科学技术领域中产生影响,已形成一批公用分析工具,被成功应用于CT成像、分子成像、无线通讯、生物信息、地震信号处理、集成电路检测、电力系统优化控制、城市交通、机器人跟踪、机器学习、图像处理、光谱解混,乃至医学、脑科学、天文学与天文物理等各种不同领域。
徐宗本,陕西省商洛市柞水县人,数学家、信号与信息处理专家。长期从事应用数学和智能信息处理基础研究,在相关数学理论、机器学习领域取得系统性创新成果。提出稀疏信息处理的L(1/2)正则化理论,为稀疏合成孔径雷达成像提供了重要基础;发现并证明非欧氏空间框架下的“类二项式公式”,并用以解决机器学习中的若干困难问题;提出基于视觉认知的数据建模新原理与新方法,并广泛用于数据挖掘领域。发现并证明了机器学习的“徐-罗奇”定理,解决了神经网络与模拟演化计算中的一些困难问题;曾获国家自然科学二等奖、国家科技进步二等奖、中国工业与应用数学学会(CSIAM)苏步青应用数学奖,并在第26届世界数学家大会上作45分钟特邀报告。2011年12月当选为中国科学院院士。(文/王遂社 徐 明)