返回
顶部

修改密码

首页 > 大赛动态 > 正文
《2022年(第八届)全国大学生统计建模大赛主题解读》(视频版+文字版)
《2022年(第八届)全国大学生统计建模大赛主题解读》发布(视频版+文字版)、视频版请扫描二维码观看。

《2022年(第八届)全国大学生统计建模大赛主题解读》(视频版)

请扫描以上二维码观看视频解读

《2022年(第八届)全国大学生统计建模大赛主题解读》(文字版)

01主题解读一:易东(陆军军医大学)

一、大数据时代需要生物医学统计测度创新研究

统计测度就是用一定的符号和数字,通过某种形式和载体,对所研究的现象或事物的特征进行量化反映,表现为可用于统计分析的数据的过程。当前,在“大数据+健康中国”背景下,始终把人民群众生命安全和身体健康放在第一位。智慧医疗是医疗信息化最新发展阶段的产物,是5G、云计算、大数据、AR/VR、人工智能等技术与医疗行业进行深度融合的结果,是互联网医疗的演进。因此,生物医学统计学的研究对象已经从结构化数据延伸到了包括非结构化数据在内的一切数据。面对大数据提出的新挑战,我们应该大胆探索生物医学统计测度的新思路、新理论和新方法,共同推动统计学与数据科学的发展。

二、生物医学测度研究的主要考虑

主题中的两个关键词,一个是“新发展格局”,反映到生物医学领域就是生物医学大数据蓬勃发展的时代;另一个是“统计测度”,该测度需具有统计学属性,且由于生物医学大数据具有类型多样,来源复杂等不同于一般“小数据”的特征,该“统计测度”在定义上或可不必像数学中所定义的测度那样的抽象,同时,可不受制于函数的具体表现形式,甚至可超越数学上的界定,如:可以基于不同的数据类型和变量维度,定义测度函数。强调生物医学统计始终以生物医学数据为研究对象,但是在大数据新发展格局下,数据类型多样,来源复杂,范围扩大,需要新型生物统计理论方法加以支撑。新统计理论的发展离不开新统计测度的定义,而新测度的定义离不开新数据的推动。强调生物医学统计实质是方法论,统计学拥有一整既能让分散的数据集合又能让综合的数据分解、既能展现数据规律又能显现数据关系的方法。但在新发展格局下,方法论的基础将更加广泛,应该更加注重与生物医学实践相结合。强调生物医学领域不同于其他领域,更应注重对数据背后的因果价值挖掘,有了因果证据才能实现干预,降低疾病负担,促进健康。

三、建议的研究方向

1. 临床医学研究方向

(1)疾病的诊断、治疗与预后的准确性或有效性、安全性测度

(2)临床试验相关的指标和测度;

(3)基于大数据的疾病风险预测指标和分析模型;

(4)基于真实世界的指标体系和测度方法。

2. 精准医学方面

(1)精准医学相关的指标和测度;

(2)个体化治疗方案选择的标准和评价;

(3)现代精准医学与高通量组学结合多维测度融合研究。

3. 高通量组学数据

(1)高通量组学数据的指标和测度;

(2)组学数据数字特征提取;

(3)组学数据数字特征的降维;

(4)组学数据数字特征的多维测度融合研究。

4. 因果推断方面

(1)因果推断相关工具指标和测度;

(2)基于反事实框架的倾向性评分(propensity score, PS)研究;

(3)被破坏的随机试验中因果效应测度和估计;

5. 公共卫生与健康医疗大数据分析

(1)疾病流行规律、疾病的风险评估与预测指标测度;

(2)人群健康以及环境和经济影响程度的衡量;

(3)传染病防控格局的影响测度(基于多源大数据);

(4)政策干预效果评估的统计测度;

(5)政府基本公共医疗服务和管理相关测度。

(6)健康医疗大数据分析相关测度(如健康风险预测管理评价)。

02主题解读二:王学钦(中国科技大学)

统计测度是什么?通常,当人们听到测度这个术语时,可能会想到测量某物的长度或测量某物的数量。简单来说,统计测度就是用一定形式的载体(符号或数字),对所研究的现象或事物的特征进行量化反映,表现为可用于统计分析的数据的过程。

      但事实上,我们更关心的,是一种更“广义”的测度,它可以理解为一种利用数据来描述世界的方法。往大了说,它可以是全国甚至全球的经济核算相关指标方法:GDP核算方法与模型、全球价值链测度、“三新”经济核算、区域碳排放核算、生态产品价值核算等研究、统计监测分析体系、高质量发展综合绩效评价、共同富裕统计监测指标体系、生育形势统计监测、养老健康等生活性服务业统计监测等研究、疫情综合防控指标体系的建立优化等等;往小了说,它也可以体现在自己生活的方方面面,包括:就业时对公司及岗位综合评分体系的构建、购物节中不同商品性价比指标的分析、疫情冲击下大家的生活幸福指数评估等。

      测度的本质,就是让事物变得明白清晰、有理有据。无论从宏观上还是微观上,可以定性分析的问题往往不缺,缺少的是一种将定性问题转化为定量问题的数据思维与解决手段。其中的关键是要善于发现问题,提炼问题并转换问题,懂得利用数据作为工具去尝试实现、发展及创新一种统计测度。下面我们举一个统计测度的例子。最近股市与基金的一涨一跌都牵动着大家的心,作为把握股票市场动态最重要的工具之一,股票价格综合指数 [1](包括上证指数、深证指数、各大板块指数以及美国纳斯达克指数等等)就是一种非常有效的统计测度。不同的指数就是将不同上市公司股票整体的涨跌情况,按照一定规则,通过权重比例综合在一起,形成的一系列统一量化指标。借助这一统计学指标,我们不仅可以把握整个市场的变化规律,还能从侧面动态衡量不同行业的经济冷暖变化情况。还需注意,只从单一指标上来看待某一问题往往是不充分、不合理的,可以将多种不同维度的指标量化综合成一套体系,科学系统地反映现象并解决问题,这套体系须是规范、量化且可得的。

      科学的统计测度还应该是与时俱进的。构建新发展格局的统计测度,不仅是社会经济发展的要求,也是全球竞争的必然。习近平总书记强调:“加快构建以国内大循环为主体、国内国际双循环相互促进的新发展格局,是‘十四五’规划《建议》 [2] 提出的一项关系我国发展全局的重大战略任务,需要从全局高度准确把握和积极推进。”这一任务要求我们紧跟时代步伐,着力解决目前社会上与生活中遇到的重点问题。落实到统计科学与大数据应用层面,我们可以从如下几个方面入手。

1. 研读《“十四五”大数据产业发展规划》 [3]。规划指出,“十四五”时期是我国工业经济向数字经济迈进的关键时期,对大数据产业发展提出了新的要求,产业将步入集成创新、快速发展、深度应用、和结构优化的新阶段。规划还介绍了多个专栏方向,包括:数据治理能力,重点标准研制及应用推广,工业大数据价值提升,行业大数据开发利用与数据安全铸盾。

2. 学习《“十四五”数字经济发展规划》 [4]。规划部署了八方面重点任务:优化升级数字基础设施;充分发挥数据要素作用;大力推进产业数字化转型;加快推动数字产业化;持续提升公共服务数字化水平;健全完善数字经济治理体系;着力强化数字经济安全体系;有效拓展数字经济国际合作。同时围绕八大任务,规划还明确了信息网络基础设施优化升级等十一个专项工程。

3. 参考《全国统计科学研究项目2022年度课题指南》 [5]。指南建议了九个重要研究选题方向:统计管理体制、国民经济核算、“三新”经济核算研究、统计法治与监督、统计制度方法和调查体系、统计监测分析、统计数据质量、统计基础理论、数字经济及其他。

4. 了解《Trends and Future Perspective Challenges in Big Data》 [6]。文章讨论了当前全球大数据的问题、机遇、趋势及挑战,进行详细解读与深度思考,同时给出了针对大数据系列问题的有效解决方案。其为我们提供了目前全球大数据遇到的热点与难点问题,让我们在了解新发展格局的同时,能够具有国际视野,拓宽思维边界。

      这些规划指南与参考文献虽然给定了大的方向,但论文具体的着重点,还是要避免太大、太泛,尽量以小见大,见微知著,找到实际立足点,落到实处上来。统计本质上是一门解决实际问题的学科,不是由一堆定理与公式堆砌的空中楼阁。下面我们以“碳中和”为例,抛砖引玉。

      全球工业化至今,人类各项活动排放的以二氧化碳为首的各类温室气体急剧增加,其已经超过了大自然的消纳能力,长此以往,将对地球生态系统造成难以挽回的伤害。目前,全球已有一百多个国家提出了“零碳”或“碳中和”的气候目标,但这一目标对于正处于工业化进程的中国来说是个巨大的挑战和考验 [7]。“十四五”期间,碳约束下的减排成为未来政策发力的重点,中共中央、国务院2021年底发布《关于完整准确全面贯彻新发展理念做好碳达峰碳中和工作的意见》 [8],对努力推动实现碳达峰、碳中和目标进行全面部署,要求完善标准计量体系并提升统计监测能力。目前已有一些与统计测度相关的研究工作,如:中国碳市场压力指数的构建及应用 [10];新时代我国能源高质量发展评价体系构建与测度研究 [11];利用多种测度指标的碳足迹方法研究 [12, 13] 等等。但整体看,还有长足进步的空间,例如:我国现有的碳排放核算体系不够完善;碳排放核算方式与结果不够权威;碳排放核算方法体系相比于国际标准较落后等 [9]。核算体系不够完善,不够权威就意味着我们在国际上没有足够的话语权,若不尽早启动相关标准与核算体系的研究,难免将受制于人,因此这一系列问题的研究具有很强的现实意义与时代价值。

      最后,以上解读仅为一家之言,期待同学们都能够在比赛中有所收获,取得理想的成绩!

03主题解读三:吕光明(北京师范大学)

国民经济是一个诸多活动单位组成的相互影响和彼此连接的循环,其根本目的在于从供给和需求两端从机制和过程两个方面来保障经济的持续稳定增长和发展的高质量。国民经济循环从过程上看大致分为生产、分配、流通和使用四个环节,从截面上看则表现为相应环节的比例结构。一般来说,在不同时期,受资源禀赋、发展阶段和发展战略或理念等因素的影响,各国国民经济循环的结构特征会出现不同程度的差别,但一段时期内相对稳定的循环结构特征就构成了特定的发展格局(蔡昉,2021)。

      1978年前,我国实行的是相对封闭的计划经济,对应的经济循环基本上以国内循环为主。1978年后,我国在稳步推进国内城市和农村经济改革的同时,逐步扩大对外开放,积极参与国际经济分工和经济全球化,形成了“两头在外、大进大出”的国际大循环发展格局。这一发展格局在特定发展阶段发挥了我国的比较优势,提高了企业的劳动生产率和产业的竞争力,推动了国民经济持续高速增长。2008年全球金融危机以来,我国发展面临的外部和内部环境发生较大变化。世界经济停滞趋势明显,逆全球化浪潮加剧,民粹主义和保护主义抬头,同时,国内人口红利消失,未富先老的压力变大,经济也由以前高速增长步入中低速增长的新常态。在这种情况下,亟待在国民经济循环上做出新调整和变革,以实现长期稳定的高质量发展。

加快构建以国内大循环为主体、国内国际双循环相互促进的新发展格局是以习近平同志为核心的党中央立足国内外环境变化和面向全面建设社会主义现代化新征程的“十四五”和未来更长时期针对我国经济发展作出的重大战略安排,是着眼于重塑我国未来国际合作和竞争新优势而做出的重大战略部署。为落实这一战略安排和部署,国家“十四五”规划从坚持深化供给侧结构性改革、建立扩大内需的有效制度、坚定不移推进改革、坚定不移扩大开放和强化国内大循环的主导作用五个方面提出相应的政策导向安排。

      统计测度是对所研究的现象或事物的特征或规律进行量化描述和定量刻画的过程,其创新意义在于揭示以前没有发现的或不能测度的定量特征或规律。本届大赛以构建新发展格局的统计测度为题,正是期待参赛者能够运用不同的统计测度分析手段、方法和技术,定量刻画新发展格局构建过程中出现的新变化、形成的新特征、萌发的新动能,研究揭示其背后的驱动因素、作用渠道与作用机制,提炼形成一些典型化事实和相对可靠的经济规律。这些发现既可以从针对国民经济整体循环的系统研究中得出,也可以从针对局部或单一循环、具体循环环节甚至重要循环堵点的深入研究中得出。既可以是对内外部环境变化特点及其关联影响的深入揭示,也可以是核心变量和重要参数变化特征或趋势的系统挖掘。既可以是对综合循环变动特征或结构变化规律的量化挖掘,也可以是对五大政策导向安排具体建议或干预效果的统计分析。

      在紧扣主题选择参赛题目和设计测度分析方案时,个人认为需要注意如下四点:(1)循环结构变化是测度分析的核心基础。其中,循环结构包括生产、分配、需求等多个方面。(2)国内循环特征测度分析的空间很大。该类测度分析在研究角度、使用指标和研究方法等方面有很大的伸缩性和发挥空间。(3)国际国内循环测度分析的模式相对固定,主要以全球或全国多区域投入产出表为数据基础。(4)构建新发展格局需要主动作为,迫切需要大量结构变动的政策评价作为支撑。

04主题解读四:朱建平(厦门大学)

为在大学生中倡导学习统计知识、应用统计技能的良好氛围,聚焦经济社会发展热点难点问题,提高大学生数据挖掘、数据分析、运用统计方法及计算机技术处理数据的能力,加强创新思维意识,助力推进统计现代化改革。在国家统计局统计教育培训中心指导下,中国统计教育学会、教育部高等学校统计学类专业教学指导委员会、全国应用统计专业学位研究生教育指导委员会联合主办2022年(第八届)全国大学生统计建模大赛,本届大赛主题为“构建新发展格局的统计测度”。在此,谈谈主题的内涵,以便选择具有时代特色的,具有民族气息的,适应推进人类和社会发展的选题。

谈到构建新格局,离不开大数据发展的新格局。为此,必须把眼光放到2015年,人们都在说2015年是我国大数据发展的“元年”,因为从2015年开始我国对推进大数据发展连续出了几个重拳。

 重拳之一是转变观念。2015年3月5日,十二届全国人大三次会议上的政府工作报告中首次提出“互联网十”行动计划,这是中国大数据发展的节点之一。在此之前大家都在谈论大数据的概念、大数据的发展历史、大数据的发展特征等,在此之后转变观念,重点转移到探讨大数据“产业”如何发展。

重拳之二是战略实施。2015年8月31日,国务院发布《促进大数据发展行动纲要》,这是中国大数据发展的节点之二。在此将大数据产业发展上升至国家“战略”来实施。随之2016年3月,全国人大通过的“十三五”规划纲要提出,实施国家大数据战略,把大数据作为基础性战略资源,全面实施促进大数据发展行动,实际上就是对中国大数据产业的发展做了战略性的布局。

 重拳之三是理念提升。2017年7月8日,国务院发布《新一代人工智能发展规划》,这是中国大数据发展的节点之三,也是中国认知和发展大数据产业“理念”的一个重要提升。它抢抓了人工智能发展的重大战略机遇,构筑了中国人工智能发展的先发优势,促进了创新型国家和世界科技强国建设。

重拳之四是共同治理。2018年3月17日国务院办公厅印发《科学数据管理办法》,旨在进一步加强和规范科学数据管理,保障科学数据安全,提高开放共享水平,更好地为国家科技创新、经济社会发展和国家安全提供支撑。明确了科学数据是国家科技创新发展和经济社会发展的重要基础性战略资源。

第五个重拳更加重要给了数据一个重要的“定位”。2020年3月30日国务院《关于构建更加完善的要素市场化配置体制机制的意见》,明确了加快培育数据要素市场,推进政府数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护。数据作为一种新型生产要素写入文件中,与土地、劳动力、资本、技术等传统要素并列为要素之一。

中共中央政治局2021年10月18日就推动我国数字经济健康发展进行第三十四次集体学习。习近平在主持学习时强调,要统筹国内国际两个大局、发展安全两件大事,促进数字技术与实体经济深度融合,赋能传统产业转型升级,催生新产业新业态新模式,不断做强做优做大我国数字经济。

这样进一步明确了大数据发展“共建、共享、共治”的新格局。在此基础上,加快数据要素新发展,激发数字经济新动能的同时,也将会为统计学研究开辟重要的领域和方向。

1. 数据要素的开发与应用研究。数据”作为“要素”,其概念的理论界定和统计界定,解决统计对象问题。包括数据与自然资源、资本、劳动和技术要素的联系与区别;数据要素统计框架的构建,数据要素市场统计,数据要素生产收入核算;数据要素的增长贡献及其对国民经济各部门、国家治理各领域的影响测度等。

2. 数字经济运行机制的计算研究。国家统计局2021年5月14日常务会议通过发布《数字经济及其核心产业统计分类(2021)》,本分类将数字经济产业范围确定为:01数字产品制造业、02数字产品服务业、03数字技术应用业、04数字要素驱动业、05数字化效率提升业等5个大类。其研究的内容和方向凸显出来,如能否作为宏观调控主要手段,开展数据经济运行机制模拟及运行状况评价研究;数字经济核算的系统理论框架与方法体系研究;数字经济环境下的宏观经济的统计监测及预警研究;数字经济与经济增长和其他产业的联动效应研究等。

3. 大数据质量提升研究。随着智能产品的大规模普及,某些行业或企业通过互联网和物联网,人为产生大量的“虚数据”和“假数据”。那么,根据数据的生命周期中影响数据质量的因素主要来源于四方面:信息因素、技术因素、流程因素和管理因素。对数据运行的全过程进行监控,密切关注数据质量的发展和变化,深入研究数据质量问题所遵循的客观规律,分析其产生的机理,探索科学有效的控制方法和改进措施,这是我们需要亟待明确的重要研究领域。

4. 网络产品的质量和生产率统计方法及其应用研究。网络产品是指在网络经济条件下物质产品、信息产品和网络服务等的总称。随着数字经济的发展,企业的决策者和管理者要提高网络产品的质量和生产率,分析网络产品生产过程的统计方法是必不可少的工具,这也是一个全新的研究领域,可以从统计角度探讨,即统计过程控制;统计实验设计、可靠性、接受抽样。这些是一个迫切需要引进新思想的课题。

5. 社会经济大数据计算研究(计算社会经济学)。这些数据往往不是传统社会科学惯常处理的数据,而是通过卫星遥感、移动通讯、社交媒体、物联网等等产生的新型数据。这些数据通过分析可以更好地感知社会经济态势,启发和孕育新理论,发现可能的异常,预测未来的趋势等等。这些研究是基于大规模的真实数据,用定量化的手段研究社会经济发展中的各种现象,特别是与社会过程有关的经济发展问题,以及与经济发展有关的社会问题,

6. 健康医学和生物卫生中的大数据分析应用研究(计算社会医学)。健康医学和生物卫生大数据应用研究的方向是社会化医学和个性化医学,即以医疗大数据为基础引导政务、教育、商业等各个领域的变革;以大数据为基础为患者量身设计出最佳方案,以期达到治疗效果最大化和副作用最小化的定制医疗模式,可以把这一领域的研究问题,界定为计算社会医学。

7. 统计学方法在企业数字化转型中的应用。数字化转型是开发数字化技术及支持能力以新建一个富有活力的数字化商业模式。运用统计学理论和方法,建立完善的企业数字化转型的评价指标体系;利用大数据、人工智能、区块链等创新技术,帮助企业搭建管理驾驶舱,获取企业的核心数据,构建企业的动态数据模型;运用统计学方法,并结合行业大数据构建预警监测系统,加强企业核心竞争力;运用统计学方法对现代化企业生产经营过程进行科学的设计和控制等等。

扫一扫在手机打开

评论
已有1144条评论
0/150
提交
热门评论
相关推荐
今日要闻
换一批
热点排行