当前,新(xīn)冠病毒肺炎(yán)疫情在国内已经得到(dào)有效控(kòng)制,复工复(fù)产(chǎn)正在全面推进之中。那么,目前经济(jì)复(fù)苏的情况究竟如何?各(gè)行各业以及(jí)各(gè)地区(qū)的(de)发展形势有(yǒu)何差异?百度公(gōng)司最近发布(bù)的2篇论(lùn)文 [1, 2] 研究发现,这些(xiē)答案,都“藏”在海(hǎi)量的大数据里。
研究表明,百度地图(tú)的(de)用户和商户数据情(qíng)况与GDP走(zǒu)势呈现高度相关性,成为呈现行(háng)业和(hé)地区经济复苏情况的“晴(qíng)雨表”。同时,百度地图、搜索和(hé)健(jiàn)康平(píng)台的数据(jù)显示,某一地(dì)区(qū)人口流动情(qíng)况以及搜索(suǒ)习惯,与该地(dì)区的疫情形势紧密相关。由此可见(jiàn),百度多维度大数据能够有效地为疫情发展及其社会影响“画像”。
中国传媒大学调(diào)查统计研究所所长、大数据挖掘与社会计算实验室主任(rèn)沈浩表示,在抗(kàng)击新冠(guàn)肺炎疫情的斗争中,全国各地的政府、企业和科研机构(gòu)都在探索运用大数据手(shǒu)段提升治理能力(lì)、加强抗疫(yì)效果。未来,百(bǎi)度的大数据不仅能够作(zuò)为政府防(fáng)控(kòng)疫情的有益参考,同时也(yě)可以为推动(dòng)复(fù)工复产(chǎn)、提振经济(jì)发展提供有力(lì)的决策依据。
L型、勾型(xíng)、V型:百度大数据直观(guān)量化疫情对(duì)经济发(fā)展的冲击情况 [1]
成都闹市区的奶茶(chá)已经回归了往日的热闹,而天津旅游景区的(de)小饭(fàn)馆却迟迟(chí)难以复(fù)苏;西北县(xiàn)城(chéng)的超市(shì)恢复了元气,长(zhǎng)江(jiāng)中部的工厂则尚未(wèi)将产量提(tí)升至疫情之前的平均水(shuǐ)平……这些情况,百(bǎi)度大数据都“看”到(dào)了(le)。
百度大(dà)数据的研(yán)究者在试图摸清地(dì)图数据与经济复苏情况的关联时,发现了两个关键因(yīn)子——地(dì)图用户到店数量(Volumes of Visits to Venues,简称V3)与商户新开设的地(dì)理位置点数量(New Venues Created,简称NVC)。V3可(kě)以反映用户(hù)的(de)活跃程度,NVC则反映商户的活(huó)跃(yuè)程度。
于是,研究者将这(zhè)两个数据的走势与GDP走势做成可视化图(tú)表,结果发现,NVC、V3与(yǔ)GDP的(de)走势,呈现强烈的正相关,也就是(shì)说(shuō),地图(tú)用户到店(diàn)的情况(kuàng)与商(shāng)户新开设的(de)地理位置点情况,可以反映经济(jì)活动的强弱。
图1:从(cóng)2018年第一(yī)季度(dù)到2020年第(dì)一季度,每个季度的(de)国内GDP与百度地(dì)图用户到店数量,新开(kāi)设的地(dì)理(lǐ)位(wèi)置点数量,呈现强烈正相关。(注:分(fèn)析所(suǒ)用的数据皆为脱敏数据,所有处理环节均不涉(shè)及个体隐私(sī)。下(xià)同。)
那么,这一发现(xiàn),除了作为(wéi)经济活动的(de)晴雨(yǔ)表,还(hái)有什么作用(yòng)呢(ne)?
百度研究人员又做出(chū)了进一步的分析。他们对(duì)各个行业(yè)、各个地区(qū)省份(fèn)的经济活(huó)跃程度进行了细致分析,结果发现,不(bú)同行业、不同地区之间,经济复苏情(qíng)况呈现(xiàn)巨大(dà)差异(yì),主要分为以下三类——L型、勾型、V型。
先来看L型(xíng)。这一曲线显示复苏缓(huǎn)慢(màn),说明受(shòu)疫情影响很大(dà),目前仍然无法回到2018年同期的(de)水平;教(jiāo)育、交通运输、酒旅等(děng)行业遭(zāo)受(shòu)非常严重的打击。下图分别是机场、火车站、教育(yù)培训机构、酒店的用户到店情况。可(kě)以看到,代表今(jīn)年情况的红色V3曲线,呈现“L”形状,依旧在低谷摇摆。
图2:上图(tú)为机(jī)场、火(huǒ)车站、教育培训机构、酒店的用(yòng)户(hù)到店情(qíng)况(kuàng)(V3)和新开(kāi)设的地理位置点情况(NVC)
再来看勾型。虽遭受(shòu)疫情影响,但是疫情缓和之(zhī)后,能够恢复到2018年与2019年(nián)同期之间的经济水(shuǐ)平。餐饮酒吧、休闲娱乐、公园景点等是(shì)典型的行业代表。这一复苏情况在V3的可视化(huà)图表里很像一个反写的(de)“对勾”。
图3:勾型:疫(yì)情缓(huǎn)和之后,餐馆(guǎn)酒(jiǔ)吧、娱乐设施、旅游景点等行业能够恢复到2018年(nián)与2019年(nián)同期(qī)之间的经济水平
最(zuì)后看V型。尽管疫(yì)情(qíng)的影(yǐng)响严重,但(dàn)是(shì)一旦疫(yì)情缓和之后,能够快速触(chù)底(dǐ)反弹,恢复到2019年同期水(shuǐ)平(píng),甚(shèn)至比那时情况更好(hǎo)。代表(biǎo)行业有工作(zuò)居住的地(dì)点、商超、医院药店等。
图4:V型:疫情缓和之后,工作居住(zhù)地点、商超、医院药店等景气程(chéng)度快速(sù)反弹,走势看上去像字母V
研究人员用类似的(de)思路,将全国经济按照(zhào)区域进(jìn)行(háng)分析,发现湖北、北京及天津的经济复苏情况为(wéi)L型,复苏(sū)缓慢,与(yǔ)持续的疫情管控(kòng)以(yǐ)及旅行(háng)限制有关;南部沿(yán)海、黄河中游、东(dōng)部沿海(hǎi)、长江中游和(hé)北部沿海的数据显(xiǎn)示(shì)出明显的(de)勾型复苏趋势;大西北、东北和西南区域则展现出强劲的V型反弹趋势。
百度大数据研(yán)究专(zhuān)家表(biǎo)示,五大经济区(南(nán)部沿海(hǎi),黄河中(zhōng)游,东部沿海、长江(jiāng)中(zhōng)游、北部(bù)沿海)高度依赖(lài)全球供(gòng)应链的经济,在国内疫(yì)情结束(shù)之后,依(yī)然受到(dào)国际整体疫情和经济形势的影响,未能快速反弹,呈现中间态(tài)的勾型;而西北、东北、西南等地区(qū)经(jīng)济对(duì)外依赖(lài)性相(xiàng)对较小,疫(yì)情感染(rǎn)人数没有其他(tā)五大经(jīng)济区多,恢复(fù)快,经济(jì)经历短暂阵痛之(zhī)后,触底反弹。
搜索COVID-9越多,疫情(qíng)防控工作越好(hǎo)?百度大数据“揭秘(mì)”疫情(qíng)防治、人口迁徙与搜索行为间的(de)显著关联 [2]
百度大数据还(hái)发现(xiàn)了人口出行情(qíng)况、搜索情况与(yǔ)疫情防控之间的紧密关联。
先来看(kàn)第一(yī)项发现:从(cóng)武汉移出到中(zhōng)国其他主要城市人口情况(kuàng),与(yǔ)当(dāng)地疫情传染(rǎn)情况的关系存在(zài)显(xiǎn)著的正相关。
百度大数据(jù)统计(jì)了(le)截至3月31日中国(guó)内地300个除湖北外主要城市的确诊感染人数,将其与1月23日迁入(rù)该(gāi)城市的(de)人口数(shù)做出了(le)对比(bǐ)。
图5:截(jié)至2020年3月31日中国内地各主要城市确(què)诊人数 (上图(tú)) /当地确诊率 (下图) vs 2020年1月1日至23日从(cóng)武汉迁入人数
上面左图展示了全国主要城市(shì)每个城市从武汉(hàn)迁(qiān)入人(rén)数(x-轴)与截止到3月31日当地累计确诊(zhěn)人数(y-轴(zhóu))的关联。二者存(cún)在显著正相关。说明,当地累(lèi)计确诊人数与(yǔ)当(dāng)地迁入(rù)的武汉人(rén)数存在直接的关联。
考虑(lǜ)到(dào)城市大小的关系,百度研究者也以(yǐ)当(dāng)地感染率(每百万人平均感确诊人数)与从武(wǔ)汉迁入人数做出了分分(fèn)析统计,如右图。结果依然(rán)是显著正(zhèng)相关。
由(yóu)此可以得出(chū)结论(lùn)——在武汉封(fēng)城之前,从武汉迁入人口更(gèng)多的城市,会(huì)有更高的感染人数;同理推断,武汉越早采取封城措施,则疫情波(bō)及范围越小。
再来看第(dì)二项研究结果。数据显(xiǎn)示,疫(yì)情越严重的地方,人(rén)均(jun1)搜索(suǒ)COVID-19相(xiàng)关(guān)关键词的次数也越多。
图6:2020年(nián)1月(yuè)33月31日中(zhōng)国大陆各主(zhǔ)要城市人均COVID-19搜(sōu)索次数 v.s 该(gāi)城市确诊人数(shù) (上图(tú)) /确诊率(下图)
可以看出,中国(guó)内地(dì)除湖北外主要城(chéng)市确诊感染人(rén)数与该城市人均搜(sōu)索COVID-19相(xiàng)关关键词的次数存在显著正(zhèng)相关。由此(cǐ)得出(chū)结论,可能是由(yóu)于感染情况引发(fā)的恐慌心理,人们更愿意(yì)搜索相关信息(xī)。
百度的研究(jiū)还发现,全(quán)国除湖北(běi)外(wài)主要城市的(de)出(chū)行恢复率与(yǔ)当地人通过百度搜索COVID-19次数呈现显著的负相关。也就(jiù)是(shì)说,人均通过(guò)百度搜索COVID-19关键字较多的城市,人(rén)们出(chū)行意愿更低、或是当地疫情管控措施更为严(yán)格(gé) (在排除了其他潜在因素的偏相关性分析后,此关联依然显著)。
图7:截至2020年3月31日中国大陆(lù)各主要城市(shì)出行恢复率 v.s 该城市人(rén)均COVID-19相关信息搜索(suǒ)次数:上图(Log-Log Plot), 下图(tú)正常尺度 。
可以看(kàn)出,当人们主动(dòng)搜(sōu)索信(xìn)息得到(dào)了更多(duō)有关疫情的消息时,便更愿意待在家里(lǐ)。可(kě)以(yǐ)说,百度数据对人口隔离政策和移(yí)动限制政策提供了重要(yào)参考。
大数据全(quán)面赋能(néng)疫情防控:真实掌(zhǎng)握+有效预(yù)警+精准施策
从上(shàng)数研究(jiū)结(jié)果可以看出,百度地图、搜(sōu)索和健康的多维度(dù)数据能够直观(guān)呈现疫情发(fā)展及其社会影响。沈浩认(rèn)为,百度大数据对于征服开展疫情防控与社会治理而言,有着突出意义。
其一,有利于全面、真实、动态掌握疫情防控情况。平时访问发热门诊数量的人是否显著增多?疫情期间居家隔离情况执行如何?百度都(dōu)能够第一时(shí)间给予直观、真实的数据化(huà)呈现(xiàn)。
其二(èr),对可能发(fā)生的疫情(qíng)相关风险提出(chū)预警。百度地图数据可(kě)以直接(jiē)为疫情期间居家隔离(lí)政策、出行限制政策执行情况提供(gòng)参考,对(duì)危险(xiǎn)信(xìn)号提出预警。
第三,动态掌(zhǎng)复工(gōng)复产、经济发展的(de)真实情(qíng)况,形成真实全(quán)面的“景(jǐng)气(qì)指数”。各地、各行业复工复产情况究(jiū)竟如何?百度(dù)地图的商(shāng)户和用户活跃程度,便可以给予客(kè)观的回应,作为政(zhèng)府机构精准施策(cè)的基础。
利(lì)用大数据提升社(shè)会治理能力也是中国政府近(jìn)年来不断努力的方向。
2月18日,工(gōng)业和信息化部印(yìn)发了《关于(yú)运用(yòng)新一代信(xìn)息技术支撑(chēng)服务疫情防控和(hé)复工复产工作(zuò)的通知》,提出有(yǒu)效应用信息化手段助力疫情防控和复工复(fù)产。在中央精神的(de)指(zhǐ)导下,社会各界纷纷探索(suǒ)以信息化途径(jìng)高效开(kāi)展疫情防控。
实际上,在(zài)新冠(guàn)肺(fèi)炎疫(yì)情发(fā)生之前,大数据在国(guó)内外(wài)公共卫生事件(jiàn)中的应用效果已经得到了较好的检(jiǎn)验。此次疫情(qíng)发生后(hòu),韩国、日(rì)本、新(xīn)加(jiā)坡等国家均采用了大数(shù)据手段防控疫情、指(zhǐ)导经济活动(dòng),取得(dé)了(le)良好的效果。
在(zài)中国,相较17年前的SARS疫情,大数据在此次(cì)新冠疫情(qíng)防控中的(de)作(zuò)用尤为明显(xiǎn),涵盖个人健康状况认(rèn)证、远程医疗(liáo)问诊、应急物资调配(pèi)等方方(fāng)面面。
“互(hù)联网公司掌(zhǎng)握(wò)社会许多层(céng)面的数据,政府一方面要(yào)对数据的合规性加(jiā)强监管,另一方面,也要积极(jí)利(lì)用互联网公司的(de)大数据,可以联合科研院所和企(qǐ)业(yè)大数据机构(gòu)协同进行大(dà)数据研究,助力疫情防(fáng)控、应急管理和社(shè)会的精细化治(zhì)理,为决(jué)策提供(gòng)有益参(cān)考。”沈浩表示。