首頁(yè) >國(guó)際 >

環(huán)球信息:大數(shù)據(jù)疫情峰值預(yù)測(cè)靠譜嗎

“互聯(lián)網(wǎng)+醫(yī)療”大數(shù)據(jù)可以為防疫提供參考嗎?近日,隨著疫情防控措施持續(xù)優(yōu)化,關(guān)于各地疫情峰值的大V模型、小程序預(yù)測(cè)等也引發(fā)了網(wǎng)友的討論。如在微信小程序中,可查看各大城市疫情高峰時(shí)間進(jìn)度條,直接具體到高峰期的開(kāi)始和結(jié)束日。

專(zhuān)家分析認(rèn)為這種從統(tǒng)計(jì)學(xué)角度做流行病的預(yù)測(cè)和觀察所得出的宏觀趨勢(shì),有一定的參考價(jià)值,但精準(zhǔn)到某天開(kāi)始、某天結(jié)束的數(shù)據(jù)準(zhǔn)確性有待商榷且價(jià)值不大。同時(shí),這兩種模型都將百度這一搜索引擎的搜索數(shù)據(jù)用作數(shù)據(jù)源,存在一定缺陷。

預(yù)測(cè)精準(zhǔn)到“天數(shù)”


(相關(guān)資料圖)

北京商報(bào)記者檢索發(fā)現(xiàn),互聯(lián)網(wǎng)上的疫情峰值預(yù)測(cè)來(lái)源主要有2個(gè):其一是一位大V建模,其二是微信小程序數(shù)據(jù)團(tuán)+。

大V建模方面,經(jīng)濟(jì)學(xué)家、某平臺(tái)百萬(wàn)粉絲大V陳沁用公開(kāi)的百度指數(shù)和一套成熟的數(shù)學(xué)模型做了疫情峰值預(yù)測(cè)。他預(yù)測(cè)北京本輪疫情感染已經(jīng)到達(dá)峰值,一直到1月上旬,會(huì)不斷趨好。

公開(kāi)資料顯示,陳沁畢業(yè)于復(fù)旦大學(xué)經(jīng)濟(jì)系,曾任教于復(fù)旦大學(xué)經(jīng)濟(jì)學(xué)院,現(xiàn)任BBD Index首席經(jīng)濟(jì)學(xué)家。曾在China Economic Review、《經(jīng)濟(jì)研究》《經(jīng)濟(jì)學(xué)季刊》《金融研究》等權(quán)威期刊發(fā)表過(guò)諸多論文。

微信小程序數(shù)據(jù)團(tuán)+,則由一家致力于大數(shù)據(jù)和人工智能領(lǐng)域的科技公司——上海脈策數(shù)據(jù)科技有限公司提供技術(shù)支持,在小程序上選擇想要查詢的城市,便可以顯示所預(yù)測(cè)的該城市“疫達(dá)峰”可視化進(jìn)度圖表,如小程序顯示北京第一波高峰到達(dá)日為12月16日,第一波高峰結(jié)束日為1月13日。

這兩種疫情峰值測(cè)算都有其背后的原理。

根據(jù)陳沁公開(kāi)的信息,他是借鑒了已經(jīng)比較成熟的數(shù)學(xué)模型,用百度指數(shù)去測(cè)算疫情情況,“總體來(lái)說(shuō)就是看超額搜索指數(shù)的覆蓋面積,當(dāng)覆蓋面積達(dá)到一定閾值后就代表人口感染達(dá)到一定閾值,感染自然達(dá)峰、結(jié)束”。

微信小程序數(shù)據(jù)團(tuán)+的原理類(lèi)似,使用的是百度搜索指數(shù)和巨量算數(shù)數(shù)據(jù)進(jìn)行計(jì)算。

北京商報(bào)記者注意到,這兩種預(yù)測(cè)模式都將百度搜索指數(shù)納入了數(shù)據(jù)源之中,但這種依賴搜索引擎數(shù)據(jù)的模型科學(xué)嗎?

數(shù)據(jù)源存問(wèn)題

北京商報(bào)記者將各地官方已經(jīng)公布的疫情高峰預(yù)估時(shí)間和微信小程序預(yù)測(cè)的時(shí)間進(jìn)行了對(duì)比。

如江西省政府新聞辦在12月15日召開(kāi)的江西省新冠肺炎疫情防控工作新聞發(fā)布會(huì)指出,據(jù)專(zhuān)家分析研判,江西省下一波疫情高峰將在今年12月底、明年1月初到來(lái),2023年春節(jié)前后達(dá)到峰值。僅可選擇城市的小程序中查詢的結(jié)果則顯示,南昌市第一波高峰峰值在12月21日,在2023年1月8日結(jié)束高峰期。

對(duì)此,一位統(tǒng)計(jì)學(xué)領(lǐng)域的專(zhuān)業(yè)人士周鴻(化名)向北京商報(bào)記者分析表示,一方面,從統(tǒng)計(jì)學(xué)角度做流行病的預(yù)測(cè)和觀察,所得出的宏觀趨勢(shì)有一定的參考價(jià)值,但精準(zhǔn)到某天開(kāi)始、某天結(jié)束的數(shù)據(jù)準(zhǔn)確性有待商榷且價(jià)值不大;另一方面,這兩種模型都將百度這一搜索引擎的搜索數(shù)據(jù)用作數(shù)據(jù)源,在數(shù)據(jù)源上便存在一定問(wèn)題。

“百度引擎的搜索頻次總體上有一定價(jià)值,但跟實(shí)際結(jié)合后可能存在一些差異?!敝茗櫧忉尩溃紫仍谝苿?dòng)互聯(lián)網(wǎng)時(shí)代,大眾的搜索渠道眾多,百度搜索只是其中之一,甚至還有很大數(shù)量的人群并不會(huì)使用智能手機(jī)進(jìn)行檢索;其次,公共衛(wèi)生事件所受到的影響因素非常多,比如某個(gè)地區(qū)突然出臺(tái)了防疫相關(guān)的政策變動(dòng),會(huì)導(dǎo)致短期內(nèi)該地區(qū)對(duì)相關(guān)話題的搜索量大幅上升。綜合來(lái)看,將百度引擎作為數(shù)據(jù)源之一,并不能完全反映現(xiàn)實(shí)情況。

如何才能使模型更科學(xué)?周鴻建議,將國(guó)家衛(wèi)健委公布的每日陽(yáng)性人數(shù)和進(jìn)行一定規(guī)模問(wèn)卷調(diào)查得出的感染情況作為數(shù)據(jù)源之一,反而更能準(zhǔn)確地反映出某個(gè)城市疫情發(fā)展趨勢(shì)的變化。

回歸到本次模型預(yù)測(cè)的價(jià)值本身,北京社科院研究員、中國(guó)人民大學(xué)智能社會(huì)治理研究中心研究員王鵬認(rèn)為,就模型所測(cè)的月份上的峰值,在宏觀角度上可以為線下防疫提供參考?!耙环矫娓鞯赝ㄟ^(guò)感染情況,提前做好醫(yī)療資源、物資儲(chǔ)備、人員調(diào)度等,也為市民日常生活防護(hù)進(jìn)行一定的提醒;另一方面,這種模型對(duì)全國(guó)各地‘疫情峰值’進(jìn)度都有一定預(yù)測(cè),為全國(guó)一盤(pán)棋、疫情發(fā)展階段不同的地區(qū)合作調(diào)配資源等提供了參考。”

“醫(yī)療大數(shù)據(jù)”尚有局限性

事實(shí)上,運(yùn)用統(tǒng)計(jì)學(xué)的專(zhuān)業(yè)知識(shí)進(jìn)行大數(shù)據(jù)分析、預(yù)測(cè)的案例并不少見(jiàn)。國(guó)家統(tǒng)計(jì)局每個(gè)月發(fā)布的宏觀經(jīng)濟(jì)數(shù)據(jù)如全國(guó)CPI(居民消費(fèi)價(jià)格指數(shù))和PPI(工業(yè)生產(chǎn)者出廠價(jià)格指數(shù))等,便是在對(duì)相關(guān)主體進(jìn)行抽樣調(diào)查的基礎(chǔ)上進(jìn)行的。另外,相關(guān)機(jī)構(gòu)通過(guò)對(duì)人口基數(shù)和增速進(jìn)行統(tǒng)計(jì)后,對(duì)人口規(guī)模的預(yù)測(cè)也屬于統(tǒng)計(jì)學(xué)的應(yīng)用。

而此次“疫達(dá)峰”所屬的醫(yī)療衛(wèi)生領(lǐng)域,則是統(tǒng)計(jì)學(xué)大數(shù)據(jù)適用的一個(gè)相對(duì)特殊的領(lǐng)域。

周鴻介紹了國(guó)外“醫(yī)療大數(shù)據(jù)”的一個(gè)典型案例——谷歌流感趨勢(shì)(GFT)。谷歌公司發(fā)現(xiàn),每年大約有9000萬(wàn)美國(guó)居民使用互聯(lián)網(wǎng)來(lái)查詢與自身相關(guān)的疾病、藥物或者醫(yī)院信息,而關(guān)于流行性感冒的搜索量可以及時(shí)地反映當(dāng)時(shí)流感的現(xiàn)狀;因此,他們使用互聯(lián)網(wǎng)搜索記錄來(lái)即時(shí)預(yù)測(cè)美國(guó)疾控中心延遲發(fā)布的疑似流感病例占比。該研究利用2003-2007年這五年的流感數(shù)據(jù)做模型,其推論在2008年的測(cè)試數(shù)據(jù)中得到很好驗(yàn)證,之后很長(zhǎng)一段時(shí)間的流感預(yù)測(cè)結(jié)果也與實(shí)際情況非常一致。

但四年以后,《自然雜志消息》報(bào)道,在最近的一次流行感冒爆發(fā)中谷歌利用大數(shù)據(jù)流感趨勢(shì)預(yù)測(cè)失效了,這一次谷歌的大數(shù)據(jù)預(yù)測(cè)模型顯示流感爆發(fā)非常嚴(yán)重,然而疾控中心在慢慢匯總各地統(tǒng)計(jì)的流感數(shù)據(jù)以后,發(fā)現(xiàn)谷歌的預(yù)測(cè)結(jié)果遠(yuǎn)遠(yuǎn)超過(guò)了實(shí)際情況。

對(duì)于這種統(tǒng)計(jì)學(xué)大數(shù)據(jù)在醫(yī)療領(lǐng)域的適用性,中南大學(xué)碩士研究生劉琛發(fā)表在《臨床醫(yī)學(xué)研究與實(shí)踐》期刊上的《從谷歌流感趨勢(shì)(GFT)案例分析“醫(yī)療大數(shù)據(jù)”的局限性》一文中得出結(jié)論指出,醫(yī)學(xué)本質(zhì)是一門(mén)經(jīng)驗(yàn)科學(xué),大數(shù)據(jù)是人類(lèi)邁向數(shù)據(jù)時(shí)代的工具,大數(shù)據(jù)分析為許多醫(yī)學(xué)難題的解決提供了新途徑,改變了一些疾病診斷方式,另一方面也為科研教學(xué)提供了有力的數(shù)據(jù)支撐。

“但就現(xiàn)狀而言,大部分大數(shù)據(jù)分析技術(shù)(如nosql)還難以在醫(yī)療領(lǐng)域被重用,只有通過(guò)大數(shù)據(jù)方面的技術(shù)研究,不斷地改進(jìn)大數(shù)據(jù)在臨床醫(yī)學(xué)應(yīng)用中的缺陷,才能更好、更準(zhǔn)確地為患者服務(wù)?!眲㈣≌f(shuō)。

關(guān)鍵詞:

責(zé)任編輯:Rex_21

推薦閱讀