24小時(shí)聯(lián)系電話(huà):18217114652、13661815404
中文
行業(yè)資訊
大數據和人工智能可以新型冠狀病毒
新型冠狀病毒來(lái)自與嚴重急性呼吸系統綜合癥(SARS)和普通感冒有關(guān)的病毒家族。大數據和預測分析與人工智能和各種熱傳感器相結合,是控制這種流行病的傳播并將其死亡人數降至底的強大工具。
鑒于最多只能零星地檢測病毒,因此感染病例的數量通常非常不確定,因此對該病毒的真正危險性提出了質(zhì)疑。支持流行病學(xué)專(zhuān)家的決定性貢獻可能來(lái)自數據分析技術(shù)。
數據分析和數學(xué)一樣,都起著(zhù)基本作用,它與物理學(xué)一起使我們能夠深入了解自然的細節以及如何制造事物。與過(guò)去幾年一樣,數據科學(xué)的先驅對世界產(chǎn)生了不可思議的影響,在數據傳播和分析過(guò)程中,數據和分析已被用來(lái)推動(dòng)重大變化。數據分析的最早歷史應用之一是在1852年倫敦霍亂爆發(fā)期間。最早由數據驅動(dòng)的流行病學(xué)家之一約翰·斯諾(John Snow)能夠對倫敦發(fā)生的死亡進(jìn)行地理空間分析,從而隔離了疾病的來(lái)源。依靠他的分析,當局能夠針對性地采取干預措施,以迅速檢查該流行病的蔓延。
讓我們評估數據
事實(shí)證明,通過(guò)數據分析系統運行模型可以近似估計趨勢如何發(fā)展。SIR模型就是一個(gè)例子。它是一種流行病學(xué)模型,用于計算封閉人群中隨著(zhù)時(shí)間推移感染傳染病的理論人數。該模型使用耦合方程來(lái)分析易感人群S(t),感染人群I(t)和恢復R(t)的人數。Kermack-McKendrick模型是最簡(jiǎn)單的SIR模型之一。Kermack-McKendrick流行病模型被認為是許多其他隔離模型的基礎。在這方面,我發(fā)現Ettore Mariotti的分析非常有趣。
首先,要考慮一個(gè)島嶼,即我們的系統,不允許人們進(jìn)出。每個(gè)人在給定時(shí)間都可以處于以下?tīng)顟B(tài)之一:“易感”,“感染”和“已康復”,因此縮寫(xiě)為SIR,因為從未患過(guò)該?。?span>S)的人很有可能會(huì )生病并在一定時(shí)間內感染(I),然后恢復(R)。就新型冠狀病毒而言,將模型擴展為附加狀態(tài)“已暴露”是適當的,以包括具有病毒但尚未感染的人(SEIR模型)。
圖1:SEIR模型
該模型考慮了兩個(gè)因素:病毒的動(dòng)力學(xué)和個(gè)體之間的相互作用。后者非常復雜,并且需要像上一段中所述的技術(shù)。有了這些,就可以定義R0參數,該參數表示被感染者可能感染的人數。
例如,假設某人A生病并且我們的系統的R0 = 2。這意味著(zhù)A將感染兩個(gè)人。這兩個(gè)人將依次感染四個(gè)人,每個(gè)人將另外感染兩個(gè)人(因此4 * 2 = 8),依此類(lèi)推。這凸顯了該疾病的傳播是乘法而不是累加的事實(shí)。R0可以捕獲三種基本情況,如圖2所示。
圖2:R0模型
學(xué)校,體育館等的關(guān)閉,減少了人們的社交互動(dòng),從而降低了R0。健康系統是有限的,將這個(gè)參數降低到1以下非常重要。如果R0> 1,則疾病傳播;如果R0 <1,則疾病消失??梢院侠淼仄谕畬θ藗兊牧鲃?dòng)性施加更嚴格的限制,以減少R0。
重要的是要注意,R0衡量的是疾病的潛在傳播途徑,而不是疾病傳播的速度??紤]流感病毒的普遍性,其R0僅為1.3。高R0是引起關(guān)注的原因,而不是引起恐慌的原因。
R0是平均值,因此可能會(huì )受到超級吊具事件等因素的影響。超級傳播者是指感染了很多人的受感染的個(gè)人。在SARS和MERS流行期間以及當前的新型冠狀病毒期間,發(fā)生了超級傳播事件。此類(lèi)事件不一定是一個(gè)壞兆頭,因為它們可能表明持續流行的人數減少了。超級傳播者也可能更容易識別和遏制,因為他們的癥狀可能更嚴重。
簡(jiǎn)而言之,R0是移動(dòng)目標。跟蹤每個(gè)病例和疾病的傳播非常困難,因此估計R0既復雜又具有挑戰性。估算值經(jīng)常隨新數據的可用性而變化。
哪些技術(shù)解決方案可以減慢或終止新型冠狀病毒的傳播并控制R0?AI的使用以及手機GPS運動(dòng)的數據,可以創(chuàng )建分析模型,以預測哪些社區更有可能發(fā)生未來(lái)的情況或需要緊急干預的社區。
大數據,人工智能和傳感器
在流行的情況下,就質(zhì)量和一致性而言,臨床數據可能變化很大。這種并發(fā)癥包括假陽(yáng)性患者。大數據和AI可以用來(lái)檢查是否符合隔離要求,而機器學(xué)習可以用于藥物研究。這些只是新數字技術(shù)提供的一些解決冠狀病毒緊急情況的解決方案。在亞洲,有許多通過(guò)使用數字技術(shù)實(shí)施干預措施的例子。
配備有智能掃描儀和照相機的無(wú)人機可以檢測不符合隔離措施的人員,并可以檢查人們的體溫。在中國大陸和臺灣使用智能相機可以攔截不戴口罩但可以進(jìn)行實(shí)時(shí)熱掃描以發(fā)現發(fā)燒病例的人員。
例如,中國公司SenseTime開(kāi)發(fā)了一個(gè)即使戴面具也能掃描人臉的平臺,而阿里巴巴則開(kāi)發(fā)了基于AI的新型冠狀病毒診斷系統。SenseTime是一家全球公司,致力于開(kāi)發(fā)AI技術(shù),以促進(jìn)世界經(jīng)濟,社會(huì )和人類(lèi)的美好明天。它也是全球資金最高,估值最高的AI純游戲。
SenseTime宣布其非接觸式溫度檢測軟件已在北京,上海和深圳的地鐵站,學(xué)校和公共中心實(shí)施。同時(shí),阿里巴巴基于人工智能開(kāi)發(fā)了針對新型冠狀病毒的新診斷系統,該系統可通過(guò)計算機斷層掃描(即CT掃描)檢測新冠狀病毒病例,準確率高達96%。
圖3:病毒的進(jìn)化
Graphen與哥倫比亞大學(xué)一起,正在嘗試定義病毒每個(gè)基因定位的規范形式,并確定確切的變體。它使用模仿人類(lèi)大腦功能的Ardi AI平臺來(lái)存儲這些突變數據并使之可視化。在右側的可視化圖中,每個(gè)紅色節點(diǎn)代表一個(gè)病毒。每個(gè)綠色節點(diǎn)代表一組具有完全相同的基因組序列的病毒。單擊紅色節點(diǎn)可以查看病毒的信息,包括位置,性別,年齡等。
大數據控制的另一個(gè)有用工具是大數據。在緊急時(shí)期,它已被普遍用于改善監視系統,以繪制病毒傳播圖。
大數據的獲取和處理要求設計用于收集和分析的新方法和新技術(shù)。特別是,我們可以區分大數據分析的四種類(lèi)型或方法:
描述性分析,即用于描述業(yè)務(wù)流程或業(yè)務(wù)項目的當前和過(guò)去情況的方法和技術(shù),以綜合和圖形方式表示活動(dòng)的績(jì)效指標;
預測分析,即使用回歸分析和預測模型等數學(xué)技術(shù)幫助了解未來(lái)可能發(fā)生的數據分析工具;
規范分析,用于確定有效的戰略和運營(yíng)解決方案;
自動(dòng)化分析,其中包括一些工具,這些工具可根據執行的分析結果自動(dòng),自動(dòng)地執行所需的操作。
阿里巴巴還開(kāi)發(fā)了一個(gè)應用程序(“支付寶健康代碼”),該應用程序使用中國醫療保健系統提供的大數據來(lái)指示誰(shuí)可以訪(fǎng)問(wèn)公共空間或不能訪(fǎng)問(wèn)公共空間。
BlueDot是一家位于多倫多的初創(chuàng )公司,它使用圍繞人工智能構建的平臺,已經(jīng)開(kāi)發(fā)了用于自動(dòng)監控傳染病傳播及其預測的智能系統。在SARS傳播期間,BlueDot平臺已經(jīng)取得了積極的成果。在2019年12月,BlueDot還提出了有關(guān)冠狀病毒綜合征嚴重程度的警報,事實(shí)證明這是正確的。在BlueDot使用的工具中,還有一些以NLP(自然語(yǔ)言處理)為名的技術(shù),用于處理人們的語(yǔ)言和表達自己的方式。
Insilico Medicine是另一家致力于通過(guò)人工智能預防疾病的公司。Insilico Medicine正在開(kāi)發(fā)下一代人工智能和深度學(xué)習方法,并將其應用于藥物發(fā)現和藥物開(kāi)發(fā)過(guò)程的每個(gè)步驟。目前,它正在開(kāi)發(fā)一項技術(shù),該技術(shù)將告知醫生有關(guān)可以抵抗冠狀病毒的分子的信息。在最近分析了分子之后,Insilico Medicine系統可以提供有關(guān)抗擊冠狀病毒的信息。該初創(chuàng )企業(yè)目前正在開(kāi)發(fā)疫苗開(kāi)發(fā)項目中的信息數據庫。
衛星分析技術(shù)已經(jīng)發(fā)現,WeBank研究人員使用它們來(lái)識別鋼廠(chǎng)中的熱點(diǎn),這些熱點(diǎn)為該行業(yè)的復蘇提供了重要信息。
在流行初期,這項分析表明,鋼鐵產(chǎn)量已降至產(chǎn)能的至少29%。但是到2月9日,它已經(jīng)恢復到76%。然后研究人員研究了使用AI的其他類(lèi)型的生產(chǎn)和商業(yè)活動(dòng)。其中一項技術(shù)就是簡(jiǎn)單地計算大型公司停車(chē)場(chǎng)中的汽車(chē)數量。該分析表明,截至2月10日,上海的特斯拉汽車(chē)生產(chǎn)已完全恢復,而上海迪士尼樂(lè )園等旅游活動(dòng)仍處于關(guān)閉狀態(tài)。
2019年12月30日(左)和2020年1月29日的并排衛星圖像顯示,中國的鋼鐵行業(yè)活動(dòng)仍在下降。通過(guò)分析GPS衛星數據,可以確定哪些人正在上下班。然后,該軟件計算每個(gè)城市的通勤人數,并比較從農歷新年開(kāi)始的2019年給定日期和2020年相應日期的通勤人數。在這兩種情況下,農歷新年的通勤人數都大幅下降,但與2019年不同的是,假期后上班人數沒(méi)有恢復。隨著(zhù)事情的逐步恢復,WeBank研究人員計算出,到2020年3月10日,大約75%的勞動(dòng)力已恢復工作。根據這些曲線(xiàn),研究人員得出結論,除武漢外,大多數中國工人將在3月底恢復工作。根據他們的研究,第一季度的經(jīng)濟增長(cháng)將達到36%。
那些試圖應對冠狀病毒挑戰的人在技術(shù)上有著(zhù)重要的盟友。通過(guò)在緊急階段進(jìn)行測試的解決方案,將來(lái)可能成為標準。
本文來(lái)自:eetimes