“說到統(tǒng)計,可能人們首先聯(lián)想到的是統(tǒng)計部門。早在戰(zhàn)國時期,商鞅就強調(diào)‘審數(shù)’的重要性,提出變法圖強必須掌握儲糧、人口、牲畜等國力統(tǒng)計數(shù)據(jù)。”在7月11日至13日舉行的第三屆全國統(tǒng)計與數(shù)據(jù)科學聯(lián)合會議上,中國科學院院士、清華大學統(tǒng)計與數(shù)據(jù)科學系講席教授陳松蹊告訴科技日報記者,統(tǒng)計學不僅用于政府統(tǒng)計,還廣泛應(yīng)用于商業(yè)、醫(yī)學、工程、社會科學等領(lǐng)域。它以數(shù)據(jù)為研究對象,研究數(shù)據(jù)的采集、分析、推理等,數(shù)據(jù)科學即“統(tǒng)計學+應(yīng)用場景”。
本屆聯(lián)合會議在浙江省杭州市召開,邀請21個國家和地區(qū)的專家學者參加,學術(shù)報告達600多次。其中,將近四分之一的學術(shù)報告主題與機器學習、人工智能相關(guān)。而根據(jù)中國信通院發(fā)布的《人工智能發(fā)展報告(2024年)》顯示,人工智能面臨算法模型可解釋性不足、框架安全漏洞、數(shù)據(jù)標注不規(guī)范等挑戰(zhàn)。
陳松蹊認為,現(xiàn)階段,有關(guān)人工智能的具體應(yīng)用還比較偏向工程,即優(yōu)先確保算法、模型的工作運行,對背后機理不夠深究。尤其在對精度、安全性要求很高的醫(yī)學、建筑工程等領(lǐng)域,應(yīng)當確保算法模型的穩(wěn)定性、可靠性。
陳松蹊介紹,數(shù)據(jù)是隨機的,模型自身也在變化。考慮到數(shù)據(jù)的不確定性,在超高維參數(shù)設(shè)定下,從變化中找到不變的內(nèi)容,進行歸納、解釋,得到穩(wěn)定、可解釋的算法,統(tǒng)計學可在這方面作出貢獻。他的團隊正在進行相關(guān)研究。
在智能時代,海量復(fù)雜的數(shù)據(jù)成為推動各行各業(yè)發(fā)展的關(guān)鍵要素,學界對統(tǒng)計學人才培養(yǎng)問題也越發(fā)重視!敖y(tǒng)計與數(shù)據(jù)科學研究恰逢其時!标愃甚枵f,但這一專業(yè)存在供不應(yīng)求的問題,需要提升高校的培養(yǎng)能力,為業(yè)界輸送人才的同時,還要讓相當一部分人才愿意留在高校,培養(yǎng)更多統(tǒng)計學家、數(shù)據(jù)分析師。
陳松蹊分析認為,現(xiàn)如今,算法軟件雖然功能強大,但人類不能將思考過程“承包”給人工智能,仍然需要明確問題、掌握程序的運行,具備對人工智能的糾錯能力,在這方面,統(tǒng)計學科將發(fā)揮重要作用。
自2023年以來,全國統(tǒng)計與數(shù)據(jù)科學聯(lián)合會議已連續(xù)舉辦三屆,逐步形成品牌效應(yīng)。作為會議組委會指導(dǎo)委員會委員,陳松蹊感觸頗多:“從2011年統(tǒng)計學成為一級學科以來,全國統(tǒng)計科學研究快速發(fā)展,與其他國家的交流也越來越密切。根據(jù)對國際頂級統(tǒng)計期刊發(fā)表數(shù)據(jù)的多維度測算,中國作者所占份額已位居世界第二!
陳松蹊表示,本次參會的1800多位學者,有15%來自國外。未來,統(tǒng)計與數(shù)據(jù)科學組委會還將加強與工業(yè)界的聯(lián)系,邀請更多企業(yè)參與,促進學科和應(yīng)用創(chuàng)新融合。