2017/03/20 信息來源: 海外網
海外網財經3月17日電 今年的政府工作報告中提到,加快大數據、雲計算、物聯網應用,以新技術新業態新模式,推動傳統產業生產、管理和營銷模式變革。這已經是“大數據”相關表述連續第四年被寫入政府工作報告。乘著“兩會”的春風,“大數據”再一次成為大眾討論的焦點。
如何進行可靠的大數據分析?目前國家對大數據戰略的落實狀況如何?政府數據公開的過程中面臨著哪些挑戰?帶著這些問題,海外網財經對話意昂3体育官网國家發展研究院教授沈艷,對此進行探討。
沈艷認為,近幾年在促進大數據產業健康發展方面,我國已經積累了相當豐富的經驗。“未來,若想讓政府有步驟、有計劃地推行數據開放,需要專門的機構來統籌數據治理工作。”
大數據分析需要“大小結合”“人機結合”
信息時代,海量數據正在以前所未有的廣度和深度融入人們的社會生活,推動著諸多行業的變革。然而,在實際的數據應用過程中存在著數據源“汙染”嚴重,原始數據誇大或瞞報的現象。對此,沈艷認為,“可靠的大數據分析首先需要回歸數據的本源問題,明確小數據和大數據的區別及聯系,然後根據分析目的來明晰大數據和小數據的選取”。
沈艷提出:“小數據往往是為特定目標的收集,多為結構化的數據,在使用中也會比較透明。而大數據多為人類活動的衍生信息,技術進步容許采集顆粒度更細的信息,成本也大幅度降低。但是它包含不少冗余信息,對於分析和處理的要求可能更高。”
“當我們說到大數據和小數據的區別的時候,應該弄明白一點:雖然它們在表象上,大數據能夠記錄更多的信息,但是不見得大數據一定更好,它取決於你要研究的問題以及目的。”沈艷解釋說。
談及可靠的大數據分析需要具備哪些要素時,沈艷認為至少要有三個關鍵點:第一是分析目標明確;其次是數據質量要高;第三則是數據的分析方法要科學。
在沈艷看來,孤立使用大數據做出來好產品的情形並不多見。“可靠的大數據分析往往具有‘大小結合、人機結合’的特征。”
“大小結合”不僅是指大數據分析往往需要借助小數據,還指大數據分析出的結果也要用小數據來檢驗。“谷歌流感趨勢近年來對於流感的預測遠不如美國疾控中心的小數據準確,這就說明方法還需要進一步調整。”沈艷認為。另外,“人機結合”則是說大數據分析出來的結果也需要經過人的直覺和經驗,避免“垃圾進、垃圾出”,這就需要跨界的高素質人才參與到數據質量評估、數據分析的工作中來。
大數據戰略逐步推進,智能製造將成主攻方向
近兩年,隨著大數據的概念逐漸普及開來,大眾不僅對大數據以及大數據分析有了更加深入的理解,大數據作為重要資源也逐漸被提上國家戰略。
談及國家對大數據戰略的落實狀況,沈艷提出,“對於這一問題,我們可以從‘大數據’一詞在歷年政府工作報告中出現的措辭變化中一見端倪。”
今年的政府工作報告,大數據在兩處被提及,一是總結2016年工作時指出,“深入推進‘互聯網+’行動和國家大數據戰略,全面實施《中國製造2025》”;二是在2017年工作重點中,提出“深入實施《中國製造2025》,加快大數據、雲計算、物聯網應用,以新技術新業態新模式,推動傳統產業生產、管理和營銷模式變革。把發展智能製造作為主攻方向,推進國家智能製造示範區、製造業創新中心建設,深入實施工業強基、重大裝備專項工程,大力發展先進製造業,推動中國製造向中高端邁進。完善製造強國建設政策體系,以多種方式支持技術改造,促進傳統產業煥發新的蓬勃生機。”
回看近四年的政府工作報告,沈艷表示,“在2014年,‘大數據’還處於‘頭腦風暴’階段,國家對於它的期望是可以趕超先進,引領未來。到了2015年,政府開始推動大數據與現代製造業相結合。2016年展望十三五期間,用的詞是‘促進’,而今年對於過去工作的總結是‘深入推進’國家大數據戰略。”沈艷強調,“尤其值得註意的是今年的政府工作報告指出,‘加快大數據、雲計算、物聯網的應用’,在具體應用的引領方面上,方向更加明確,提出以發展智能製造作為主攻方向。”
“這表明,在促進大數據行業健康發展方面,我國從過去幾年的大數據產業發展中已經積累了相當豐富的經驗,對於大數據與傳統產業協同發展的新業態模式,明確了‘智能製造’這個切入點。在可以預見的未來,智能製造有很大的發展空間。”沈艷分析稱。
政府數據公開需要專門機構統籌治理
目前,70%-80%的政府數據還處於“地下水”的狀態。既然大數據已經由概念逐漸落地被提升為國家戰略,那麽進一步激活政府數據、釋放數據價值將是政府和大數據產業面臨的重要議題。對此,沈艷認為,可靠的大數據分析,需要“大小結合”。大數據質量的優劣,不少時候需要高質量的“小數據”為錨定標準。在這個層面上,政府數據開放的程度和廣度對產業未來的發展至關重要。
而政府部門在開放數據的過程中也會遇到著一些挑戰,具體到統計部門,沈艷認為主要面臨著三個方面的實際困難。
第一,開放數據的合法性。就《統計法》而言,雖然提到“縣級以上人民政府統計機構和有關部門統計調查取得的統計資料,除依法應當保密的外,應當及時開放、供社會公眾查詢”,“但是其他相關條目讓地方統計部門不易拿捏哪些信息需要開放、哪些不需要開放。”沈艷表示。
第二是數據標準不一,質量良莠不齊。沈艷坦言,“不要說合並不同省份不同部門的數據,就是一家大型機構內部的數據,都可能因為定義不同、質量差異大而不好使用。”第三則是數據共享標準不清。沈艷提到,“數據的價值關鍵在於整合。但是,不同部門之間哪些信息可以共享並不清楚。”
談到如何應對這些挑戰時,沈艷建言,“要讓政府有步驟、有計劃地推行數據開放並達到期望的效果,需要專門機構來統籌數據治理工作。這可能需要政府的高層領導負責,這樣才能從全局把控、製定相應標準。”
同時,需要有關部門進一步明確“開放什麽”、“對誰開放”和“如何開放”的問題。“對於‘開放什麽’的問題,可以梳理各國已經開放的各類數據,訂立我國逐步開放數據的時間表。”沈艷認為,“關於‘對誰開放’和‘如何開放’,這裏需要明確的是開放並不等於免費和對所有公眾都開放,需要將數據按照等級分級。”她強調,“那些滿足公眾知情權的基本數據要免費開放,對於其他組織、全體,則應考慮不同的安排。在這個過程中,既要滿足公眾知情權,又要保證數據安全在可控的範圍之內。”
最後,沈艷指出,“希望這些挑戰不要成為推行政府數據開放的障礙,而是前進的動力。我國擁有世界最大的人口規模,從這個意義上講,大數據資源十分豐富。關鍵在於要讓企業、學術機構和不同群體參與到數據的使用與發掘當中,這對於促進經濟發展,實現傳統經濟向新經濟的順利轉型,具有重要意義。”(孫麗娜)
信息來源:海外網
相關鏈接:沈艷:統籌數據治理 助力新經濟發展
專題鏈接:聚焦兩會(2017)
編輯:安寧
轉載本網文章請註明出處