亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩,日本久久久久,日本-区二区三区免费精品,中文字幕日本亚洲欧美不卡

您當前的位置是:  首頁 > 新聞 > 文章精選 >
 首頁 > 新聞 > 文章精選 >

中國信息通信研究院何寶宏: 預見大數據的2018

2018-04-19 09:32:02   作者:   來源:CTI論壇   評論:0  點擊:


  4月18-19日,為期兩天的“2018大數據產業(yè)峰會”在北京國家會議中心隆重召開。本次會議由中國信息通信研究院主辦,旨在進一步落實《促進大數據發(fā)展行動綱要》和《大數據產業(yè)發(fā)展規(guī)劃(2016-2020年)》,支撐大數據國家戰(zhàn)略落地,展示大數據產業(yè)發(fā)展成果,探討發(fā)展面臨重大問題,推動產業(yè)交流與合作。
  中國信息通信研究院云計算與大數據研究所所長何寶宏在首日會議上作“預見大數據的2018”主題報告,以下是內容實錄:
  中國信息通信研究院云計算與大數據研究所所長 何寶宏
  大家下午好!我研究20多年的互聯網,現在主要在禪修如何為互聯網技術相面。在座如果感興趣可以聯系我,共同探討互聯網發(fā)展規(guī)律。哲學問題很有意思,可以讓你們少走彎路。
  大數據從2011年至今7年的時間,也該七年之癢。我個人的觀點,技術在7年的時候至少要換一種說法,7年不能總講一個故事。2011年麥肯錫下一個前沿,2012年紐約時報大數據時代降臨。
  經過多年發(fā)展,大數據正在遭遇成長的煩惱,最近行業(yè)有點煩。某個耿直BOY說中國人大多數情況下愿意用隱私交換便利性。歐盟5月份實施GDPR通用數據保護規(guī)則,核心是個人隱私數據,要求用戶明確同意與數據的流動權。用戶數據追求精益數據小型化,很明顯的要求。最近的大數據在殺熟,Facebook遭遇窘境,包括今日頭條也遭遇窘境。技術必須有變化進行方向性的調整。這是又一個三角困境,技術上追求很多目標時,目標之間容易出現沖突。尤其數據方面,個人隱私、國家安全、便利性三者不可都得,只能選擇兩個。2013年奧巴馬講到,不可能既享有100%的安全,又享有100%的隱私,而且沒有絲毫的不便,我們不得不做出選擇。大數據也需要做出選擇,二選一時會發(fā)生一些調整。
  這些事件意味著什么?短期看,一些大數據應用真正落地。如果大數據在用戶畫像及營銷沒有落地,事情不會發(fā)生。反向證明大數據真的已經成功應用,所以才能出現問題。幾年前搞云計算可靠性不行,我說恰恰是人們開始廣泛使用云計算,要不然不會關心問題。中期看,保護個人隱私必然是未來3年或更長時間內的工作重中之重,全行業(yè)必須團結就有效的保護用戶隱私制定規(guī)則,需要恰當地技術手段提供支持。長期看,最近一系列事件的爆發(fā)是不是意味著已經使用20多年的互聯網免費模式選稿終結?峙逻@是更大的議題,免費模式都是使用用戶數據換取用戶服務的便利性。
  個人判斷,行業(yè)發(fā)展需要調整(變化)。從過去7年時間強調技術、發(fā)展,下一步更多的關注合規(guī)、隱私保護、安全。任何產業(yè)發(fā)展到第二階段必須要強調關注合規(guī)性、安全及隱私問題,早期會重點關心技術與發(fā)展。正在從幾年來高估大數據的影響開始轉變?yōu)榈凸来髷祿挠绊,人總是會高估技術短期影響,而低估技術的長期影響。我們即將迎來開始低估大數據長期影響的階段,現在進入回歸理性階段,行業(yè)正在回歸理性。對大數據以前高估的價值更加理性,以前不太關注的隱私必須補課,需要3年左右的時間。2021年前后會迎來新一輪的黃金發(fā)展期。
  從市場看,我們還將繼續(xù)維持規(guī)模小增速快的態(tài)勢。過去的幾年大數據的主要應用場景是互聯網,未來幾年的核心是大數據與傳統(tǒng)行業(yè)、實體經濟的深度融合。十九大報告講的很清楚,我們必將迎來的是跟傳統(tǒng)行業(yè)如何更好使用大數據的過程,因為傳統(tǒng)行業(yè)更容易賺錢。
  從技術看,排在第一的是開源,開源正在引領各行各業(yè),大數據不例外。分布式,今天上午報告也講到實現在線分析的分布式,下一步需要實現在線處理事物的分布式。OLAP/OLTP的融合是新的趨勢。隨著產業(yè)的發(fā)展完善,意味著產業(yè)的分工越來越細,相互之間的協作會越來越麻煩。反推的結果是我們所做的大數據產品與技術需要標準化、模塊化,越來越模塊化。因為不可能做龐大體量堆在一起,運維需要自動化比較好理解,我們越來越龐大。機器產生的事情只能用機器解決,大數據產生的運維問題只能靠大數據產生的自動化運維解決。容器化,今天的大數據也需要借助容器的思想封裝交付。幾年前發(fā)現軟件開發(fā)交付等跟環(huán)境關系過于密切,是不是今天看到大數據也是這個問題。大數據遷移時與環(huán)境配置的關系過于密切,我們應該發(fā)面向技術類似于容器的技術。專用硬件,隨著摩爾定律的減速,越來越多的需要靠一些專用的而不是通用的硬件解決問題。面向特定場景數據處理的專用硬件或軟硬件結合會是重要的發(fā)展考慮的方向。
  從算法看,算法的透明度會成為需要關心的議題。今天看到雖然把數據開放使得數據透明,如果算法是黑箱還會出現你想干什么就干什么的現象。隨著數據越來越多,數據越來越開放要打破算法黑箱,解決算法的歧視問題和算法殺熟問題。很多算法都一樣,尤其金融市場會引發(fā)共振及算法移情問題。開放算法是必須要考慮的議題,剛剛討論過網絡中立問題。算法該不該中立?算法該不該透明?算法該不該監(jiān)管?我想需要。
  從資產看,過去幾年知道數據是資產,市場教育已完成。但如何把數據變成資產還在迷茫中,前幾年想是否通過財務手段把數據變?yōu)橘Y產,現在看是不夠的,需要更多的技術支撐。未來三年要學習如何把數據變成資產,不僅通過資本與管理的手段,還需要新的技術,需要創(chuàng)新算法、創(chuàng)新技術、創(chuàng)新模式。
  從流通看,我們處于男耕女織的時代,今天調查50%的大數據企業(yè)使用的數據還是自己生產的或隔壁家生產的。大數據說是資產,但它沒有變成資產。我們說大數據商品,但大數據沒有變成商品。我們只知道大數據很有價值,但如何流通還處于早期的階段,需要很多技術創(chuàng)新、理論創(chuàng)新。30年后得諾貝爾經濟學獎的人一定會有是干這個活的,因為需要數字經濟時代的數字經濟學家。今天的經濟學更多的建立在工業(yè)經濟的假設之上,上來就討論工廠、工人與產品,用貨幣衡量價值都是工業(yè)時代的思維。數字時代需要數字時代的經濟學家解決數據流通存在的理論問題、方法問題。處于從農耕產品的貿易到數字產品的轉折,現在不太清楚數據如何做貿易,我們正在探索之中。工業(yè)經濟學正在從數字經濟學躍遷。
  從價值看,需要新的用戶,新的價值。數據保護問題更像隱私危機,我們說大數據是石油,石油也經歷過危機,愛迪生危機。煤油的主要用途是照明,愛迪生發(fā)明了電燈后是不是石油面臨危機?石油的用途只是照明,可是電燈來了。后來改善石油的冶煉技術,煉出汽油,更加廣泛地用于動力。今天大數據主要面向人,面向人的大數據分析處理應用依然會帶來隱私危機。只要知道的都是隱私,不知道的就不是隱私。凡是能夠發(fā)現處理的最終都會被歸于用戶隱私范圍內,必然會迎來隱私危機。我們需要新的模式與新的創(chuàng)新,將大數據的使用范圍擴展,使用價值擴展。不僅僅面向人,可能要面向物聯網、工業(yè)等各行各業(yè)。過去幾年更多處理人產生的數據。
  從風險看,必然會出現風險,數據是資產,資產是數據。人類的財富正在虛擬化,正在數據化,意味著風險正在由物理世界、現實世界遷移到虛擬世界、數據世界。哪里有風險,哪里就有保險。信通院聯合中國人保推出云計算的保險有四年的時間,希望與業(yè)界一起研究如何為數據買保險,如何通過金融手段解決數據面臨風險問題。
  從理想看,萬物皆數據,數據皆兄弟,我們需要連接。單個的孤島數據價值不大,我們必須搞流通。我們是連接的時代,流通產生新的價值,F在不是單體重要,而是單體與別人之間的連接更加重要。數據的價值不取決于數據本身是什么,而取決于數據跟其它數據之間的關系是什么,位置是什么,在數據世界處于什么位置。連接比數據本身更重要,我們一定會連接起來。我們搞開放、共享的核心目的只有一個,讓數據連接流通是長期的目標,需要與在座的諸位共同努力。
  當摩爾定律逐漸老去的時候,我們正在迎來摩爾定律老去的時代會不會死掉,不知道,但會越來越慢。摩爾定律減速的時候會對整個行業(yè)帶來翻天覆地的變化,我們需要改變傳統(tǒng)思維方式。以前覺得計算資源很便宜,浪費點沒什么,今天的計算資源越來越貴,因為摩爾定律減速。以前行業(yè)的增速非常穩(wěn)定,有節(jié)奏感,因為有摩爾定律什么也不干就摩爾定律穩(wěn)定的讓你增長。今天當摩爾定律減速甚至停緩的時候,行業(yè)當然會往前走,但不能緊緊依靠摩爾定律,我們要依靠軟件。我們需要更新軟件的結構,最近看到很多新的軟件結構出現原因之一,底層計算資源不再符合摩爾定律增長速度,所以要創(chuàng)新軟件與架構的設計。
  改進算法。以前不太關心算法的改進,因為算法改進付出的成本可能比摩爾定律芯片買一個更高。與其改進算法,不如再買芯片。今天必須改進算法,因為底下的計算資源越來越貴。算法優(yōu)化成為未來幾年非常重要的發(fā)展方向,包括大數據處理。因為底層資源再浪費不起。
  硬件。以前通用硬件非常廣泛,通用硬件越通用價格越低,缺點是越通用的性能越差。硬件性能上不去只好優(yōu)化硬件,而不再是通用的硬件。面向數據的軟硬件結合是重要的發(fā)展方向。
  當大數據遇到區(qū)塊鏈都是用來處理數據,一個是希望擴展數據的內心,結構化擴展到更多的數據結構。數據以前做信息,現在做價值,海量數據提高計算性能。區(qū)塊鏈說針對關鍵數據,主要核心目的是為了防篡改,也有計算模式。把一件事分給多個人做,區(qū)塊鏈希望多個人重復做一件事情,有利于防篡改。一個用的服務器積存,一個是用的P2P網絡,一個數據是信息,一個數據是價值。大數據處理需要給做大數據的人發(fā)工資,因為激勵是外部的。發(fā)幣的時候可以內置,而不是通過外部的數據。大數據宣傳的口號是相信數據,區(qū)塊鏈的口號是相信數學。
  大數據遇到人工智能,大數據做數據的可視化,因為計算機把數據看明白了,可是人看不明白。計算機視覺,因為人看明白了,就是機器看不明白。一個往左一個往右,前幾年宣揚大數據主張關聯關系而不是因果關系,回到了愚昧的原始社會。機器學習能證明數據之間有關聯,但機器學習為什么出現這樣的結果無法解釋。證明存在關聯關系,但無法解釋為什么有因果關系。當忘記成為例外,讓機器忘記也是一種幸福。發(fā)明很多技術,核心目的就是記住,因為人的記性太差。你忘了黑客沒有忘記,數據很久遠,以上永流傳。以前發(fā)表文章需要交版面稅,今天刪貼子試一試,遺忘權成為新問題。以前只關注如何記住問題,現在關注如何永久性的消滅數據是工程師新的發(fā)展機會。
  我們做很多數據,只關心數據從哪里來的,用完了以后數據去了哪里?大數據基本進冷宮,用完了就完了,80%的數據三個月以后無人理睬。GDPR隱私數據要滅絕,隱私數據的種族大屠殺。區(qū)塊鏈數據價值得永生,因為是為了防篡改,數據世界的價值越高壽命越長。介質壽命,有的數據會莫名其妙地消失,不知道去哪里,因為介質的壽命很短。我們的磁盤長點就是幾十年的壽命,今天存儲的數據千年以后的人怎么找到,如何打開word文檔。他們去哪里考古這代人所謂的大數據,到哪里發(fā)現?他們能認出表情包。
【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

專題

霍山县| 武宁县| 邵武市| 忻城县| 岢岚县| 革吉县| 玛多县| 麦盖提县| 凤翔县| 桃源县| 竹溪县| 寻乌县| 吉安县| 改则县| 全南县| 蒲江县| 麻城市| 韶关市| 洞口县| 甘南县| 察雅县| 南丹县| 定襄县| 安远县| 浮梁县| 瑞丽市| 葫芦岛市| 洛隆县| 德钦县| 玉龙| 海盐县| 会泽县| 宜君县| 西充县| 青龙| 通化县| 霍州市| 资中县| 田林县| 柳林县| 蓝山县|