山西移動IT規(guī)劃建設中心 陳鋼 2009/02/11
近10年來,中國移動的用戶數呈爆炸式增長,其BOSS和經分系統(tǒng)的數據積累已達天文數字,其后臺系統(tǒng)之復雜和巨大也毫無懸念地堪稱世界之最。那么,除了計費以外,這些豐富的數據資源給我們帶來了哪些財富?管理這些數據的成本又占據了多少運營成本?更重要的是,在競爭環(huán)境發(fā)生變化、電信市場的競爭進入以數字業(yè)務或全業(yè)務為主要產品的長尾市場競爭時,中國移動這幾年建立起來的超級龐大而復雜的支撐系統(tǒng)會成為競爭的核心能力還是包袱?這些問題都應該是一個進入成年期的企業(yè)所要考慮的重要內容。因為在信息爆炸時代,能給企業(yè)帶來價值的數據是寶藏,反之就是垃圾。計費系統(tǒng)的數據
計費系統(tǒng)從早期的小型計費軟件逐漸發(fā)展到目前成為電信行業(yè)最重要的IT系統(tǒng),每天承擔著巨大的交易量。其發(fā)展動力來自兩個方面:一是高速用戶數增長帶來系統(tǒng)處理能力和速度的快速擴容,從普通速度硬盤,到高速內存數據庫,可謂對所有市場上的技術無所不用,被稱之為“用空間換時間”;二是省級公司與各地市本地需求間的矛盾,集團公司統(tǒng)一營銷策劃案與各分公司市場部具體地方銷售策略之間的矛盾導致計費系統(tǒng)高密度的系統(tǒng)變更,很多省公司計費中心對一星期經歷10次以上的上線習以為常,并稱之為“用時間換空間(市場空間)”。
系統(tǒng)如此高速擴充,使我們無法顧及整體數據架構和整體應用架構的規(guī)劃和設計,也沒有時間從業(yè)務的視角分析計費支撐系統(tǒng)生命之源的業(yè)務流程。我們曾經分析,如果一個用戶訂購了所有的套餐(這是不可能的),那么他一年的計費記錄信息也不應超過150kB數據,對于一個擁有1000萬用戶的運營商來說,10TB的計費數據已經是不小的規(guī)模,可實際上目前一般我們都會有50TB以上的數據,甚至100TB。可以想象,數據的冗余、存儲的冗余使垃圾數據已經達到了難以控制的局面,凡是有數據處理經驗的人都知道,管理這個規(guī)模的數據有多么艱難。
經分系統(tǒng)的數據
經分系統(tǒng)一般有4個主要功能:建模分析,尋找聚合數據群并判斷市場切分;統(tǒng)計分析,預測結果并回歸建模;出統(tǒng)計報表;出KPI指標情況。由于各種原因,中國電信市場的不充分競爭導致經分系統(tǒng)的前兩個功能基本沒有派上用場,大部分經分系統(tǒng)還是用后兩個功能。但經分系統(tǒng)的建設參考了國外的數據結構建設,導致其數據架構不夠高效,加上作為數據源的計費系統(tǒng)混亂的數據架構狀況,使這方面的問題更加突出。一般意義的數據倉庫工具都是為建模分析設計的。每年企業(yè)都要拿出大量的資金來擴容經分系統(tǒng),因為不擴容就無法滿足客戶增長的需要,而反思其對收入的貢獻則實在是無法平衡,導致各省公司在做此類IT投資時苦不堪言。更關鍵的問題是,如果競爭真的進入白熱化,中國移動的競爭利器可能就是經分系統(tǒng),但長期以來的經分報表化操作可能會使經分系統(tǒng)的數據體系難以支持高頻度建模。
分析以上兩個方面的原因,我們可以看到這樣幾個方面的問題。
首先是每到月初和月末的兩周,計費和經分系統(tǒng)都會承受出報表的巨大壓力,這往往成為每年擴容的惟一依據;第二就是數據似乎永遠也無法保證全部正確,即數據的惟一性問題,于是系統(tǒng)就不斷重建新數據集,包括內存駐留、臨時駐留、短暫駐留等等花樣繁出,導致運營商很難看清整體數據體系;第三是計費出報表時與計費功能及詳單查詢搶資源,經分系統(tǒng)出報表和地市數據查詢或其他應用搶資源,經分系統(tǒng)上除了報表KPI以外,功能已經很少,即便如此,經分系統(tǒng)仍舊面臨永遠的資源短缺。
數據體系改進建議
根據上述計費系統(tǒng)和經分系統(tǒng)的數據情況,筆者對運營商數據體系的改進提出以下4點建議。
1.以業(yè)務流程為驅動力,首先分析語音業(yè)務、數據業(yè)務、固數業(yè)務的特點,把實現靈活快速的業(yè)務組合作為數據架構調整或優(yōu)化的最高目標,同時最大限度地保留原有數據體系而進行新的數據架構設計。
2.分別建立交易型(transactionaldatasystem)、分析型(analyticaldata system)和操作型(Operational data system)數據集。但這個過程不可一蹴而就,要持之以恒,并由縱觀企業(yè)IT全局戰(zhàn)略的部門來負責。3個數據系統(tǒng)成型后才可逐漸根據業(yè)務的需要和不同數據的歷史價值進行數據生命周期的定義。
3.參照SID形成對企業(yè)數據體系的全面掌控,包括建立數據字典、數據域間流程的描述、數據變更展示等。根據以往經驗,這部分工作有相當大的難度,最主要的難度來自現有的計費系統(tǒng)。以上敘述的原因,導致幾乎1/2的數據由中間數據表構成,這部分數據很難根據SID的模型做映射,也沒有固定的數據架構和數據屬性,從而成了數據黑洞。對這類問題,運營商需要伴隨ODS(操作型數據系統(tǒng))的建立而逐步進行改進。
4.與企業(yè)業(yè)務流程、系統(tǒng)流程、變更流程同步建立數據變更流程管控平臺,形成對數據全生命周期的監(jiān)控,完全改變現有管控。當我們無法改變現有在線系統(tǒng)時,就需要對它進行監(jiān)控,并建立完善的變更流程,抑制錯誤的做法。因此要建立一整套相對完善的數據監(jiān)控系統(tǒng),為決策層提供數據生命周期管理、數據變更管理、數據介質使用、數據使用權限管理等方面最直接的依據。
總之,數據、應用和業(yè)務流程是電信企業(yè)IT建設的3個重大領域,在沒有統(tǒng)一IT組織架構的現實情況下,我們從事支撐系統(tǒng)開發(fā)和運維的同時,必須實事求是,不能完全推翻過去的IT系統(tǒng),只能將其改進。從業(yè)務流程分析出發(fā),自上而下地提出對數據系統(tǒng)的改進措施是比較現實的做法,特別是參考TMF的SID模型進一步形成企業(yè)數據架構。我們要依據全業(yè)務經驗的業(yè)務模型著手設計企業(yè)交易型數據系統(tǒng)、分析型數據系統(tǒng)和操作型數據系統(tǒng),循序漸進地實施,并在企業(yè)數據模型設計的過程中考慮數據的生命周期定義。
通信世界周刊

