在數(shù)據(jù)的洪流中決策
????作者:斯圖亞特?布朗(Stuart F. Brown) ????工業(yè)數(shù)據(jù)庫(kù)里往往隱藏著沉沒的寶藏,。這里有一條引領(lǐng)制藥公司和其它人通向?qū)毑氐慕輳健?/em> ????人們的工作往往被淹沒在大量的數(shù)據(jù)資料中,,但是他們又的確需要數(shù)據(jù)。如今,,計(jì)算機(jī)使得制藥,,生產(chǎn)電腦芯片,乃至石油勘探這些行業(yè)匯集大量信息變得更加容易,。對(duì)于決定在哪里開鑿油井,、在芯片制造過程中怎樣糾正一個(gè)代價(jià)高昂的小錯(cuò)誤,或者在數(shù)不勝數(shù)的化合物中決定將哪一種作為重量級(jí)新藥,,這些數(shù)據(jù)將是至關(guān)重要的,。但是,,回報(bào)卻只屬于那些在如海浪般潮涌而來的原始數(shù)據(jù)資料中撒網(wǎng)捕捉到機(jī)遇之魚的人。 ????讓我們來看看以下叁家公司所面臨的數(shù)據(jù)篩選的挑戰(zhàn)吧: ????位于印第安納波利斯的禮來公司(Eli Lilly & Co.)用一種叫作組合化學(xué)的自動(dòng)化程序在幾天時(shí)間內(nèi)對(duì)少量但又確實(shí)有用的化合物進(jìn)行幾千次的合成,。然后這些化合物被注入到下一個(gè)叫作高容篩選的程序中,,這是一個(gè)觀察它們?nèi)绾闻c生物“目標(biāo)”物質(zhì)發(fā)生反應(yīng)的程序。而隱匿于大量反應(yīng)結(jié)果中的則很有可能是新藥種的候選成份,。 ????阿納達(dá)科石油公司(Anadarko Petroleum)是休斯頓一家石油勘探及生產(chǎn)商,。公司的地球化學(xué)家和工程師們根據(jù)大量的地震及其它方面的數(shù)據(jù)來預(yù)測(cè)儲(chǔ)量可觀的石油和天然氣的地下位置。那麼他們應(yīng)該怎樣指點(diǎn)耗資巨大的鉆井隊(duì)伍呢,?答案就在那些數(shù)據(jù)中,。 ????位于達(dá)拉斯的德州儀器公司(Texas Instruments)科比芯片加工廠開發(fā)芯片制造工藝及生產(chǎn)微處理器,僅僅是其中裝配硅晶片一環(huán)就要耗時(shí)數(shù)周并通過至少 400 余道精密生產(chǎn)工序,。大量的傳感器監(jiān)控著生產(chǎn)儀器,,并且隨著每一片晶片的生產(chǎn)同時(shí)要收集至少 14 萬(wàn)條相關(guān)信息。這些大量的數(shù)據(jù)中有些能對(duì)生產(chǎn)過程中將要出現(xiàn)的錯(cuò)誤發(fā)出警告,。而對(duì)一個(gè)錯(cuò)誤的提前預(yù)警,,通常就能使其在生產(chǎn)出不合格的芯片前及時(shí)進(jìn)行補(bǔ)救。 ????一種新的軟件構(gòu)思正開始幫助這些公司在尋找隱藏于數(shù)據(jù)海洋中的模式和內(nèi)涵上減少時(shí)間和金錢的投入,。互聯(lián)網(wǎng)專家埃斯特?戴森(Esther Dyson)將這種方式比作是“戴上不同顏色的眼鏡或者是濾光器來觀察事物,?!边@種方法最早是克里斯多佛?阿爾伯格(Christopher Ahlberg)在一篇博士論文中提出來的,這位 32 歲的瑞士人是馬薩諸塞州薩默維爾市星火軟件公司(Spotfire)的創(chuàng)始人,。而他創(chuàng)造的對(duì)不同數(shù)據(jù)進(jìn)行探測(cè)分析的部分靈感則和在網(wǎng)上用瀏覽器沖浪極為相似,。他還有一個(gè)目標(biāo),就是要用醒目的視覺顯示器通過僅僅是普通人就能很快直觀掌握的方法來演示數(shù)據(jù)結(jié)果,?!皵?shù)據(jù)庫(kù)是圖表法將要攻克的最后領(lǐng)域,”阿爾伯格說,。 ????大多數(shù)公司所依賴的數(shù)據(jù)庫(kù)并不是依據(jù)使用簡(jiǎn)便的原則建立的,。它們大多數(shù)都使用一種稱作結(jié)構(gòu)化詢問語(yǔ)言的接入方式,簡(jiǎn)稱 SQL,,這種語(yǔ)言非常難掌握,,以致于許多機(jī)構(gòu)都要用高薪聘請(qǐng)專業(yè)人士來與他們的數(shù)據(jù)庫(kù)進(jìn)行對(duì)話。而面對(duì)毫無想象力的 SQL,,你隨便問一個(gè)問題就會(huì)輕易得到幾百萬(wàn)條答案──大量毫無意義的結(jié)果,。更糟糕的是,,這些數(shù)據(jù)庫(kù)根本就不是為那些通常想一探究竟的使用者而建的。 ????星火公司的軟件首次將“數(shù)據(jù)視圖”和功能強(qiáng)大的靈活查詢結(jié)合在一起。如著名的 DecisionSite 軟件,其價(jià)格不菲──安裝這一軟件起價(jià) 10 萬(wàn)美元,。但這并未使許多不同行業(yè)的客戶望而卻步,并且其銷量已突破 1.6 萬(wàn)件。產(chǎn)品面市四年來,,這家私營(yíng)軟件公司的年銷售額據(jù)估計(jì)已達(dá) 3,000 萬(wàn)美元(阿爾伯格說,雖然這項(xiàng)業(yè)務(wù)還沒有開始贏利,,但是已經(jīng)非?!敖咏绷耍W罱?,IBM 的生命科學(xué)部將其營(yíng)銷觸角伸向了這項(xiàng)產(chǎn)品:針對(duì)那些希望加速研發(fā)工作的制藥公司,,這位藍(lán)色巨人正在試圖將數(shù)據(jù)管理軟件與星火公司的工具融為一體。 ????星火公司軟件的神奇之處就在于它使用戶在對(duì)來源不同的數(shù)據(jù)進(jìn)行假定分析比較時(shí)只需用鼠標(biāo)在電腦屏幕上滑動(dòng),。實(shí)際上,,它為數(shù)據(jù)捕撈者提供了可隨意調(diào)整的漁網(wǎng)。換句話說,,他們能在不超過叁英寸的距離內(nèi)搜尋到藏在水底的魚,,然后,稍加判斷,,就能將鳳尾魚和沙丁魚區(qū)別開來,。而結(jié)果就會(huì)呈現(xiàn)出醒目的色彩,并以條狀,、扇形,、發(fā)散形示意圖,甚至是地圖的形式顯示出來,。 ????星火公司四年前開始批量生產(chǎn)軟件時(shí),,起初主要是針對(duì)制藥業(yè),在這一行業(yè)中數(shù)據(jù)的規(guī)模激增,。其中一位較早的采用者是禮來公司生產(chǎn)及供應(yīng)服務(wù)部的信息官謝爾登?奧特(Sheldon Ort),。目前,奧特的公司在世界各地有 1,500 名科學(xué)家離不開這個(gè)軟件,?!拔覀冎饕盟鼇韼椭鷽Q策,”奧特說,?!耙?yàn)樗哂斜磉_(dá)不同來源的信息的能力并且能夠用互動(dòng)的方式改變你的視野,所以它能幫助我們尋找到特殊的分子并幫我們決定是否還要對(duì)其進(jìn)行進(jìn)一步的測(cè)試,?!?/p> ????藥品開發(fā)這一行有句話叫做“失敗應(yīng)趕早?!蹦鞘且?yàn)橐环N典型的新藥從通過聯(lián)邦食品及藥物管理局(FDA)的批準(zhǔn)并上市大約要花費(fèi)五億美元,。這樣高的費(fèi)用迫使禮來這樣的公司盡可能早地發(fā)現(xiàn)那些可能使病人中毒或是引起其它不良副作用的化合物,,從而在對(duì)其投入更多的研究資金之前將其排除。 ????而當(dāng)他們研究新的化合物時(shí),,制劑師也許想了解一些問題,,例如,這些物質(zhì)是否能穿越人體的腦血栓,?存在的毒性是什麼,?它們的化學(xué)結(jié)構(gòu)是什麼?人體多快才能吸收它們以及它們?cè)谘豪锬艹掷m(xù)多長(zhǎng)時(shí)間,?當(dāng)它們遇到其它成份的藥劑時(shí)會(huì)如何反應(yīng),?像這種關(guān)鍵性因素的問題可能會(huì)有 20 條或者更多。而如果像過去那樣將這些信息存貯在不同的數(shù)據(jù)庫(kù)里,,那麼將它們進(jìn)行對(duì)比則是一項(xiàng)耗時(shí)巨大的工程,。 ????使用星火公司的軟件,研究人員可以不用建立多個(gè)完整的查詢序列,。只要來回拖動(dòng)一下鼠標(biāo),,用戶實(shí)際上就可以連續(xù)登陸一系列的查詢數(shù)據(jù)庫(kù),而結(jié)果也會(huì)通過圖形顯現(xiàn)在屏幕上,。禮來公司用這種軟件來對(duì)那些在不同站點(diǎn)通過計(jì)算機(jī)網(wǎng)絡(luò)連接在一起的研究人員之間的會(huì)議工作進(jìn)行管理,。當(dāng)發(fā)言人在他或她的屏幕上移動(dòng)鼠標(biāo)的時(shí)候,每個(gè)人都能看到其種類,、集散區(qū)域,、外露層、空隙處,、 ?,F(xiàn)象,,以及數(shù)據(jù)庫(kù)用戶尋找的其它貴重金屬的統(tǒng)計(jì)數(shù)據(jù),。同時(shí)大家可以立刻共同探討并做出決策。奧特現(xiàn)在正試著以此對(duì)禮來公司的供應(yīng)鏈進(jìn)行更有效率的管理,。 ????阿爾伯格說直到阿納達(dá)科石油公司打電話給他們時(shí),,他才想到將軟件應(yīng)用到能源領(lǐng)域?!拔疫^去并沒有意識(shí)到藥品開發(fā)和石油及天然氣行業(yè)有什麼相似之處,。這時(shí)我意識(shí)到這和化學(xué)結(jié)構(gòu)庫(kù)一樣,石油及天然氣行業(yè)需要的則是地圖──地理學(xué)地圖,。星火公司和加利福尼亞州瑞得蘭市的著名地理信息系統(tǒng)供應(yīng)商 ESRI 結(jié)成了合作聯(lián)盟,。而最后的結(jié)果現(xiàn)在已經(jīng)轉(zhuǎn)化為供阿納達(dá)科石油公司員工用于策劃油田開采的 DecisionSite 軟件,并配以可視地圖,。 ????阿納達(dá)科石油公司的國(guó)際勘探部經(jīng)理羅恩?貝恩(Ron Bain)告訴我們:“我們的地理學(xué)家和工程師需要將大量的數(shù)據(jù)庫(kù)信息以 Excel 電子表格的方式讀出,,可以想象,,在若干個(gè) Excel 電子表格上對(duì) 1,000 個(gè)數(shù)據(jù)點(diǎn)進(jìn)行比較是一件非常困難的事情。而采用星火公司的軟件就好像用 Excel 表格分析類固醇,,它能同時(shí)完成所有交叉測(cè)繪工作,,以尋找石油的儲(chǔ)藏地點(diǎn)?!?/p> ????隨著原油價(jià)格上漲,,阿納達(dá)科石油公司每五個(gè)小時(shí)就要在世界上某個(gè)地方開采一口新井。為了決定這些油井的位置,,公司的地理學(xué)家需要查閱許多數(shù)據(jù)庫(kù),,包括磁場(chǎng)數(shù)據(jù)、重力數(shù)據(jù),、現(xiàn)有油井中的傳感器傳輸來的信息,,以及對(duì)地表巖石結(jié)構(gòu)進(jìn)行地震勘測(cè)的結(jié)果。做這項(xiàng)工作,,磁盤驅(qū)動(dòng)器需要很大空間,。例如,對(duì)墨西哥海灣一塊九平方英里的海底的勘測(cè)結(jié)果就包括 5 到 6 GB(千兆字節(jié))的數(shù)據(jù)資料,;而在阿納達(dá)科石油公司多達(dá) 20,000 GB 的存檔資料庫(kù)里卻有成千上萬(wàn)這樣的數(shù)據(jù),。 ????而星火公司的承諾是“簡(jiǎn)化決策程序,”貝恩說,?!叭绻麤]有它,我可能要處理大量的信息,,而它則能使我變得非常聰明或者說是非常成功,。它的理念是要以經(jīng)濟(jì)的方法找到和生產(chǎn)石油。我們喜歡說我們?cè)谟惺偷牡胤介_采,,而不是在可能有石油的地方,。這些 DecisionSite 軟件能幫助我們更快地找到答案?!?/p> ????芯片產(chǎn)業(yè)耗資巨大──每一個(gè)新廠的投資至少需要 10 億美元──而且當(dāng)產(chǎn)品進(jìn)入復(fù)雜并且高度敏感的制造過程中時(shí)還要追加大量的投入,。而對(duì)于將工廠的合格芯片產(chǎn)量保持在一個(gè)贏利水平而言,在那些細(xì)小錯(cuò)誤鑄成大錯(cuò)前發(fā)現(xiàn)它們是至關(guān)重要的,。芯片制造者依靠程序監(jiān)控傳感器,、功能強(qiáng)大的檢測(cè)裝置、統(tǒng)計(jì)分析和專業(yè)軟件來發(fā)現(xiàn)錯(cuò)誤在哪里及如何檢測(cè)并將其避免,。 ????典型的問題包括破壞芯片成型及晶片蝕刻的污染物,,以及光刻程序自身的錯(cuò)誤。德州儀器公司芯片上的某些部件只有 0.13 微米那麼大,,因此即使是最微小范圍內(nèi)的變化都有可能招致災(zāi)難性的事故,。至少能疊加 25 層的連續(xù)電路模式排列也很重要,;精度不夠很有可能就意味著糟糕的線路聯(lián)通。 ????為了避免用這種困難的方法發(fā)現(xiàn)錯(cuò)誤──待數(shù)周后發(fā)現(xiàn)它們時(shí)再想挽救芯片卻為時(shí)已晚──德州儀器公司收集了大量正在生產(chǎn)的晶片的數(shù)據(jù)資料,。而訣竅就是要迅速弄懂信息的含義,。“我們可以定時(shí)收到所有晶片進(jìn)入到每一個(gè)生產(chǎn)環(huán)節(jié)時(shí)的數(shù)據(jù)資料,,”生產(chǎn)及產(chǎn)品技術(shù)主管喬?勒博維茨(Joe Lebowitz)說,,“但是它卻不能清楚直觀地顯示出 14 萬(wàn)個(gè)或者更多的參數(shù)中哪一個(gè)可能是重要的?!?/p> ????星火軟件供應(yīng)商提供了許多統(tǒng)計(jì)數(shù)據(jù)分析程序,,可以有助于滿足半導(dǎo)體行業(yè)篩選信息的需求。德州儀器公司使用了他們的許多軟件,,而且仍在尋覓找到隱藏在所有噪音里的信號(hào)的捷徑,。而在一年中,公司有大半年在評(píng)估并參與到星火公司針對(duì)芯片制造商的需求而專門設(shè)計(jì)的 DecisionSite 軟件的開發(fā)中去,。勒博維茨對(duì)此印象極其深刻,。“我喜歡把它比作一個(gè)魔方,,你需要從不同的側(cè)面觀察從而找到解決方案,,”他說?!靶腔疖浖梢允刮业墓こ處焸儚母旧蠈?shù)據(jù)資料掌握在自己手里,,輕松快捷地將其顛來倒去從不同方面進(jìn)行研究。這是一個(gè)巨大的進(jìn)步,?!?/p> ????勒博維茨在他的工作領(lǐng)域與制藥研究人員的工作之間看到了一種非常接近的相似性?!拔覍?duì)晶片最想做的事和制劑師對(duì)潛在的化合物想做的事情一樣,,”他解釋道?!拔蚁朐谠偻度氤汕先f(wàn)的美元之前盡早找出錯(cuò)誤的因素并將其清除出去,?!彪y道有哪家公司不是這麼想嗎,? ????譯者:郎雪月 相關(guān)稿件
|
500強(qiáng)情報(bào)中心
|
深入財(cái)富中文網(wǎng)
|