主頁(http://www.130131.com):從數(shù)字城市邁向智能城市 iCity是一個(gè)復(fù)雜的信息生態(tài)系統(tǒng),其在每一時(shí)刻所擁有的大數(shù)據(jù)都是記錄城市社會(huì)生態(tài)系統(tǒng)的映像,折射出市政管理機(jī)構(gòu)對(duì)城市的宏觀調(diào)控,以及市民競(jìng)爭(zhēng)和市場(chǎng)機(jī)制對(duì)城市資源配置和發(fā)展作用的數(shù)字化描述。iCity連接的是數(shù)據(jù),方便的是民生。 ◎中國(guó)科學(xué)院院士、軟件開發(fā)環(huán)境國(guó)家重點(diǎn)實(shí)驗(yàn)室主任李未/文
李未 北京航空航天大學(xué)計(jì)算機(jī)系教授、軟件開發(fā)環(huán)境國(guó)家重點(diǎn)實(shí)驗(yàn)室主任、中國(guó)科學(xué)院院士、國(guó)務(wù)院學(xué)位委員會(huì)委員。在實(shí)用并發(fā)語言語義、并發(fā)語言的翻譯理論等方面具有開創(chuàng)性研究成果,曾獲國(guó)家自然科學(xué)二等獎(jiǎng)、何梁何利科技進(jìn)步獎(jiǎng)等多項(xiàng)獎(jiǎng)勵(lì)。 過去10年,“數(shù)字城市”、“大數(shù)據(jù)城市”、“智能城市”和“智慧城市”等成為學(xué)術(shù)界、各種先鋒論壇和社會(huì)媒體熱議的話題。一般而言,一個(gè)行業(yè)或一個(gè)區(qū)域的信息化過程可分為兩個(gè)階段,第一個(gè)階段是數(shù)字化,又稱數(shù)字城市(以下簡(jiǎn)稱dCity,即Data City),它包括信息的傳感、存儲(chǔ)、計(jì)算、傳輸和控制的網(wǎng)絡(luò)化和數(shù)字化;第二階段是智能化,是數(shù)字化的更高階段,又稱智能城市(以下簡(jiǎn)稱iCity,即Intelligent City)。 以下擬從數(shù)字城市的智能轉(zhuǎn)型這個(gè)角度,探討智能城市必須提供的幾種服務(wù),以及為實(shí)現(xiàn)這些服務(wù)在軟件工程實(shí)現(xiàn)方面需要采取的措施和方法。 看病問診的深度查詢 我們先通過一個(gè)例子說明什么是深度查詢,然后再來看怎樣開發(fā)和使用這種查詢。如果我們向Google輸入:“我經(jīng)常惡心、頭痛、有時(shí)嘔吐,看東西不清楚,偶爾出現(xiàn)耳鳴,我該怎么辦?”Google把“頭痛、惡心、嘔吐”等作為關(guān)鍵詞,查出約42900個(gè)網(wǎng)頁中出現(xiàn)了上述關(guān)鍵詞。我們?cè)谫潎@Google的效率的同時(shí),卻無法稱之為“智能服務(wù)”,因?yàn)槲覀冏铌P(guān)心的問題:究竟“我”得了什么?應(yīng)該怎么治?并沒有得到像朋友、更不用說像看醫(yī)生那樣直截了當(dāng)和有建設(shè)性的回答。 下面,讓我們仿照病人去醫(yī)院看病的過程,設(shè)計(jì)一個(gè)簡(jiǎn)單的“深度查詢”的例子。這個(gè)查詢過程由下述4步組成: 初診導(dǎo)醫(yī) 病人向iCity輸入癥狀或感覺:“頭痛、惡心、嘔吐、耳鳴和怎么辦”,希望iCi t y通過分析這些感覺和癥狀,向用戶提供相當(dāng)于初診醫(yī)生做出的對(duì)疾病的初步診斷和建議(見圖)。iCity應(yīng)該向病人提供有上述病癥表現(xiàn)的主要疾病名稱,即“腦部腫瘤、美尼爾氏癥、頸椎病或胃腸感冒”。病人從4種病中選擇了其中一種,例如“腦部腫瘤”,并將其輸入iCity,這種行為稱為關(guān)聯(lián)選擇或關(guān)聯(lián)推理,因?yàn)閕City把4種不同但又有共同病狀的“實(shí)體”關(guān)聯(lián)起來。
方案推薦 由兩部分組成,即先做關(guān)聯(lián),再做邏輯推理。首先,在病人做出初診選擇后,iCity的反應(yīng)是:推薦3種治療預(yù)案,即治療藥物推薦、腫瘤醫(yī)院推薦、腫瘤專家推薦。iCity又把3種“本體”關(guān)聯(lián)起來,而用戶再做一次關(guān)聯(lián)選擇,例如選擇腫瘤醫(yī)院。接著,選擇中國(guó)醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院,這次iCity做的是邏輯推理,是全局到個(gè)體的推理,因?yàn)橹袊?guó)醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院是一所腫瘤醫(yī)院。 就醫(yī)服務(wù) 用戶選擇中國(guó)醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院之后,iCity提供該醫(yī)院的所有就醫(yī)服務(wù),包括:掛號(hào)預(yù)約程序、醫(yī)療費(fèi)用評(píng)估、就醫(yī)智能導(dǎo)航、氣象出行建議。病人再做一次關(guān)聯(lián)操作,例如“掛號(hào)預(yù)約程序”,完成第3次人機(jī)交互。 數(shù)據(jù)鏈接 計(jì)算機(jī)提供中國(guó)醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院網(wǎng)上掛號(hào)預(yù)約的全套程序。 一般而言,深度查詢是系統(tǒng)從描述事物的現(xiàn)象、癥狀或印象開始,通過人機(jī)交互的方式,提供與現(xiàn)象或癥狀相關(guān)的可供選擇的概念或?qū)嶓w。在用戶做出選擇后,系統(tǒng)根據(jù)云計(jì)算環(huán)境中存儲(chǔ)的本體和相關(guān)知識(shí)圖譜,在與用戶逐步深入的交互中,通過歸納猜想、邏輯推理和關(guān)聯(lián)操作,最終提供用戶所需要的、網(wǎng)上能查到的、與改善現(xiàn)狀關(guān)聯(lián)的所有知識(shí)和數(shù)據(jù)。從這個(gè)角度來看,著名的TuringTest 是深度查詢的一個(gè)特例。總之,深度查詢的推理和操作的基礎(chǔ)理論框架應(yīng)包括: (1)歸納猜測(cè):屬性到實(shí)體; (2)關(guān)聯(lián)演算:實(shí)體間選擇; (3)邏輯推理:共性到實(shí)例; (4)數(shù)據(jù)鏈接:實(shí)體到數(shù)據(jù)(知識(shí)卡片)。 而實(shí)現(xiàn)“深度查詢”服務(wù)的解決方案應(yīng)該包括:建立描述各種非結(jié)構(gòu)化數(shù)據(jù)的元語言模型,即構(gòu)建數(shù)據(jù)的一體化表示和組織,構(gòu)建包含本體、實(shí)體、知識(shí)圖譜和知識(shí)卡片的非結(jié)構(gòu)化數(shù)據(jù)云,建立實(shí)體與原始數(shù)據(jù)的鏈接,以及實(shí)現(xiàn)歸納猜想、關(guān)聯(lián)操作、邏輯推理的關(guān)于知識(shí)的計(jì)算框架和推理機(jī)制等。 在大數(shù)據(jù)時(shí)代,人類五官的感受已經(jīng)由現(xiàn)代傳感器產(chǎn)生的大數(shù)據(jù)所代替。所以,定律發(fā)現(xiàn)的任務(wù)就是從傳感器接收到的大數(shù)據(jù)中,精煉出基本概念和這些概念之間精確的數(shù)學(xué)關(guān)系,也就是歸納出謂詞和謂詞之間的數(shù)學(xué)方程式。在社會(huì)科學(xué)和人類社會(huì)大數(shù)據(jù)環(huán)境下,這些概念的關(guān)系可以是因果關(guān)系,也可以是關(guān)聯(lián)關(guān)系。 從天通苑智能交通看決策生成 讓我們通過一個(gè)例子來說明什么是智能城市的決策生成。 北京天通苑地區(qū)約有8平方公里,人口91.5萬。早高峰期間約有14萬人要乘坐公交車進(jìn)城上班,而主要進(jìn)城之路只有2條,一條是經(jīng)回龍觀再繞行G6高速路進(jìn)城,另一條是先經(jīng)立湯路再到安立路進(jìn)城。當(dāng)前要解決的問題是:公共交通擁堵、公交車超載、安全性和舒適性差、路上消耗時(shí)間長(zhǎng)。 天通苑實(shí)際公交需求是:如果每車70人,每人乘車時(shí)間不超過40分鐘到達(dá)目的地,早6:00至9:00間需要平均每分鐘發(fā)出10輛公交車,共需約2000車次,長(zhǎng)度近40公里。 在當(dāng)前數(shù)字化城市環(huán)境下,經(jīng)大數(shù)據(jù)搜集和統(tǒng)計(jì)計(jì)算的結(jié)果是:居民出行通往北京38個(gè)區(qū)域,但只有9個(gè)區(qū)域是主要目的地,占乘客總量的83%。 提出問題:如果用戶向百度輸入:“天通苑地區(qū)上班時(shí)間,交通擁堵,乘公交車,進(jìn)城,尋求解決方案”,百度當(dāng)下提供的服務(wù),還不能給出對(duì)每個(gè)上班的用戶具體、可操作的建議,還不能說是智能服務(wù)。人們心目中具有智能的解答應(yīng)該由下述幾步組成: 決策定性:當(dāng)用戶向iCity輸入“天通苑早晨交通擁擠,尋求解決方案”時(shí),希望得到對(duì)方給出既“高屋建瓴”又“符合邏輯”的回答。所以,iCity的回答是一個(gè)問句:需要“應(yīng)急方案”還是“長(zhǎng)期方案”?這是一種歸納推測(cè),因?yàn)檫@是從具體方案到方案類型的行為。 當(dāng)用戶選取“應(yīng)急方案”時(shí),他或她進(jìn)行了一次關(guān)聯(lián)操作或關(guān)聯(lián)推理,而iCity是把兩種不同類型的求解方案關(guān)聯(lián)起來。這種關(guān)聯(lián)是由計(jì)算機(jī)提供的,而選擇是用戶(人)做的,對(duì)計(jì)算機(jī)而言,這是第一次人機(jī)交互。 方案推薦:在用戶做出方案分類選擇后,iCity的應(yīng)對(duì)是:提出4類應(yīng)急解決方案供用戶選擇,包括“公交車調(diào)度優(yōu)化”、“熱點(diǎn)區(qū)域直達(dá)”、“乘車時(shí)間優(yōu)化”和“繞行路線安排”。iCity把4種應(yīng)急方案關(guān)聯(lián)起來,而用戶再做一次選擇,如:“乘車時(shí)間優(yōu)化”。完成第二次人機(jī)交互。 方案選擇:用戶選擇“乘車時(shí)間優(yōu)化”后,由于在大數(shù)據(jù)和云計(jì)算環(huán)境下,互聯(lián)網(wǎng)上存有天通苑14萬進(jìn)城上班族每個(gè)人的姓名、身份證號(hào)、住址、手機(jī)號(hào)、當(dāng)前GPS地址、工作單位地址、上班時(shí)間統(tǒng)計(jì)記錄等所有必要信息和數(shù)據(jù),又擁有天通苑地區(qū)所有公交車的GPS地址、行車路線、車內(nèi)乘客人數(shù)現(xiàn)狀的信息。這些數(shù)據(jù)和它們之間的關(guān)系組成了一個(gè)動(dòng)態(tài)規(guī)劃系統(tǒng),而iCity要解決的是大數(shù)據(jù)動(dòng)態(tài)規(guī)劃問題。在云計(jì)算環(huán)境下,iCity可以直接或者請(qǐng)求用戶選擇求解方法、調(diào)用求解程序,得到可行決策。這包括:每一位上班族個(gè)人都將從手機(jī)上收到iCity 對(duì)個(gè)人的出行建議,例如,何時(shí)乘哪路公交以及換乘建議。當(dāng)用戶同意后,iCity 還將把上班調(diào)整時(shí)間信息發(fā)給所在工作單位,以便調(diào)整當(dāng)日上、下班時(shí)間。iCity還將把在均衡狀態(tài)下公交車的開車路線和時(shí)間等有關(guān)信息通知到每位公交司機(jī)。 從上述實(shí)例,我們可以得出以下關(guān)于iCity決策生成的一個(gè)宏觀描述: iCity針對(duì)用戶的要求和問題,通過人機(jī)交互的方式對(duì)本體、實(shí)體、概念、屬性等多層次歸納猜想、邏輯推理、關(guān)聯(lián)操作,在與用戶的交互過程中,揭示問題的性質(zhì),提供與問題相關(guān)的所有可供選擇的決策類型。在用戶做出選擇后,iCity確定滿足用戶要求的問題求解數(shù)學(xué)模型,并通過逐步深入的人機(jī)交互,確定求解模型所需的邊界條件和初值。之后,iCity調(diào)用求解程序,根據(jù)用戶需求,提供群體的統(tǒng)計(jì)規(guī)律和群體的動(dòng)態(tài)演變過程,并根據(jù)群體中每一個(gè)個(gè)體的個(gè)性化要求,給出針對(duì)個(gè)體的解決方案,做到群體均衡、個(gè)體優(yōu)化。在群體和個(gè)體的解決方案實(shí)施后,iCity還將實(shí)時(shí)感知并驗(yàn)證解決方案的實(shí)施效果,及時(shí)進(jìn)行動(dòng)態(tài)調(diào)整。統(tǒng)一數(shù)據(jù)模型勢(shì)在必行 城市的大數(shù)據(jù)是城市人群自然與社會(huì)知識(shí)和信息的數(shù)字映像,是通過各種數(shù)字化傳感裝置搜集的,來自于城市的各個(gè)角落和不同的人群。它們可以是結(jié)構(gòu)化的(如傳統(tǒng)的數(shù)據(jù)庫文件),也可以是非結(jié)構(gòu)化的(如語音、圖片和視頻等),而且來源于不同的歷史階段。由于社會(huì)發(fā)展的不均衡,從各種途徑獲得的原始數(shù)據(jù)的格式不統(tǒng)一,進(jìn)而增加了數(shù)據(jù)處理的難度,降低了數(shù)據(jù)處理的效率。 發(fā)展到建設(shè)iCity 這一歷史階段,建立統(tǒng)一的數(shù)據(jù)模型已經(jīng)勢(shì)在必行。這個(gè)數(shù)據(jù)模型應(yīng)該具有下述性質(zhì): 首先是統(tǒng)一性,即它能夠以統(tǒng)一的模式描述各種結(jié)構(gòu)和非結(jié)構(gòu)類型的數(shù)據(jù);二是集成性,即直接繼承和采用已有的關(guān)于各種類型數(shù)據(jù)的成熟處理技術(shù);三是關(guān)聯(lián)友好性,它支持多源數(shù)據(jù)特征關(guān)聯(lián)操作;四是可擴(kuò)展性,即支持?jǐn)?shù)據(jù)規(guī)模擴(kuò)展并保持處理效率;五是演化性,即以文本序列的方式記錄數(shù)據(jù)的演化;最后是傳感友好性,即這種數(shù)據(jù)模型可以嵌入到各種傳感器中,成為傳感器從外界接收的原始數(shù)據(jù)的存儲(chǔ)格式。這樣做的優(yōu)點(diǎn)是可以充分發(fā)揮數(shù)字化傳感器的潛能,大大提高非結(jié)構(gòu)化大數(shù)據(jù)的處理效率。 iCity是一個(gè)群體軟件工程 城市是一個(gè)復(fù)雜的社會(huì)生態(tài)系統(tǒng),其組成和演化的基本特征是:在“宏觀層面”上,市政管理機(jī)構(gòu)通過制定政策和發(fā)布法令,對(duì)城市的規(guī)劃和資源的配置進(jìn)行宏觀調(diào)控;在“微觀層面”上,市民通過競(jìng)爭(zhēng)和市場(chǎng)機(jī)制對(duì)城市資源配置和城市發(fā)展起著基礎(chǔ)或決定性作用。從這個(gè)角度來看,iCity則是一個(gè)復(fù)雜的信息生態(tài)系統(tǒng),其在每一時(shí)刻所擁有的大數(shù)據(jù)都是記錄城市社會(huì)生態(tài)系統(tǒng)的映像,折射出市政管理機(jī)構(gòu)對(duì)城市的宏觀調(diào)控,以及市民競(jìng)爭(zhēng)和市場(chǎng)機(jī)制對(duì)城市資源配置和發(fā)展作用的數(shù)字化描述。 如果使用iCity 時(shí)特指其軟件系統(tǒng),那么群體軟件工程應(yīng)該是研制、開發(fā)和維護(hù)iCity的首選工程方法。如果我們把微軟公司研制Windows系統(tǒng)的方法稱為傳統(tǒng)軟件工程方法,那么傳統(tǒng)軟件工程方法在研發(fā)iCity時(shí)將面臨嚴(yán)峻挑戰(zhàn)。 以WindowsVista為例,軟件開發(fā)工作量約為:功能模塊約60000個(gè),總代碼量6000萬行,投入9000名專業(yè)開發(fā)人員,耗時(shí)5年完成全部開發(fā)任務(wù)。然而這種傳統(tǒng)軟件工程方法受到iCity這類軟件的嚴(yán)峻挑戰(zhàn),因?yàn)閺恼w的角度看,后者的規(guī)模和開發(fā)工作量將遠(yuǎn)超過WindowsVista! 近幾年蘋果公司組織的AppStore和谷歌公司組織的AndroidMarket給我們帶來了激發(fā)社會(huì)群體廣泛參與軟件開發(fā)的新啟示。如果采用AppStore或Android Market的模式投入70萬人,iCity約5年就能建成!上述這兩個(gè)在軟件開發(fā)行業(yè)有歷史意義的事件告訴我們:采用開源代碼,選取眾包這種基于市場(chǎng)競(jìng)爭(zhēng)的群體開發(fā)模式,將是解決iCity這類超大軟件生態(tài)系統(tǒng)研發(fā)、維護(hù)和演化問題的一個(gè)正確選擇。 綜上所述數(shù)字城市的智能轉(zhuǎn)型當(dāng)前的主要任務(wù)是提供“深度查詢”、“規(guī)律發(fā)現(xiàn)”和“決策生成”3種應(yīng)用服務(wù),為此,有必要從數(shù)字傳感階段開始推進(jìn)非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一模型,并采用群體軟工程件的方法,先從數(shù)字化城市比較成熟的行業(yè)作為試點(diǎn)開始做起。 (中國(guó)集群通信網(wǎng) | 責(zé)任編輯:陳曉亮) |



