曙光一號(hào)并行計(jì)算機(jī)(以下簡(jiǎn)稱曙光一號(hào))是 1993 年我國(guó)自行研制的第一臺(tái)用微處理器芯片(88100 微處理器)構(gòu)成的全對(duì)稱緊耦合共享存儲(chǔ)多處理機(jī)系統(tǒng)(SMP),最大支持 16 個(gè) CPU(4 CPU 共享存儲(chǔ)為一結(jié)點(diǎn)主板,4 個(gè)主板通過(guò) VME總線連接),系統(tǒng)外設(shè)采用 SCSI 設(shè)備,系統(tǒng)峰值定點(diǎn)速度每秒 6.4億,主存容量最大 768 MB。在對(duì)稱式體系結(jié)構(gòu)、操作系統(tǒng)核心代碼并行化和支持細(xì)粒度并行的多線程技術(shù)等方面實(shí)現(xiàn)了一系列的技術(shù)突破。硬件的技術(shù)突破包括多處理機(jī)共享內(nèi)部總線協(xié)議設(shè)計(jì)、多機(jī)中斷控制器芯片設(shè)計(jì)等;軟件包括 SNIX (Symmetric uNIX) 操作系統(tǒng)采用的細(xì)粒度加鎖以及動(dòng)態(tài)分配 I/O 中斷向量以實(shí)現(xiàn)多機(jī)系統(tǒng)對(duì)稱式處理的方法;在 UNIX 核心中增加共享資源進(jìn)程以及成群調(diào)度 ( Gang Scheduling) 策略,在用戶空間以庫(kù)函數(shù)的方式實(shí)現(xiàn)線程 ( Threads) 概念,支持中微粒度的并行計(jì)算等。 同時(shí)作為具有市場(chǎng)競(jìng)爭(zhēng)力的產(chǎn)品,曙光一號(hào)折價(jià) 2000 萬(wàn)人民幣知識(shí)產(chǎn)權(quán),吸引資金成立曙光信息產(chǎn)業(yè)有限公司。以曙光一號(hào)技術(shù)為源頭,開(kāi)發(fā)出曙光機(jī)兩個(gè)系列20多種服務(wù)器產(chǎn)品(曙光天演、曙光天闊),創(chuàng)造出巨大的社會(huì)與經(jīng)濟(jì)效益。曙光一號(hào)同時(shí)還得到不少的榮譽(yù):包括科學(xué)院科技進(jìn)步特等獎(jiǎng)、國(guó)家科技進(jìn)步二等獎(jiǎng)等。1994 年被認(rèn)為是國(guó)內(nèi)科學(xué)技術(shù)的主要成就之一,寫(xiě)入當(dāng)年全國(guó)人大八屆二中全會(huì)李鵬總理的政府工作報(bào)告。
曙光一號(hào)的研制過(guò)程包括準(zhǔn)備(1990.5-1992.2)、攻堅(jiān)(1992.3-1993.10)及應(yīng)用(1993.11-1995.6)三個(gè)階段。第一階段開(kāi)始于計(jì)算所國(guó)家智能計(jì)算機(jī)研究開(kāi)發(fā)中心(以下簡(jiǎn)稱智能中心)軟硬件組成立;第二階段開(kāi)始于陳鴻安、樊建平、劉金水等人集中于美國(guó)硅谷“封閉式”攻關(guān);第三階段從開(kāi)發(fā)早期的 Internet 服務(wù)器、及后來(lái)成立曙光公司為標(biāo)志。曙光一號(hào)的研制過(guò)程中凝聚了很多人的辛勤勞動(dòng),包括早期參加決策的領(lǐng)導(dǎo)、專家,攻關(guān)過(guò)程中的眾多科研人員以及應(yīng)用過(guò)程中的相關(guān)人員。以下我們將從曙光一號(hào)技術(shù)準(zhǔn)備與決策、攻堅(jiān)、應(yīng)用等幾個(gè)階段回顧曙光一號(hào)的誕生,以及涉足各個(gè)階段的相關(guān)人員。由于以下描述的過(guò)程均發(fā)生在 6 年前(有的超過(guò) 10年),如有疏漏望諒解。 一、決策與技術(shù)準(zhǔn)備階段
智能中心成立之初,集中兩年左右的時(shí)間,不斷論證技術(shù)發(fā)展思路,為曙光一號(hào)并行計(jì)算機(jī)的研制任務(wù)的決策與任務(wù)的下達(dá)進(jìn)行準(zhǔn)備,同時(shí)進(jìn)行技術(shù)與人才的儲(chǔ)備工作。
曙光一號(hào)采用多處理器共享存儲(chǔ)并行體系結(jié)構(gòu),今天看來(lái)是較自然的選擇,當(dāng)時(shí)卻很困難,主要影響決策的幾個(gè)因素包括:日本第五代智能計(jì)算機(jī)計(jì)劃(Prolog, Lisp 專用機(jī)策略);國(guó)內(nèi)外傳統(tǒng)大型機(jī)發(fā)展思路的慣性(采用集成電路設(shè)計(jì)運(yùn)算控制器主板而非采用商品化的微處理器);并行計(jì)算機(jī)初期發(fā)展的不確定性等。參與決策者包括當(dāng)時(shí)國(guó)家科委高新司冀復(fù)生總工、863計(jì)劃智能計(jì)算機(jī)專家組汪成為等人。最終選擇多處理機(jī)服務(wù)器方案,以下四點(diǎn)是主要的原因:a. 與傳統(tǒng)的小型機(jī)(VAX 機(jī))、大型機(jī)(IBM mainframe)比較,多處理機(jī)服務(wù)器在性能價(jià)格比方面有明顯優(yōu)勢(shì);b. 并行機(jī)技術(shù)國(guó)外也不十分成熟,沒(méi)有形成一家壟斷的局面,我們有可能迎頭趕上; c. 多處理機(jī)關(guān)鍵技術(shù)是軟件,技術(shù)難點(diǎn)的轉(zhuǎn)移對(duì)我們有利;d. 一旦掌握多處理機(jī)技術(shù),易形成高性能計(jì)算機(jī)系列產(chǎn)品。當(dāng)時(shí)美國(guó)加洲大學(xué) Belkely 分校的 David patterson 教授和 Princeton 大學(xué)的李凱教授也給了很多的建議與幫助。 人才與技術(shù)儲(chǔ)備方面,智能中心1990年3月成立,到1991年3月基本形成了以剛畢業(yè)的碩博士為主的技術(shù)隊(duì)伍。中心主任李國(guó)杰,下設(shè)系統(tǒng)軟件組、硬件組、應(yīng)用組、理論組。軟件組組長(zhǎng)樊建平,組員包括王永杰、劉文卓、劉宏、戰(zhàn)超、孫培興、劉曉華、孫凝暉等。硬件組組長(zhǎng)陳鴻安,組員包括李如昆、杜曉黎、曾嶸、董向軍、張艷、梁雪、熊勁等。應(yīng)用組包括韋明、隋雪青、吳建明、封勇、楊堅(jiān)、賴曉婧等。理論組組長(zhǎng)白碩,組員包括曹存根、閻保平、楊莉等。當(dāng)時(shí)計(jì)算機(jī)研制方面有經(jīng)驗(yàn)者包括陳鴻安、李如昆及在攻堅(jiān)階段加入的劉金水等,其他人是第一次從事計(jì)算機(jī)研制方面的工作。 軟件組前兩年主要的工作包括對(duì) AT&T UNIX V3、V4、BSD 3.2、CMU MACH1.0 等操作系統(tǒng)核心代碼, BIOS 及相關(guān)工具(Cross Compiler, sccs 等)分析、掌握。硬件組開(kāi)展的工作包括各種微處理器芯片及接口芯片的理解、多機(jī)系統(tǒng)的構(gòu)成、硬件設(shè)計(jì)工具的使用等。研究成果以論文、專著的形式進(jìn)行發(fā)表,為曙光一號(hào)及后來(lái)的曙光1000 的發(fā)展打下堅(jiān)實(shí)的基礎(chǔ)。這一期間東南大學(xué)的黃大海同志在操作系統(tǒng)的理解方面給了很大的幫助。
二、攻堅(jiān)階段
1991年11月 左右曙光一號(hào)采用 Motorola M88100 微處理器,共享存儲(chǔ)多機(jī)系統(tǒng)(單板共享 4 CPU),通用開(kāi)放系統(tǒng)結(jié)構(gòu)(UNIX 操作系統(tǒng))的總體方案確定。88K 處理器的開(kāi)發(fā)機(jī)以及 AT&T UNIX 操作系統(tǒng)的源代碼均已訂購(gòu)。此時(shí)夏培肅院士的碩士學(xué)生劉金水作為硬件設(shè)計(jì)的主要人員從航天工業(yè)總公司 706 所全職參加到曙光一號(hào)的設(shè)計(jì)中來(lái)。1992年3月,考慮到國(guó)內(nèi)購(gòu)買硬件器件速度慢,操作系統(tǒng)、部件與工具廠商技術(shù)支持弱,高密度生產(chǎn)技術(shù)缺乏等因素,智能中心組織了陳鴻安、樊建平、劉金水、李如昆、王永杰等人到美國(guó)硅谷進(jìn)行曙光一號(hào)的封閉式開(kāi)發(fā)。出發(fā)前開(kāi)了誓師大會(huì),提出了“人生能有幾回博”激動(dòng)人心的口號(hào),開(kāi)始了 11 個(gè)月左右大家后來(lái)戲稱為“美國(guó)洋插隊(duì)”的生活。 課題組在美國(guó)工作與生活的地方已由先期到達(dá)美國(guó)的計(jì)算所研究人員賈沛長(zhǎng)負(fù)責(zé)安排。生活處為一美式獨(dú)居小院,4個(gè)臥室,廚房與客廳很大。辦公處距生活處汽車要開(kāi) 20 分鐘左右。為方便加班,大家決定將辦公地點(diǎn)設(shè)在客廳中。這樣除與外界接觸(如:部件廠商的技術(shù)交流、生產(chǎn)談判等)仍然安排在原辦公處外,其他的生活與工作活動(dòng)就都在生活處進(jìn)行了。
美國(guó)期間的工作分總體方案完善、設(shè)計(jì)、生產(chǎn)加工及部分調(diào)試幾個(gè)階段。總體方案的完善持續(xù)一個(gè)多月,主要是多處理機(jī)中斷控制器的設(shè)計(jì)與實(shí)現(xiàn)方面。這一期間與國(guó)內(nèi)交流最密切,傳真頻繁(當(dāng)時(shí)計(jì)算所很難接收 E-mail)。國(guó)內(nèi)軟件與硬件組的部分人員繼續(xù)配合曙光一號(hào)硬件及并行程序設(shè)計(jì)環(huán)境外,同時(shí)抽調(diào)部分人員組成曙光1000 組,開(kāi)始曙光1000 早期預(yù)研工作。 曙光一號(hào)的硬件設(shè)計(jì)在 1992年9月 左右結(jié)束,10 月完成主板設(shè)計(jì)并進(jìn)入PCB板的設(shè)計(jì)和生產(chǎn),11 月左右中斷控制器的 FPGA 完成。1992.12-1993.1 進(jìn)行 BIOS 與 Monitor 的初步調(diào)試。軟件設(shè)計(jì)與調(diào)試與硬件并行展開(kāi),BIOS、Monitor 及操作系統(tǒng)的改造與移植在開(kāi)發(fā)機(jī)模擬環(huán)境下按計(jì)劃進(jìn)度進(jìn)行,沒(méi)有發(fā)生大的失誤,基本匹配了硬件的開(kāi)發(fā)速度。生活方面大家分組以一個(gè)星期為單位進(jìn)行輪班做飯。晚飯后的散步或騎自行車(從鄰居家中購(gòu)買)成為早期的主要娛樂(lè)與體育鍛煉的方法。后來(lái)購(gòu)買了一輛二手汽車,學(xué)習(xí)開(kāi)車(為省錢自學(xué)為主)及進(jìn)行駕駛執(zhí)照的考試成為另一種娛樂(lè)活動(dòng)。 1993年2月,我們帶著已進(jìn)行初步調(diào)試的幾塊曙光一號(hào)主板回到國(guó)內(nèi)。與國(guó)內(nèi)的同事開(kāi)始聯(lián)調(diào)及軟件的移植工作。硬件、Monitor、BIOS 及操作系統(tǒng)核心的調(diào)試工作在回來(lái)兩個(gè)月后基本完成。由張兆慶、喬如良領(lǐng)導(dǎo)的并行編譯組、劉曉華進(jìn)行的Express 編程環(huán)境、孫凝暉等進(jìn)行的計(jì)算性能測(cè)試與優(yōu)化、隋雪青等進(jìn)行的數(shù)據(jù)庫(kù)移植與事務(wù)處理的測(cè)試等工作在后來(lái)的2-3個(gè)月內(nèi)逐一完成。同時(shí)將863的研究成果在曙光一號(hào)上進(jìn)行集成,包括石油大學(xué)開(kāi)發(fā)的“Powel—油氣田布井決策系統(tǒng)“,浙江大學(xué)開(kāi)發(fā)的智能軟件開(kāi)發(fā)環(huán)境KMEPS,華中理工大學(xué)開(kāi)發(fā)的地圖數(shù)據(jù)庫(kù)管理系統(tǒng)MDB,西安交大開(kāi)發(fā)的LISP/CLOS 系統(tǒng),科學(xué)院系統(tǒng)所開(kāi)發(fā)的幾何定理證明軟件系統(tǒng),以及清華大學(xué)移植的Ingres 數(shù)據(jù)庫(kù)等。93年10月由科技部組織國(guó)內(nèi)的專家學(xué)者進(jìn)行了成果的技術(shù)鑒定工作。成果受到好評(píng),當(dāng)時(shí)的科學(xué)院副院長(zhǎng)胡啟恒稱曙光一號(hào)咬住國(guó)際高性能計(jì)算機(jī)發(fā)展的“尾巴”。 曙光一號(hào)部分研制人員(樊建平、陳鴻安等)在曙光一號(hào)鑒定完后轉(zhuǎn)入曙光1000組,與原硬件組、軟件組的人員一起從完善曙光1000原型系統(tǒng)的總體實(shí)施方案入手,投入到曙光1000的研發(fā)過(guò)程中;部分人員回到原單位(劉金水),部分人員出國(guó)(李如昆、王永杰等)。曙光一號(hào)的推廣應(yīng)用工作交由當(dāng)時(shí)智能中心成立的成果推廣部實(shí)施(組長(zhǎng)張玉志,組員包括楊檳等),開(kāi)始基于曙光一號(hào)知識(shí)產(chǎn)權(quán)成立曙光信息產(chǎn)業(yè)有限公司的早期融資活動(dòng)。1994年8月,曙光1000的8節(jié)點(diǎn)原型系統(tǒng)已可運(yùn)行,曙光一號(hào)的融資活動(dòng)已進(jìn)行高峰期。智能中心的領(lǐng)導(dǎo)決定成立基于原曙光一號(hào)組人員的曙光計(jì)算機(jī)部,樊、陳又從曙光1000組抽回,開(kāi)始人員的招聘,后續(xù)產(chǎn)品的開(kāi)發(fā)(基于PowerPC芯片的曙光天演)以及曙光一號(hào)生產(chǎn)與銷售的支持工作等。該部門最后成為1995年曙光公司成立時(shí)的三個(gè)事業(yè)部之一:曙光計(jì)算機(jī)事業(yè)部。當(dāng)時(shí)陸續(xù)開(kāi)展的研發(fā)工作包括基于曙光一號(hào)的Internet 服務(wù)器和鄭州電子工程學(xué)院和郵電大學(xué)的協(xié)作項(xiàng)目基于曙光機(jī)的智能網(wǎng) SCP 平臺(tái),1—2CPU 的 PowerPC SMP 升級(jí)服務(wù)器,雙機(jī)HA高可用系統(tǒng)等。 三、應(yīng)用情況
曙光一號(hào)在設(shè)計(jì)階段的一個(gè)理想就是能成為產(chǎn)品而非僅僅是科研成果,鑒定會(huì)已是它的市場(chǎng)推廣會(huì)。曙光公司成立前,曙光一號(hào)已在教育行業(yè)(中國(guó)科技大學(xué)、武漢大學(xué))、信息服務(wù)(1994年開(kāi)通國(guó)內(nèi)第一個(gè)BBS網(wǎng)站——曙光BBS 站,三期日貸項(xiàng)目北京信息中心)、軍隊(duì)(總后油庫(kù)管理)、政府(國(guó)家科委辦公自動(dòng)化)、援外項(xiàng)目(埃及穆巴拉克科學(xué)園)等項(xiàng)目上進(jìn)行了成功的銷售。曙光一號(hào)累計(jì)生產(chǎn)與銷售20多套。曙光公司成立后,以曙光一號(hào)技術(shù)為源頭,智能中心與曙光公司逐步發(fā)展出兩個(gè)系列的產(chǎn)品曙光天演UNIX 服務(wù)器系列及曙光天闊PC 服務(wù)器系列,1997年已達(dá)20多個(gè)品種。曙光計(jì)算機(jī)多次參加國(guó)際及國(guó)內(nèi)的服務(wù)器競(jìng)標(biāo)(包括世行、亞行、日貸),大大降低國(guó)外主流廠商在中國(guó)銷售服務(wù)器的價(jià)格(科技部估算僅此一項(xiàng)的社會(huì)效益超過(guò) 2 億美圓以上)。曙光機(jī)被成功應(yīng)用到數(shù)十個(gè)行業(yè),促進(jìn)傳統(tǒng)行業(yè)的信息化進(jìn)程,這些行業(yè)包括:科研、教育、政府、石化、電信、軍隊(duì)、保險(xiǎn)、交通、出版、銀行等。目前曙光服務(wù)器累計(jì)銷售1萬(wàn)多套,產(chǎn)值3億以上,曙光已成為中國(guó)高性能服務(wù)器的著名品牌。