基于學習策略的分類
學習策略是指學習過程中系統(tǒng)所采用的推理策略。一個學習系統(tǒng)總是由學習和環(huán)境兩部分組成。由環(huán)境(如書本或教師)提供信息,學習部分則實現(xiàn)信息轉(zhuǎn)換,用能夠理解的形式記憶下來,并從中獲取有用的信息。在學習過程中,學生(學習部分)使用的推理越少,他對教師(環(huán)境)的依賴就越大,教師的負擔也就越重。學習策略的分類標準就是根據(jù)學生實現(xiàn)信息轉(zhuǎn)換所需的推理多少和難易程度來分類的,依從簡單到復雜,從少到多的次序分為以下六種基本類型:
1)機械學習 (Rote learning)
學習者無需任何推理或其它的知識轉(zhuǎn)換,直接吸取環(huán)境所提供的信息。如塞繆爾的跳棋程序,紐厄爾和西蒙的LT系統(tǒng)。這類學習系統(tǒng)主要考慮的是如何索引存貯的知識并加以利用。系統(tǒng)的學習方法是直接通過事先編好、構(gòu)造好的程序來學習,學習者不作任何工作,或者是通過直接接收既定的事實和數(shù)據(jù)進行學習,對輸入信息不作任何的推理。
2)示教學習 (Learning from instruction或Learning by being told)
學生從環(huán)境(教師或其它信息源如教科書等)獲取信息,把知識轉(zhuǎn)換成內(nèi)部可使用的表示形式,并將新的知識和原有知識有機地結(jié)合為一體。所以要求學生有一定程度的推理能力,但環(huán)境仍要做大量的工作。教師以某種形式提出和組織知識,以使學生擁有的知識可以不斷地增加。這種學習方法和人類社會的學校教學方式相似,學習的任務(wù)就是建立一個系統(tǒng),使它能接受教導和建議,并有效地存貯和應(yīng)用學到的知識。不少專家系統(tǒng)在建立知識庫時使用這種方法去實現(xiàn)知識獲取。示教學習的一個典型應(yīng)用例是FOO程序。
3)演繹學習 (Learning by deduction)
學生所用的推理形式為演繹推理。推理從公理出發(fā),經(jīng)過邏輯變換推導出結(jié)論。這種推理是"保真"變換和特化(specialization)的過程,使學生在推理過程中可以獲取有用的知識。這種學習方法包含宏操作(macro-operation)學習、知識編輯和組塊(Chunking)技術(shù)。演繹推理的逆過程是歸納推理。 4)類比學習 (Learning by analogy)
利用二個不同領(lǐng)域(源域、目標域)中的知識相似性,可以通過類比,從源域的知識(包括相似的特征和其它性質(zhì))推導出目標域的相應(yīng)知識,從而實現(xiàn)學習。類比學習系統(tǒng)可以使一個已有的計算機應(yīng)用系統(tǒng)轉(zhuǎn)變?yōu)檫m應(yīng)于新的領(lǐng)域,來完成原先沒有設(shè)計的相類似的功能。 類比學習需要比上述三種學習方式更多的推理。它一般要求先從知識源(源域)中檢索出可用的知識,再將其轉(zhuǎn)換成新的形式,用到新的狀況(目標域)中去。類比學習在人類科學技術(shù)發(fā)展史上起著重要作用,許多科學發(fā)現(xiàn)就是通過類比得到的。例如著名的盧瑟福類比就是通過將原子結(jié)構(gòu)(目標域)同太陽系(源域)作類比,揭示了原子結(jié)構(gòu)的奧秘。 5)基于解釋的學習 (Explanation-based learning, EBL)
學生根據(jù)教師提供的目標概念、該概念的一個例子、領(lǐng)域理論及可操作準則,首先構(gòu)造一個解釋來說明為什么該例子滿足目標概念,然后將解釋推廣為目標概念的一個滿足可操作準則的充分條件。EBL已被廣泛應(yīng)用于知識庫求精和改善系統(tǒng)的性能。
著名的EBL系統(tǒng)有迪喬恩(G.DeJong)的GENESIS,米切爾(T.Mitchell)的LEXII和LEAP, 以及明頓(S.Minton)等的PRODIGY。
6)歸納學習 (Learning from induction)
歸納學習是由教師或環(huán)境提供某概念的一些實例或反例,讓學生通過歸納推理得出該概念的一般描述。這種學習的推理工作量遠多于示教學習和演繹學習,因為環(huán)境并不提供一般性概念描述(如公理)。從某種程度上說,歸納學習的推理量也比類比學習大,因為沒有一個類似的概念可以作為"源概念"加以取用。歸納學習是最基本的,發(fā)展也較為成熟的學習方法,在人工智能領(lǐng)域中已經(jīng)得到廣泛的研究和應(yīng)用。
基于所獲取知識的表示形式分類
學習系統(tǒng)獲取的知識可能有:行為規(guī)則、物理對象的描述、問題求解策略、各種分類及其它用于任務(wù)實現(xiàn)的知識類型。 對于學習中獲取的知識,主要有以下一些表示形式:
1)代數(shù)表達式參數(shù)
學習的目標是調(diào)節(jié)一個固定函數(shù)形式的代數(shù)表達式參數(shù)或系數(shù)來達到一個理想的性能。
2)決策樹
用決策樹來劃分物體的類屬,樹中每一內(nèi)部節(jié)點對應(yīng)一個物體屬性,而每一邊對應(yīng)于這些屬性的可選值,樹的葉節(jié)點則對應(yīng)于物體的每個基本分類。 3)形式文法
在識別一個特定語言的學習中,通過對該語言的一系列表達式進行歸納,形成該語言的形式文法。
4)產(chǎn)生式規(guī)則
產(chǎn)生式規(guī)則表示為條件—動作對,已被極為廣泛地使用。學習系統(tǒng)中的學習行為主要是:生成、泛化、特化(Specialization)或合成產(chǎn)生式規(guī)則。
5)形式邏輯表達式
形式邏輯表達式的基本成分是命題、謂詞、變量、約束變量范圍的語句,及嵌入的邏輯表達式。 6)圖和網(wǎng)絡(luò)
有的系統(tǒng)采用圖匹配和圖轉(zhuǎn)換方案來有效地比較和索引知識。
7)框架和模式(schema)
每個框架包含一組槽,用于描述事物(概念和個體)的各個方面。
8)計算機程序和其它的過程編碼
獲取這種形式的知識,目的在于取得一種能實現(xiàn)特定過程的能力,而不是為了推斷該過程的內(nèi)部結(jié)構(gòu)。
9)神經(jīng)網(wǎng)絡(luò)
這主要用在聯(lián)接學習中。學習所獲取的知識,最后歸納為一個神經(jīng)網(wǎng)絡(luò)。
10)多種表示形式的組合
有時一個學習系統(tǒng)中獲取的知識需要綜合應(yīng)用上述幾種知識表示形式。
根據(jù)表示的精細程度,可將知識表示形式分為兩大類:泛化程度高的粗粒度符號表示、??泛化程度低的精粒度亞符號(sub-symbolic)表示。像決策樹、形式文法、產(chǎn)生式規(guī)則、形式邏輯表達式、框架和模式等屬于符號表示類;而代數(shù)表達式參數(shù)、圖和網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)等則屬亞符號表示類。
按應(yīng)用領(lǐng)域分類
最主要的應(yīng)用領(lǐng)域有:專家系統(tǒng)、認知模擬、規(guī)劃和問題求解、數(shù)據(jù)挖掘、網(wǎng)絡(luò)信息服務(wù)、圖象識別、故障診斷、自然語言理解、機器人和博弈等領(lǐng)域。 從機器學習的執(zhí)行部分所反映的任務(wù)類型上看,大部分的應(yīng)用研究領(lǐng)域基本上集中于以下兩個范疇:分類和問題求解。
(1)分類任務(wù)要求系統(tǒng)依據(jù)已知的分類知識對輸入的未知模式(該模式的描述)作分析,以確定輸入模式的類屬。相應(yīng)的學習目標就是學習用于分類的準則(如分類規(guī)則)。
(2)問題求解任務(wù)要求對于給定的目標狀態(tài),??尋找一個將當前狀態(tài)轉(zhuǎn)換為目標狀態(tài)的動作序列;機器學習在這一領(lǐng)域的研究工作大部分集中于通過學習來獲取能提高問題求解效率的知識(如搜索控制知識,啟發(fā)式知識等)。