試題四(共25分)
閱讀以下關(guān)于數(shù)據(jù)集成的敘述,在答題紙上回答問題1至問題3。
某互聯(lián)網(wǎng)銷售企業(yè)需要建立自己的電子商務(wù)平臺,將所有產(chǎn)品信息集中在一起,為用戶提供全方位的產(chǎn)品信息檢索服務(wù)。但產(chǎn)品供應(yīng)商大多數(shù)已經(jīng)建有自己的電子商務(wù)平臺,且數(shù)據(jù)獨立存儲,而且數(shù)據(jù)格式和數(shù)據(jù)平臺有較大差異,有的供應(yīng)商甚至沒有采用數(shù)據(jù)庫來存儲
商品信息。為此該企業(yè)專門成立專家組來論證其數(shù)據(jù)集成方案。
李工提出采用集中式集成方式把產(chǎn)品供應(yīng)商的數(shù)據(jù)集中在一起,采用數(shù)據(jù)倉庫技術(shù)來實現(xiàn)與各家供應(yīng)商的數(shù)據(jù)集成。而王工提出采用松耦合的聯(lián)邦數(shù)據(jù)庫集成方案。專家組經(jīng)過激烈討論,認(rèn)為王工方案更為合理,建議采用王工提出的集成方案。
【問題1】(10分)
請結(jié)合數(shù)據(jù)倉庫和聯(lián)邦數(shù)據(jù)庫集成方案各自的特點,簡要說明專家組采用王工提出的集成方案的原因。
【問題2】(7分)
部分供應(yīng)商的產(chǎn)品信息沒有相應(yīng)的數(shù)據(jù)庫,而是直接嵌入在WEB頁面中供用戶瀏覽。數(shù)據(jù)集成時需要直接從供應(yīng)商電子商務(wù)平臺的網(wǎng)頁上獲取其產(chǎn)品信息。請簡要給出此類數(shù)據(jù)集成的方法和基本步驟。
【問題3】(8分)
在方案評審會上,項目組針對李工和王工的方案展開了激烈的討論。劉工指出兩種方案在實施的過程中,都存在數(shù)據(jù)源之間的語義映射和轉(zhuǎn)換問題,都會帶來數(shù)據(jù)集成的不確定。請簡要說明產(chǎn)生不確定的原因。