width=120 align=right vspace=5
border=0>本文目的在于分析Jetspeed支持集群的現(xiàn)狀。首先介紹了集群計算的背景知識,然后使用tomcat作為例子配置了一個集群,接著分析了jetspeed對集群的height=43 alt=apache_portals.gif hspace=5 src="/tea/image/section/13736.gif"
width=100 align=left vspace=5
border=0>支持現(xiàn)狀,提出了解決這些問題的辦法,最后詳細解釋了jetspeed保存sesson數(shù)據(jù)的操作,這將對jetspeed的改造有幫助。
1.1 術語定義
服務軟體是b/s或c/s結(jié)構的s部分,是為b或c提供服務的服務性軟件系統(tǒng)。
服務硬體指提供計算服務的硬件、比如pc機、pc服務器。
服務實體通指服務軟體和服務硬體。
客戶端指接受服務實體服務的軟件或硬件。
1.2 兩大關鍵特性
集群是一組協(xié)同工作的服務實體,用以提供比單一服務實體更具擴展性與可用性的服務平臺。在客戶端看來,一個集群就象是一個服務實體,但事實上集群由一組服務實體組成。與單一服務實體相比較,集群提供了以下兩個關鍵特性:
1.3 兩大能力
為了具有可擴展性和高可用性特點,集群的必須具備以下兩大能力:
負載均衡和錯誤恢復都要求各服務實體中有執(zhí)行同一任務的資源存在,而且對于同一任務的各個資源來說,執(zhí)行任務所需的信息視圖(信息上下文)必須是一樣的。
1.4 兩大技術
實現(xiàn)集群務必要有以下兩大技術:
具有同一個集群地址使得客戶端能訪問集群提供的計算服務,一個集群地址下隱藏了各個服務實體的內(nèi)部地址,使得客戶要求的計算服務能在各個服務實體之間分布。內(nèi)部通信是集群能正常運轉(zhuǎn)的基礎,它使得集群具有均衡負載和錯誤恢復的能力。
src="/tea/image/section/13737.gif" width=462 align=baseline vspace=5
border=0>
從上圖可知,由服務實體1、服務實體2和負載均衡器組成了一個集群。服務實體1和服務實體2參與對客戶端的服務支持工作,均衡負載器為客戶端維護集群的單一影像。集群實體間通過內(nèi)部的通信網(wǎng)交流信息,這種交流機制一般采用組播協(xié)議。負載均衡器通過內(nèi)部通信網(wǎng)探測各服務實體的心跳信息,服務實體間通過內(nèi)部通信網(wǎng)完成任務資源的傳播??梢钥闯?,配置集群主要由配置服務實體和配置負載均衡器兩部分組成。本文使用tomcat 4.12、apache 2.0.43配置集群環(huán)境,相關軟件的部署圖如下:
src="/tea/image/section/13738.gif" width=500 align=baseline vspace=5
border=0>
服務實體1/2,負載均衡器可以部署在不同的機器上,也可以在同一機器上,本文環(huán)境為同一機器。
2.1 準備軟件
2.2 配置負載均衡器
在apache下配置負載均衡器分為三步,注意每次修改httpd.conf和workers2.properties時不要忘了重新啟動apache。
負載均衡器jk2模塊是apache www 服務的插件,所以配置負載均衡器就得先安裝apache。本文下載的是windows版本 2.0.43,執(zhí)行setup.exe并回答一些簡單問題就可完成apache的任務。值得注意的是,安裝并啟動apache后如果apache對http://localhost/ 地址沒反應,你得修改apache安裝路徑下htdocs目錄下的index.html.xx文件,比如把index.html.en改成index.html。
把下載到的
target=_blank>mod_jk2-2.0.43.dll 改成mod_jk2.dll 放到apache的modules目錄下,修改apache的httpd.conf,即在LoadModule foo_module modules/mod_foo.so 行下插入mod_jk2模塊的裝載信息:
|
jk2的配置全在一個配置文件中,文件名為workers2.properties,和apache 的httpd.conf放在同一個目錄下。以下是這個文件的內(nèi)容:
|
對于jk2模塊的負載均衡配置可參見相關站點,值得提及的是jk2的負載均衡還支持權重分配等優(yōu)秀功能。
2.3 配置tomcat
同屬于一個集群下的兩個服務實體,要求功能的同一性,所以我們可先安裝和配置第一個tomcat,接著拷貝形成第二個tomcat,最后配置第二個tomcat。
2.3.1 安裝第一個tomcat
安裝tomcat 非常簡單,本文就不再描述。我們假設第一個tomcat的安裝路徑為d:\tomcat1。
拷貝tomcat-javagroups.jar和javagroups.jar到d:\tomcat1\ server\lib 路徑下。
2.3.2 配置第一個tomcat
2.3.2.1 配置jk2
tomcat 中的jk2 connector缺省端口為8009,為了在一臺機器上運行兩個tomcat,修改D:\Tomcat1\conf\jk2.properties,設置jk2 connector的端口為11009,整個文件內(nèi)容如下:
|
2.3.2.2 修改server.conf
首先為了讓一臺機器上運行兩個tomcat,修改server.conf的tomcat 停止指令監(jiān)聽端口:
|
然后打開JK2 AJP connector ,關閉其它connector,下面是JK2 AJP 1.3的樣子,這里已把它的端口改為11009:
|
接著配置需要集群支持的webapp(比如examples) 的context,添加如下manager:
|
注意protocolStack的值必須在一行內(nèi)寫完。
2.3.3 配置第二個tomcat
我們先把已經(jīng)配好的第一個tomcat復制一份,形成第二個tomcat,假設路徑為d:\tomcat2。
2.3.3.1 配置jk2
修改D:\Tomcat2\conf\jk2.properties,設置jk2 connector的端口12009,整個文件內(nèi)容如下:
|
2.3.3.2 修改server.conf
有了第一個tomcat的配置我們只需修改server.conf的tomcat 停止指令監(jiān)聽端口:
|
然后設置JK2 AJP connector 端口為12009。
2.4 運行測試
啟動apache,tomcat1和tomcat2。
2.4.1 測試負載均衡
我們先準備兩個文件,第一個文件為test.jsp,拷貝到第一個tomcat 的根web應用的目錄即d:\tomcat1\webapps\ROOT 下:
|
第二個文件也為test.jsp,拷貝到第二個tomcat 的根web應用的目錄即d:\tomcat2\webapps\ROOT 下:
|
從不同的瀏覽器中多次輸入地址http://localhost/test.jsp 會看到不同的顏色,這表明apache中的jk2模塊起到了負載均衡的作用。
2.4.2 測試錯誤恢復
訪問url: http://localhost/examples/servlet/SessionExample 可以得到一個關于session的例子,我們用它來測試集群的錯誤恢復能力。
測試步驟如下:
……
2.4.3 測試多目傳輸?shù)姆椒?/B>
如果運行測試失敗,可以使用下面的JAVAGROUP方法測試機器的多目傳輸性:
啟動多目接收器:
|
啟動多目傳輸器:
|
這樣你在McastSenderTest窗口中輸入內(nèi)容,應該在McastReceiverWindow中可以看到結(jié)果。如果看不到結(jié)果,在McastSenderTest運行參數(shù)中加入-ttl 32,如果還不行,可以修改多目地址再試試(注意避開系統(tǒng)保留用的多目地址);如果還不行,就去問問網(wǎng)管吧!
2.4.4 對tomcat-javagroups的修改
tomcat-javagroups.jar中的org.apache.catalina.session.ReplicatedSession類的removeAttribute方法會導致stackoverflow錯誤,請按下面的代碼對其進行修改:
|
3 jetspeed集群
我們現(xiàn)在知道了如何配置、甚至擁有一個集群環(huán)境,接下來本文分析Jetspeed的集群現(xiàn)狀,主要包括repository和Session數(shù)據(jù);為了使分析具有目的,在分析Jetspeed的集群現(xiàn)狀之前,先講述了集群需求和RunData對象。讀者可以用集群環(huán)境來驗證和調(diào)試Jetspeed的集群功能。
3.1 集群要求
《Memory Session Replication》一文中講述了支持集群的應用程序需注意的要點,現(xiàn)在對關于應用系統(tǒng)開發(fā)時應注意的事項總結(jié)如下:
3.2 RunData對象
RunData對象概念來自于Turbine,在Jetspeed中RunData對象的類型是DefaultJetspeedRunData,這個類擴展了Turbine中的DefaultTurbineRunData類。Jetspeed系統(tǒng)接到用戶瀏覽器的URL請求,進行計算和信息處理,最后返回給瀏覽器HTTP代碼流的整個過程中的代碼都可以訪問同一個RunData對象。所以RunData對象是Jetspeed系統(tǒng)中各個代碼模塊共享信息的機制。
3.3 Jetspeed的Repository
Repository 一般指一個軟件系統(tǒng)賴以啟動、運行的持久性環(huán)境,包括啟動Repository和運行Repository兩部分。啟動Repository用于決定系統(tǒng)啟動時的參數(shù),系統(tǒng)運行時不會改變它,如果改變了這些參數(shù),軟件系統(tǒng)必須重新啟動;運行Repository指實時影響軟件系統(tǒng)業(yè)務操作的參數(shù),這些參數(shù)可以被用戶或管理員當系統(tǒng)在線時改變?,F(xiàn)在的趨勢是:盡量減少啟動Repository,而擴大運行Repository;針對Repository的修改最好能使用管理性框架,比如SNMP和JMX。Jetspeed的repository主要在Xreg、psml和Properties文件中實現(xiàn)。
Jetspeed的啟動Repository主要在Properties文件中,運行Repository在xreg和psml中。文件形式的實現(xiàn)大大阻礙了jetspeed支持集群的能力和表現(xiàn),因為現(xiàn)在很少的應用服務器集群能在一個文件系統(tǒng)上運行,如果Repository需要在運行時改變,就必須同步多個服務實體上的文件,這是一個相當麻煩的問題。如果Repository支持數(shù)據(jù)庫實現(xiàn)形式,Jetspeed可以充分利用數(shù)據(jù)庫的存儲和同步機制實現(xiàn)同一個Repository服務于多個Jetspeed。所以要想 jetspeed支持集群、擁有更佳表現(xiàn),對Repository的數(shù)據(jù)庫化是一個不可忽視的任務。
支持數(shù)據(jù)庫的集群配置如下圖:
src="/tea/image/section/13739.gif" width=500 align=baseline vspace=5
border=0>
這個圖顯示了在數(shù)據(jù)庫集群環(huán)境下的jetspeed集群配置,數(shù)據(jù)庫負載均衡器實現(xiàn)數(shù)據(jù)庫集群的單一影像,例子有weblogic server中的multipool datasource,sql server 基于的windows 2000集群的單一集群IP,ORACLE RAC 的支持多連接地址的thin jdbc driver。
3.4 Jetspeed的Session數(shù)據(jù)
支持集群必須使得各個服務實體針對某個任務的執(zhí)行環(huán)境是相同的,對于jetspeed來說就是針對各個URL請求,session的數(shù)據(jù)能在各個jetspeed上復制。這些session被同一個sessionid所標識,這些標識可能來自瀏覽器的cookies或URL中。我們首先用一個velocityportlet來顯示Jetspeed的session中到底保存了什么數(shù)據(jù),這個portlet的注冊名字為SessionPortlet。
3.4.1 SessionPortlet
SessionPortlet是一個velocityPortlet,其類名可以是CustomizerVelocityPortlet或VelocityPortlet,一般情況下沒有必要開發(fā)一個新的portlet class。關于如何開發(fā)部署portlet的教程可見參考部分,現(xiàn)在我們分注冊、控制助手、portlet模版和運行來講述這個portlet。
3.4.1.1 注冊
SessionPortlet用于顯示目前的session數(shù)據(jù)。它在xreg中的注冊代碼為:
|
3.4.1.2 控制助手Action
portlets.SessionAction是Velocityportlet模版portlet的控制助手,在velocity解釋模版前執(zhí)行:
|
從上面的代碼可以看出,這個控制助手在模版的模型(MVC中的M)環(huán)境中設置了一個保存了session數(shù)據(jù)的map數(shù)據(jù)結(jié)構。
3.4.1.3 portlet模版
SessionPortlet的模版文件是session.vm(MVC中的V),這個文件的內(nèi)容如下:
|
3.4.1.4 定制psml和運行SessionPortlet
用admin/jetspeed或turbine/turbine帳號/口令登錄到jetspeed系統(tǒng)后,可以在velocity.legend portlet分類中找到SessionPortlet,把它加入到你的psml中后可以看到SessionPortlet顯示的session數(shù)據(jù)(你可以多多點擊其它的URL,盡量地使jetspeed在session中多放一些數(shù)據(jù)):
src="/tea/image/section/13740.gif" width=500 align=baseline vspace=5
border=0>
從上面的session快照可以看出,Jetspeed的session數(shù)據(jù)主要分為兩類:BaseJetspeedUser和JetspeedHttpStateManagerService$StateEntry,下面我們就分別來看看這兩個類的情況。
src="/tea/image/section/13741.gif" width=500 align=baseline vspace=5
border=0>
3.4.2 BaseJetspeedUser
我們從《Session數(shù)據(jù)類圖(部分)》可以看出BaseJetspeedUser實現(xiàn)了serializable接口。另外分析這個類及其父類的代碼可了解到這個類的成員也實現(xiàn)了serializable接口。所以可以初步得出這個類是集群安全的。
DefaultTurbineRundata實現(xiàn)了這個類型的session數(shù)據(jù)的操作接口:
|
|
|
3.4.2.1 用戶登錄
用戶在jetspeed的首頁中輸入用戶名和口令,接著點擊登錄(login)按鈕,可以激活JLoginUser.doPerfom->TurbineAuthentication.login->DefaultTurbineRundata.save->JetspeedSessionValidator.doPerform-> DefaultTurbineRundata.populate系列步驟。
如果properties配置中的配置項automatic.logon.enable 的值為true,JLoginUser.doPerfom還會設置瀏覽器cookies:username 和logincookie。username是成功登錄的用戶名, logincookie是一個隨機值,會保存到用戶數(shù)據(jù)庫中。
當用戶訪問jetspeed的首頁時,JetspeedSessionValidator.doPerform檢查RunData對象中的當前用戶,如果沒有登錄而且automatic.logon.enable 的值為true,它會從cookies中獲取username 和logincookie,再從用戶數(shù)據(jù)庫中查尋用戶的logincookie,如果它們相等則調(diào)用下面的代碼設置RunData的用戶數(shù)據(jù):
|
至于針對不同的用戶,首頁中顯示的portlet由缺省screen模版中調(diào)用JetspeedTool的方法(有一套PSML定位算法)來決定。
3.4.2.2 當session過期之后顯示匿名用戶的主頁
當session過期,Turbine.doget首先會創(chuàng)建新的session,接著激活JetspeedSessionValidator.doPerform-> JetspeedSecurity.getAnonymousUser->DefaultTurbineRundata.save系列步驟。
JetspeedSessionValidator.doPerform會設置缺省screen模版。
3.4.2.3 用戶登出
當用戶登錄之后,點擊Jetspeed系統(tǒng)右上角的登出(logout)按鈕,可以激活JLogOut.doPerform-> TurbineAuthentication.logout-> TurbineAuthentication.getAnonymousUser-> DefaultTurbineRundata.save系列步驟。
TurbineAuthentication.getAnonymousUser從數(shù)據(jù)庫中得到匿名用戶的用戶數(shù)據(jù)(根據(jù)properties配置中user.anonymous項)。
如果properties配置中配置項automatic.logon.enable 的值為true,JLogOut.doPerform還會刪除瀏覽器和當前request的cookies:username 和logincookie,防止后面的JetspeedSessionValidator拿著先前的用戶數(shù)據(jù)自動登錄。JLogOut.doPerform最后設置data的缺省screen模版。
3.4.3 JetspeedHttpStateManagerService$StateEntry
我們從《Session數(shù)據(jù)的類圖(部分)》可以看出StateEntry沒有實現(xiàn)了Serializable接口。把它放到session的屬性中不是集群安全的。Serializable接口只是個標志接口,它不擁有任何函數(shù)和數(shù)據(jù)成員,
為了使其集群安全化,首先必須讓StateEntry實現(xiàn)Serializable接口。
DefaultJetspeedRunData擁有下列對StateEntry類型的session數(shù)據(jù)操作接口:
|
|
|
3.4.3.1 類圖
src="/tea/image/section/13742.gif" width=500 align=baseline vspace=5
border=0>
BaseStateManagerService有一個類型為Map的成員變量m_httpSessions,以Thread對象為key,HttpSession對象為值。HttpSession對象中屬性的key 是前面DefaultJetspeedRunData的StateEntry類型的session數(shù)據(jù)操作接口的key,屬性的值為StateEntry對象。StateEntry對象的成員變量m_key保存操作接口的key,成員變量m_map是一個Map對象,以后面我們要講的setAttribute方法的name參數(shù)為 key,value參數(shù)為值。
3.4.3.2 初始化
下面的順序圖是一個簡圖,主要用于解釋BaseStateManagerService的成員變量m_httpSessions的映射如何被填充和清除。
src="/tea/image/section/13743.gif" width=500 align=baseline vspace=5
border=0>
Turbine是一個servlet,其doGet方法是jetspeed系統(tǒng)的入口。
Turbine請求JetspeedRunDataService生成RunData對象,JetspeedRunDataService調(diào)用HttpServiceRequest的getSession(true)方法獲取與當前請求對應的httpSession對象(以true為參數(shù),getSession在當前session無效時會返回一個新的httpSession對象,否則返回先前請求的httpSession對象),JetspeedRunDataService接著調(diào)用JetspeedHttpStateManagerService的setCurrentContext(httpSession對象)方法,這個方法會以當前的Thread為key,參數(shù)httpSession對象為值填充BaseStateManagerService的成員變量m_httpSessions。
doGet方法填充了m_httpSessions,并作了好多事情之后,在即將退出之前調(diào)用了JetspeedRunDataService的putRunData(data)方法,這個方法再調(diào)用JetspeedHttpStateManagerService的clearCurrentContext()方法刪除BaseStateManagerService的成員變量m_httpSessions中以當前Thread為key的Map項。
下圖顯示了m_httpSessions對象經(jīng)過初始化后的內(nèi)存狀態(tài)快照,體現(xiàn)了m_httpSessions對象保留的Thread-〉HttpSession的映射關系。
src="/tea/image/section/13744.gif" width=500 align=baseline vspace=5
border=0>
3.4.3.3 屬性操作
當DefaultJetspeedRunData通過session操作接口獲取SessionState之后,其它就可以使用SessionState對象的成員方法操作狀態(tài)屬性了。這兩個方法是:
|
src="/tea/image/section/13745.gif" width=500 align=baseline vspace=5
border=0>
在從RunData對象處獲取sessionState對象后,jetspeed代碼可以調(diào)用這個對象的屬性操作方法。
(1) 主要步驟:
1.1sessionState對象利用自己的key,結(jié)合參數(shù)name,value調(diào)用JetspeedHttpStateManagerService的setAttribute(key,name,value)方法;
1.1.1JetspeedHttpStateManagerService調(diào)用自己的getState(key)方法在參數(shù)key的幫助下獲取保存在當前線程session中的StateEntry對象的m_map變量,這個過程由1.1.1.1-1.1.1.4組成;
1.1.2得到StateEntry對象的m_map變量后,JetspeedHttpStateManagerService接著先處理m_map中的先前的參數(shù)name對應的屬性值,再設置參數(shù)name對應的屬性值新值為參數(shù)value。
(2) 候選步驟:
1.1.1a 如果session中沒有相應的StateEntry對象,則先生成并往一個session中加入一個。
(1) 主要步驟:
2.1sessionState對象利用自己的key,結(jié)合參數(shù)name調(diào)用JetspeedHttpStateManagerService的getAttribute(key,name)方法;
2.1.1JetspeedHttpStateManagerService調(diào)用自己的getState(key)方法在參數(shù)key的幫助下獲取保存在當前線程session中的StateEntry對象的m_map變量;
2.1.2得到StateEntry對象的m_map變量后,JetspeedHttpStateManagerService接著調(diào)用m_map對象的get(name)方法獲取屬性值。
下圖體現(xiàn)了這些方法執(zhí)行后HttpSession對象保留的key-> StateEntry對象以及StateEntry對象的Name->Value的映射關系。
src="/tea/image/section/13746.gif" width=500 align=baseline vspace=5
border=0>
3.5 修改建議
(1) 實現(xiàn)數(shù)據(jù)庫形式的repository。根據(jù)前面的集群需求第五條,必須把repository數(shù)據(jù)庫化才能使得集群下的各個jetspeed的資源視圖相同。
(2) StateEntry。根據(jù)前面的集群需求第一條,必須讓StateEntry實現(xiàn)Serializable接口。目前StateEntry是一個內(nèi)部類,為了讓JVM的Serializer設施能順利創(chuàng)建StateEntry對象,最好把其public化。
(3) setAttribute要重設session屬性。根據(jù)前面的集群需求第二條,session對象的setAttribute是導致復制的引子,我們必須在改變session屬性后調(diào)用session對象的setAttribute方法重置session屬性,如下圖所示。
src="/tea/image/section/13747.gif" width=500 align=baseline vspace=5
border=0>
雖然Jetspeed中這樣模式的代碼如下:
對下面類中的doXXX方法按照這個模式進行修改。
4 總結(jié)
可以這樣說,目前的jetspeed在設計和實現(xiàn)時沒有考慮集群環(huán)境下的運行情況,本文的分析突出了jetspeed支持集群的主要癥結(jié)、但不一定完善,甚至有不正確的地方,另外一個主要內(nèi)容是分析jetspeed保存在session對象中的數(shù)據(jù)。希望本文有助于大家加深對集群的理解,有助于提醒大家在設計和開發(fā)軟件系統(tǒng)時"keep clustering in mind"。
本文轉(zhuǎn)載自target=_blank>IBM developerWorks,版權歸IBM developerWorks和原作者所有。