李阿姨今年44岁刘阿姨比,108个姿势小人图简笔画,梦露国际成人用品加盟费多少,亚洲vs欧洲vs美洲人口比例

<tt id="mdjq6"><address id="mdjq6"></address></tt>
    1. <rp id="mdjq6"></rp>

    <rp id="mdjq6"></rp>

    云開源論壇開源現(xiàn)狀與發(fā)展趨勢(shì)

    時(shí)間:2013-02-26  來源:武漢網(wǎng)whw.cc  作者:whw.cc 我要糾錯(cuò)


    主持人歡迎各位還繼承留在我們今天Apache的會(huì)場(chǎng),這次我們很有幸有很多來自于Apache社區(qū)的實(shí)際的開發(fā)者,跟大家能夠有背靠背的機(jī)遇,來講講他們?cè)趯?shí)際項(xiàng)目操作當(dāng)中所遇到的一些問題,所以下戰(zhàn)書的部分,我們每一場(chǎng)都留點(diǎn)時(shí)間讓大家提一些很實(shí)際的技術(shù)問題。

    我們今天有Hadoop項(xiàng)目標(biāo),有CloudStack等等團(tuán)隊(duì)的成員,今天第一場(chǎng)比較有趣,是由一個(gè)團(tuán)隊(duì),Apache的一個(gè)團(tuán)隊(duì)來講講OpenOffice進(jìn)入到Apache社區(qū)之后不同的情況,以及在中國(guó)的發(fā)展,首先有請(qǐng)Peter Junge。

    劉順風(fēng)謝謝Peter先生介紹了Apache的歷史以及將來的瞻望,我是IBM中國(guó)開發(fā)中心的經(jīng)理,我的團(tuán)隊(duì)成員也參與Apache OpenOffice開發(fā)的過程中。

    今天我用很短的時(shí)間,介紹一下在這樣大的開源社區(qū)里面,我們來自北京的志愿者們都做了出了哪些貢獻(xiàn),這是非常有趣的話題,開源離我們非常近,因?yàn)槲覀兊闹驹刚邆兙驮谏磉叀?/p>

    首先問大家有多少人用過OpenOffice這個(gè)產(chǎn)品?很興奮看到這么多人都舉手,有多少人去社區(qū)轉(zhuǎn)過?看看有什么問題能夠得到解答,或者有什么事情能夠幫下忙?磥磉@個(gè)人就少了很多。我其實(shí)今天的目的就是生機(jī)能夠吸引更多的人來參與我們社區(qū)開發(fā),成為我們社區(qū)的一員,一起來推動(dòng)這個(gè)開源項(xiàng)目標(biāo)發(fā)展。

    大家可以看到,其實(shí)異常近的,就在我們身邊,就在這個(gè)軟件園里面,其實(shí)我粗略算了一下,大概有三十多個(gè)來自北京的意愿者,在這個(gè)社區(qū)里面工作,而且他們起了十分要害的作用,他們有來自于良多公司或者個(gè)人的供給者,比方Peter,他也在北京,我也把他算了進(jìn)去。

    這些來自北京的自愿者,在Apache OpenOffice發(fā)展過程中,尤其是當(dāng)它去年從一個(gè)Oracle脫離加入Apache這個(gè)過程起的非常中心的作用,他們的工作從開發(fā)測(cè)試到后面的用戶界面的設(shè)計(jì),到翻譯等等,很多的工作,甚至是產(chǎn)品推廣都起了很大的作用。

    從OpenOffice加入Apache社區(qū)以來,我們現(xiàn)在正在做4.0.1,這是很大品質(zhì)的用戶休會(huì)的晉升。北京的意愿者都在這里施展著極其重要的作用。

    參與了簡(jiǎn)直所有版本的開發(fā),而且在里面起到的作用很要害,有些性能的提升,有些對(duì)微軟文檔的兼容性的提升,我們都做出了很多的貢獻(xiàn),而且還有一些癥結(jié)問題的修復(fù)。包括值得兩個(gè)說的貢獻(xiàn),IBM這邊把所有開發(fā)了五年的英文貢獻(xiàn)出來,里面包含了很多的IBM自己開發(fā)的功能,包括一些重大的性能晉升,還有像對(duì)于殘疾人士所謂無阻礙的功能。下一步在4.0里面我們要把這些東西進(jìn)一步的合在Apache OpenOffice里面,給寬大用戶帶來真正的利益。另一個(gè),中標(biāo)的他們貢獻(xiàn)他們了UOF的格式,對(duì)我們國(guó)內(nèi)的用戶是一個(gè)非常好的福音。這是開發(fā)這邊。

    測(cè)試這邊,我們有許多的人介入到測(cè)試的過程中,完全是從頭來樹立這樣一個(gè)產(chǎn)品的測(cè)試架構(gòu),大家曉得其實(shí)Apache社區(qū)里面,大部門的產(chǎn)品,大家有沒有留神過,它針對(duì)的是一些什么樣的用戶。其實(shí)大局部產(chǎn)品針對(duì)的是開發(fā)職員,好比說我們的HTPServer,等等這樣一些工具,像是一個(gè)開發(fā)包。OpenOffice不一樣在于它是一個(gè)在這個(gè)社區(qū)里面比較少見針對(duì)終極用戶的產(chǎn)品,它的代碼量級(jí)以及產(chǎn)品的龐雜度,都比良多開源社區(qū)產(chǎn)品要高許多,這時(shí)候顯得非常的重要,我們測(cè)試工程師花了很大的精神,簡(jiǎn)直從頭樹立測(cè)試的流程,籠罩了產(chǎn)品開產(chǎn)生命周期全過程。還開發(fā)了主動(dòng)測(cè)試的腳本,這都是他們?cè)谏鐓^(qū)里面經(jīng)由大家探討而使用的一些,同樣也是開源的測(cè)試治理工具,發(fā)生了讓大家很可以清楚懂得這個(gè)產(chǎn)品德量的測(cè)試講演按期宣布,這是測(cè)試方面的貢獻(xiàn)。

    另一方面,我們還有一些非?少F的資源,我們的用戶休會(huì),我們的界面設(shè)計(jì),美工的工作者,他們不僅在為Apache下一個(gè)版本的新的界面正在盡力工作,而且也有很多的介紹,比如說我們大家如果用了Apache OpenOffice會(huì)留神到,我們有很豐盛的模板庫,這個(gè)模板,如果你在一個(gè)美麗模塊的基本上工作,做出來的文檔非常英俊,而且不必費(fèi)太大的工夫,我們?cè)O(shè)計(jì)者也貢獻(xiàn)了很多的模板在這里,今天我們使用的這個(gè)模板就起源于我們北京的設(shè)計(jì)者,這里列出來第一個(gè)模板被歐洲Apache大會(huì)所使用,有著很好的反應(yīng)。

    最后翻譯,作為這么一個(gè)直接面對(duì)終極用戶的產(chǎn)品,翻譯長(zhǎng)短常異常主要的。我們Apache OpenOffice已經(jīng)有完全翻譯的中文版,在下一步的開發(fā)中跟著我們新功效的開發(fā)要進(jìn)一步完美我們的翻譯工作,作為我們產(chǎn)品推廣,網(wǎng)站翻譯其實(shí)這里面有很大的差距,如果大家到OpenOffice的網(wǎng)站上看一看,其實(shí)中文網(wǎng)頁無比少,這是需要大家每個(gè)人去貢獻(xiàn)的,一起來參加這個(gè)翻譯的工作。

    我很快過了一些主要的我們來自北京的志愿者做出來的這些貢獻(xiàn),我的目的是什么呢?非常簡(jiǎn)單,我號(hào)令大家來加入我們。三十多個(gè)來自北京的志愿者,其中大部分已經(jīng)是存在直接提交代碼的權(quán)利,這是非常不容易的事情,在國(guó)內(nèi)參與Apache社區(qū)里面來說,這是一個(gè)很大的量。大家可以看到,我吶喊大家來加入社區(qū),加入我們,好處很顯然,尤其在國(guó)外,大家甚至能看到有些公司在招人的時(shí)候,都很重視是不是有開發(fā)的閱歷,如果大家以后希望去國(guó)外留學(xué)或者找工作的話,如果你說我在Apache OpenOffice社區(qū)里面做過開發(fā),那是一個(gè)非常非常好的,在你簡(jiǎn)歷里面的一個(gè)亮點(diǎn)。

    我愿望大家能夠多使用下載最新版本的Apache OpenOffice,并且接下來贊助我們一起宣揚(yáng)這個(gè)產(chǎn)品,其實(shí)Apache OpenOffice它的主要用戶群下來集中在歐洲和北美是最多的,那么國(guó)內(nèi)我感到我們其實(shí)還有很多的宣揚(yáng)空間在里面,當(dāng)大家被迫交錢買Office,沒有措施的時(shí)候,其實(shí)很多人并不知道有其他的方法,讓大家知道我們其實(shí)有更多的抉擇在里面。

    接下來,我知道在座有很多技術(shù)職員,技術(shù)蠢才,愿望能加入我們,來做開發(fā)、測(cè)試這樣的工作,還有其他的一些工作可以做,比如參加我們網(wǎng)站的翻譯和保護(hù),或者輔助我們完美一些人,甚至我在社區(qū)里面,根據(jù)我的使用教訓(xùn),來給我們其他新來的OpenOffice的用戶來提供一些反饋,比如說他們提出的問題,就我的教訓(xùn)我可以答復(fù),這都是從點(diǎn)點(diǎn)滴滴做起的,為我們社區(qū)做貢獻(xiàn)很好的例子。

    其實(shí)作為一個(gè)開源社區(qū),其實(shí)我不是一個(gè)參與時(shí)間非常久的,我是從去年開始的,我覺得在這中間,領(lǐng)會(huì)到一種國(guó)際化交換的,開源社區(qū)里的一種氣氛,這是我感到到非常有樂趣的事情。在Apache社區(qū)里面是人人同等的,每個(gè)人作為獨(dú)立的個(gè)體必須做出自己的貢獻(xiàn),每說一件事情的時(shí)候你并不沒有權(quán)利逼迫別人批準(zhǔn)你,你來提議沒人反對(duì)我就可以自己開始著手去做了,甚至如果我的提議非凡人,會(huì)有人加入我,這是開源社區(qū)最樂意看到的一個(gè)結(jié)果。

    我這里列出來的這些開始的點(diǎn),到哪下載我們的產(chǎn)品,到哪加入我們的郵件列表,甚至我想做一個(gè)開發(fā),我應(yīng)該從哪學(xué)起,先從Apache準(zhǔn)則做起,我應(yīng)該怎么搭環(huán)境,怎么考慮問題等等,列出來的這樣一些鏈接,會(huì)后這個(gè)我們會(huì)發(fā)出來,大家都會(huì)看到,大家去谷歌、百度一下OpenOffice大家就可以找到我們的站點(diǎn),直接去找有用的信息,有什么問題都可以直接在列表里面找。這是我一個(gè)簡(jiǎn)單的介紹。不知道大家有什么問題嗎?如果沒有什么問題的話,下面請(qǐng)劉濤幫我們介紹UOF,以及我們公司在OpenOffice上做的一些工作。

    劉濤大家,我是來自于中標(biāo)軟件有限公司的,負(fù)責(zé)公司Opensource這塊,包括我們公司的操作系統(tǒng),還有云安全操作系統(tǒng),Office也是一塊,今天主要是講Office。

    在今年Apache的年會(huì)上,把我們給OpenOffice做的一些貢獻(xiàn),今年在德國(guó)舉辦的Apache年會(huì),把我們做的工作已經(jīng)講了一部分,UOF這塊還有后面,我所說的企業(yè)和政府的辦公主動(dòng)化這塊是沒有講的,所以拿到這邊做一下分享。剛才Peter已經(jīng)把OpenOffice前生今世還有它的幾個(gè)孩子說得很明白了。我今天講一下UOF在中國(guó)的應(yīng)用,UOF簡(jiǎn)單的介紹,還有就是它的兼容性問題的解決計(jì)劃,以及一些功能。

    在海內(nèi)有這么幾家公司都去做了UOF文檔格式,首先是中標(biāo)軟件在做,有金山,還有微軟,還有IBM。UOF我們叫國(guó)家文檔格式尺度,最早的發(fā)布是一個(gè)1.0版本,是在2007年發(fā)布的。在07年到09年之間,始終在完善,從1.1、1.2,始終到1.3,09年提了一個(gè)草案,這個(gè)草案結(jié)束之后,后期會(huì)做一個(gè)發(fā)布,現(xiàn)在還沒有發(fā)布2.0版本。

    UOF這個(gè)文檔,2.0版本里面它把原來UOF這個(gè)文檔格式變成了三種格式,對(duì)于文字處理用了UOT格式,電子表用了UOS格式,演示文稿用了UOP的格式,由多過XMAL文件組成的,2.0絕對(duì)于以前1.0的版本,了解UOF的比較少,如果有了解的話,2.0版本做的一些改進(jìn),去掉了一些LOGO和ID,屬性列表,增加了內(nèi)部ID和多元的符號(hào),解決了一些單一檔次和繼續(xù)檔次的元素關(guān)系等等,這是它對(duì)于國(guó)家文檔格式標(biāo)準(zhǔn)的一個(gè)圖。

    UOF文檔格式的標(biāo)準(zhǔn),它支持什么,支持國(guó)家的這樣一個(gè)政府的公文,和政府公文都要求的排版、結(jié)構(gòu)都是比較緊的,當(dāng)你要修正一個(gè)字體或者字號(hào)的時(shí)候這個(gè)格式就不會(huì)被通過。大家可以看一下這有一個(gè)截圖,在做政府辦公的時(shí)候,比如說上面的這個(gè)份號(hào),密級(jí),保密期限等等,這個(gè)模板是今年國(guó)家制訂了一個(gè)新的國(guó)標(biāo)的模板,這個(gè)模板就是你必需要遵照它的這個(gè)排版格式,比如說我的一個(gè)稿件里面的一頁是多少行,每一行有多少個(gè)字這都是有嚴(yán)厲要求的。

    那么真正做到政府的辦公文檔格局和一般通用的文檔格局之間的轉(zhuǎn)換呢?這里面就波及到文檔尺度轉(zhuǎn)換的問題,用XSLT,相稱于是款式單,來把一個(gè)文檔轉(zhuǎn)化成XMAL文檔,這是它的Import process,在一個(gè)文檔當(dāng)中把他的數(shù)據(jù),當(dāng)然這個(gè)數(shù)據(jù)分兩個(gè)部門,我們把以及視頻這樣的數(shù)據(jù)轉(zhuǎn)化成一個(gè)64倍的,然后把它變成,合并成一個(gè)FLATS這樣一個(gè)文件,之后再把它輸出成一個(gè)ODF。

    時(shí)間關(guān)聯(lián),也說得比較快,可能大家只有一個(gè)理性上的意識(shí),F(xiàn)在我們正在做的工作也就是要解決一些在這個(gè)過程之中呈現(xiàn)的一些問題,然后把2.0的UOF代碼進(jìn)行保護(hù)。非常歡送大家能夠加入我們?nèi)プ鲞@件事情。這是UOF貢獻(xiàn)的這一塊。

    下面我會(huì)講一下ApacheOpenOffice在企業(yè)和政府的辦公自動(dòng)化領(lǐng)域中的應(yīng)用,相當(dāng)是我們基于ApacheOpenOffice做的一個(gè)解決方案。

    可能我會(huì)分幾個(gè)方面,一個(gè)是技術(shù)的解決方案,還有會(huì)主要從細(xì)節(jié)上說一下,F(xiàn)irefox,遠(yuǎn)程文檔的操作,最后就是有幾個(gè)例子,政府的,軍隊(duì)的,還有醫(yī)療行業(yè)的,最后做一個(gè)小節(jié)。

    技術(shù)解決方案之中,首先我會(huì)給大家展現(xiàn)一個(gè)Firefox的圖。然后是監(jiān)聽反饋機(jī)制,最后是文檔的機(jī)制。這張圖就是Firefox工作的流程圖,紅色背景的可以理解成一個(gè)瀏覽器,plugins就是一個(gè)插件,他對(duì)Office的啟動(dòng),第二就是跟英文橋做通訊,第三就是部分監(jiān)聽機(jī)制,最后一個(gè)就是遠(yuǎn)程文檔的操作。上面對(duì)于插件和閱讀器之間用什么樣的方式進(jìn)行轉(zhuǎn)換。這是一個(gè)英文橋的介紹,我不細(xì)講,目的就是轉(zhuǎn)換Firefox插件,讓JS和Firefox插件之間建立一種聯(lián)系。

    對(duì)于監(jiān)聽和反饋機(jī)制,我在閱讀器里面會(huì)有鼠標(biāo)、鍵盤的動(dòng)作,當(dāng)然這些動(dòng)作都不是針對(duì)與Office本身做操作的,是在Office外面進(jìn)行操作,比如右鍵這些動(dòng)作,這些動(dòng)作怎么讓Office知道,就是有一個(gè)監(jiān)聽的機(jī)制,實(shí)現(xiàn)從外部接口去解決Office內(nèi)部的東西,當(dāng)然它確定也是基于剛才講的UNO的實(shí)踐,這是整個(gè)Liscens架構(gòu)圖,可以看一下。

    之后就是遠(yuǎn)程文檔操作,我們提供兩種,一種是對(duì)于遠(yuǎn)程的文件情勢(shì)的這樣一種操作,我的JS代碼都是寫在服務(wù)真?zhèn),Office的插件里面我基本是不會(huì)存在這些可以與外界進(jìn)行溝通的一些代碼的,這樣做的目的是保障平安,因?yàn)榉⻊?wù)端操作的話,安全性是需要保障的。

    在前端用JS包裝這個(gè)接口的好處有很多,本來我們的接口是這樣的,我們用JS包裝之后,他就會(huì)把這些接口轉(zhuǎn)化成,你可以給任何團(tuán)體商或者開發(fā)商去做,不用給他開放Office這塊接口,只要給他一個(gè)JS的接口,他就可以做他想要做的任何事情。這是它的一些好處,比如說比較穩(wěn)定,開發(fā)速度快,可以對(duì)自己的系統(tǒng)做定制,比較容易使用。這是我們的一些案例,我剛才說的只是在Firefox中的插件,當(dāng)然我們這個(gè)插件有很多種,比如在Windows機(jī)器上也有一些控件,這是政府辦公的應(yīng)用,部隊(duì)是Firefox控件的應(yīng)用。這個(gè)是在醫(yī)療行業(yè)的應(yīng)用,我就說這么多,小結(jié)一下,有很多種控件可以運(yùn)用于很多個(gè)行業(yè)。我先講這么多。

    劉鼎力大家好,接下來的時(shí)間交給我,我是來自于IBM的劉鼎力,接下來這個(gè)主題恰好跟我們今天這個(gè)云,看一下我們Office產(chǎn)品怎么跟云平臺(tái),怎么跟我們一些主要的Social的社交軟件集成在一起,看一看我們文檔處理并不是簡(jiǎn)單的文檔處理,在今天的環(huán)境中我們有更多的挑選工作方式。

    現(xiàn)在大家都知道,大數(shù)據(jù)、云還有Social都是比較主流的概念,如果我們的一個(gè)軟件還有包括我們的解決方案,不包含這些點(diǎn),你都不好心思說你是做軟件的。

    我們看一看云是有私有云,有公有云,我們OpenOffice都是可以引入進(jìn)去的,他并不是獨(dú)破的桌面應(yīng)用軟件。我們可以思考一下,在現(xiàn)今信息爆炸的時(shí)期,我們?cè)趺礃釉谠茣r(shí)期,在Social時(shí)代處置我們的文檔呢,國(guó)度的正版化是無比倡導(dǎo)的,桌面云客戶端去拜訪的時(shí)候都要斟酌Listens的本錢問題。

    在國(guó)內(nèi)很多人多不知道,在文檔處理這一塊,我們有另外一個(gè)取舍,就是我們的OpenOffice。我們講一下現(xiàn)在無處不在,都帶Social,我們每一個(gè)人手上都有一個(gè)挪動(dòng)中止,包括我們無處不在的無線網(wǎng)絡(luò),包括新浪微博,騰訊微博,云計(jì)算實(shí)施,F(xiàn)acebook這些都是我們Social的一些信息分享渠道,那我們?nèi)绾卧谖覀冏鑫臋n處理的時(shí)候,去引入這些信息呢,怎么樣去把我們自己寫的一些文章,分享給其他人,在我們做OpenOffice的時(shí)候,我們有一種擴(kuò)展機(jī)制,可以讓我們方便的去跟我們后盾這些SocialServer做一些集成,其實(shí)這種模式不止應(yīng)用于OpenOffice,其實(shí)大家也可以看一看,我們有一些自己的應(yīng)用,其實(shí)也完全可以采用這樣的架構(gòu)去做一些擴(kuò)展,跟我們的服務(wù)連接起來,F(xiàn)在有很多公司肯定也是這樣去做的。

    這里面提到的Social Cnnectors這個(gè)概念,怎么跟后盾聯(lián)系起來,今天是偏技術(shù)的會(huì)議,可以看到,在我們中間是應(yīng)用了一系列的Social這些接口,我們用這些接口就可以從服務(wù)商那里拿到我們想要的數(shù)據(jù)。在前端在我們的客戶機(jī)上,或者是我們的桌面云上,我們通過這樣一系列插件,能夠把我們的數(shù)據(jù)整合在文檔里面,反過來也是一樣,我們可以把我們做的文檔分享給其別人,這個(gè)可以是一個(gè)全文檔的分享,也可以是一些信息片斷的分享。

    這個(gè)里面大家可以看到,剛才講到的是Social的應(yīng)用,這里面是一種桌面云的應(yīng)用,桌面云很簡(jiǎn)單,你能夠在任何地方去訪問這個(gè)桌面,這個(gè)桌面現(xiàn)在正常用虛擬技術(shù)。在國(guó)內(nèi)也是越來越看重的,所有在桌面上的軟件,其實(shí)都有一個(gè)LI成本考慮的問題,如果云的服務(wù)商,提供一個(gè)沒有LI的軟件其實(shí)是一個(gè)很大的法律問題的,這里面OpenOffice提供了一種取舍,能夠讓我們用戶釋懷勇敢地去使用正版的文檔處理的工具,而且前面我們也講到,我們的OpenOffice,大家是可以拿到它的原代碼,隨便去從新發(fā)布,從新做自己的定義。改個(gè)名字,打個(gè)包,換個(gè)外殼,加入自己一些自有的功能就可以去做我們商業(yè)軟件上的應(yīng)用。

    這個(gè)是我們?cè)谠粕厦嫒ビ梦覀兊腛penOffice。

    我們可以看一個(gè)我們的演示,我們OpenOffice是如何從我們社交環(huán)境中去做一些信息的收集。這個(gè)演示是一個(gè)很簡(jiǎn)單的場(chǎng)景,我在做一個(gè)報(bào)告稿,我希望從我的社交網(wǎng)絡(luò)里面收集一些意見,在以前,這些方案可能我把這個(gè)文件文檔通過郵件發(fā)送給其他人,讓其別人通過郵件反饋回來,現(xiàn)在在我們這種模式下,我們可以看一看,我們是如何工作的。比如就這一頁的頁面,我想去收集大家的反饋,我可以通過我們右側(cè)工具插件,疾速把這個(gè)頁面,直接發(fā)布到我的社交網(wǎng)站上去,當(dāng)我發(fā)布好以后在我的網(wǎng)站中相關(guān)的關(guān)注我的人,就可以看到,他們就可以倏地的給我一個(gè)回復(fù),這里面我用的是IBM的一個(gè)產(chǎn)品,其實(shí)這種機(jī)制我們完全可以應(yīng)用發(fā)到Facebook,新浪微博上去。在這里面我的共事,或者是我的經(jīng)理們看到了我發(fā)布的這個(gè)頁面,大家給我一些修改看法,他直接就在這個(gè)網(wǎng)頁中去操作,把他的意見寫好,寫好以后,我是不需要再登陸我的網(wǎng)站中來,我直接就在文檔編譯器里面直接可以看到別人給我的意見,這個(gè)時(shí)候我根據(jù)這個(gè)意見就可以做出快捷修改。

    大家看看這種工作方式,我們可以看到看法,改好當(dāng)前可以持續(xù)做其他的事情。同樣的場(chǎng)景,在當(dāng)今Server這種環(huán)境中,通過我們擴(kuò)展的方式很快就到達(dá)了,如果我沒有這樣的Social的集成,我們會(huì)發(fā)現(xiàn)我們要走一段很長(zhǎng)的路,而且等候的時(shí)間也是沒有那么有效力。

    所以說大家看到,我們OpenOffice并不僅是文檔編譯器,也是一個(gè)擴(kuò)大應(yīng)用平臺(tái),那么這個(gè)平臺(tái)可能給我們提供各種的擴(kuò)展才能,這里我演示的是跟Social做的一個(gè)集成。其實(shí)我們可以做其余的跟文檔存儲(chǔ),包含我們百度的文庫,還有跟其他云上數(shù)據(jù)的存儲(chǔ)都可以以這種去關(guān)系起來。

    我們是用了我們的開發(fā)工具,這個(gè)開發(fā)據(jù)也就是一個(gè)開源的工具,大家都可以在社區(qū)網(wǎng)站中獲取到,我們運(yùn)用了一個(gè)開發(fā)接口,這個(gè)接口也是大家可以隨便獲取到的,UNO的接口,社區(qū)這邊有很好的開發(fā)手冊(cè),我們開發(fā)人員很愿意幫助大家回答一些問題。

    總體來說這個(gè)就是我們剛才講到的,如何在我們的社區(qū)里面,用OpenOffice做一些云跟Social上的一些集成,這里面我再一次號(hào)令大家來加入我們OpenOffice這個(gè)大家庭,你在里面可以去貢獻(xiàn)自己的力氣,也可以基于OpenOffice這個(gè)平臺(tái)去構(gòu)建你自己的應(yīng)用和自己的解決方案,甚至你可以拿到OpenOffice的代碼,然后做出自己的修改。大家如果感興趣的話,所有的事情都可以通過我們的郵件列表獲取到,可能我們的技術(shù)人員這塊,從我們的網(wǎng)站開始是一個(gè)比較好的地方,謝謝大家!

    主持人十分感激Apache的OpenOffice,OpenOffice從以前的SUN緩緩走向社區(qū)之后,后來又從Oracle轉(zhuǎn)到獨(dú)破的Apache社區(qū),也是閱歷了長(zhǎng)期而艱難的進(jìn)程,一個(gè)產(chǎn)品如果要讓它有更強(qiáng)的性命力,可能這種NGO的模式合作方法,可能會(huì)讓它更長(zhǎng)期,這是長(zhǎng)期大家奉獻(xiàn)社區(qū)的一個(gè)常識(shí)的產(chǎn)品,如果只是貿(mào)易行動(dòng)的操作,把它廢掉的話,實(shí)際上是很惋惜的事件。我們請(qǐng)Raymie談一談Hadoop新的Resource Manager的產(chǎn)品。

    Raymie英文

    主持人非常感謝Raymie今天下晝給我們帶來出色的報(bào)告。接下來有請(qǐng)來自VMware杜君平來講講Hadoop的Virtuallzation。

    我們今天大會(huì)主題也是云計(jì)算大會(huì),云也是屬于今天最時(shí)興的一個(gè)詞,上到國(guó)度總理,下到布衣庶民,大家多多少少對(duì)云計(jì)算都有一些懂得,這里面有一些泡沫的成分在里面。首先我們以為云計(jì)算能夠簡(jiǎn)化企業(yè)的IT運(yùn)維本錢,第二因?yàn)樗鼫p少了很多企業(yè)對(duì)硬件的需求,通過虛擬化可以減少很多硬件的支出,治理的支出,包括能源的支出。它可以非常迅速為企業(yè)提供IT服務(wù),所以我們現(xiàn)在生涯在一個(gè)比較好的云計(jì)算的時(shí)代。

    那么對(duì)于大數(shù)據(jù)或者說企業(yè)的數(shù)據(jù)分析而言,企業(yè)有不同對(duì)數(shù)據(jù)的需求,有些是傳統(tǒng)的數(shù)據(jù)的需求,還有需要Hadoop這樣的大數(shù)據(jù)平臺(tái),我們眼中的IT不盼望它是一個(gè)一個(gè)孤島,企業(yè)有不同的人在經(jīng)營(yíng)不同的系統(tǒng),可能他們?cè)谙旅鏁?huì)是一個(gè)統(tǒng)一的,上面有不同的有Hadoop的等等,他們可以做很好的共享。

    對(duì)大數(shù)據(jù)而言,咱們盼望通過虛構(gòu)化來更好的做全部大數(shù)據(jù)平臺(tái)。我們目的有多少點(diǎn),首先我們?cè)谕坏脑破脚_(tái)上面更好的,依據(jù)你的需要,來供給數(shù)據(jù)處置的平臺(tái)跟盤算才能的集群。而后我們興許你在統(tǒng)一的云平臺(tái)之上,把不同的運(yùn)用進(jìn)行混雜,由于有些運(yùn)用是CPU的,有一些利用是內(nèi)存的,不同的應(yīng)用對(duì)資源有不同的需要,我們假如可能在同一的平臺(tái)上把這些利用很好的混雜起來,那么咱們能夠進(jìn)步全部資源的應(yīng)用率。

    后面對(duì)于大數(shù)據(jù)平臺(tái)而言,放到一個(gè)云平臺(tái),或者一個(gè)虛擬化平臺(tái)上,會(huì)不會(huì)呈現(xiàn)任何的水土不服呢,因?yàn)樗谠粕厦嬗泻芏嗪莒`巧的這種部署的方式,這種部署方式,包括你的數(shù)據(jù)避免策略,可能都需要調(diào)整,我們需要一些額定去處理這些事情。

    總體而言有了云計(jì)算,有了虛擬化,我們可以讓Hadoop能夠做到彈性的伸縮,能夠做到比較容易的達(dá)到高可用性。有更好的管理和隔離,對(duì)于云計(jì)算也好,企業(yè)的不同數(shù)據(jù)中心,或者數(shù)據(jù)應(yīng)用是非常重要的。

    所以我們要做最好的虛擬化的平臺(tái),我們都做了哪些事?首先去年我們發(fā)了一個(gè)白皮書,是Hadoop在虛擬化平臺(tái)上性能的剖析,可能大家也會(huì)比較關(guān)懷這個(gè)問題,待會(huì)我會(huì)簡(jiǎn)單介紹一下。另外我們踴躍參加到Apache的Hadoop社區(qū)里面,為這個(gè)社區(qū)做一些貢獻(xiàn),私有云,讓Hadoop在虛擬化和云計(jì)算的平臺(tái)上去經(jīng)營(yíng)得更好。也就是我今天主要要介紹的內(nèi)容。我們還有一些項(xiàng)目,我們簡(jiǎn)化程序的開發(fā),主要是這三部分的內(nèi)容。

    這是一個(gè)數(shù)據(jù),我們?cè)赩irtuallzation5上面經(jīng)由很好的調(diào)試之后,我們發(fā)明跟其他的應(yīng)用一樣,基礎(chǔ)上在虛擬化或者云計(jì)算平臺(tái)上運(yùn)行Hadoop,大數(shù)據(jù)這樣的平臺(tái),根本上他的機(jī)能后果也是蠻好的,大略在5%到10%的性能喪失率。我們?cè)谔幚淼倪^程中,我們想了好幾個(gè)計(jì)劃,首先我們或許是在十幾個(gè)Server里面,把虛擬化之前和虛構(gòu)化之后做了比較,每個(gè)結(jié)點(diǎn)有幾個(gè)破綻,我們做了各種各樣的對(duì)照。

    下面介紹一下我們的Hadoop Virtuallzation,Hadoop在虛擬化的平臺(tái)上面做的一些擴(kuò)展和優(yōu)化。我們這個(gè)項(xiàng)目主要是做一些改良的工作。我們這個(gè)項(xiàng)目最后的產(chǎn)出提交到Hadoop,被用戶所接收,然后達(dá)到更好的優(yōu)化的效果。同時(shí)會(huì)跟社區(qū)里面的人做一些配合,虛擬化安全。這個(gè)HVE主要是幾項(xiàng)工作,我們要支持code base,第二在云的環(huán)境下,這些資源,操作系統(tǒng)里看到的資源并不是你實(shí)際可以取得的資源,這也是我們需要考慮的。我們現(xiàn)在想做的事情是,我們?cè)谕瑯拥奈锢硌b備上,我們把虛擬結(jié)點(diǎn),計(jì)算結(jié)點(diǎn)和數(shù)據(jù)結(jié)點(diǎn)離開。我今天主要會(huì)討論多層的網(wǎng)絡(luò)結(jié)構(gòu),以及數(shù)據(jù)和計(jì)算結(jié)點(diǎn)分別。

    剛才說到Hadoop,Hadoop是三層,一個(gè)是data center,一個(gè)是rack,一個(gè)是host,在云計(jì)算或者說在虛擬化的平臺(tái)里面有更多的不同的部署方式,如果你考慮很多應(yīng)用共享的時(shí)候,你可能會(huì)把這樣的機(jī)器虛擬化之后分成多個(gè)機(jī)器,或者說你的企業(yè)里面需要多個(gè)Hadoop的結(jié)點(diǎn),但是這多個(gè)結(jié)點(diǎn)你不知道什么時(shí)候這些結(jié)點(diǎn)到波峰,什么時(shí)候到低谷,你想把他們放在同樣一個(gè)比較大的集群里面,但是這些集群可以隨著你應(yīng)用的需要,可以擴(kuò)展或者壓縮,根據(jù)需求不同,你的部署方式確定也不一樣。

    第一種就是最基礎(chǔ)的,就是一個(gè)VM,這是跟物理環(huán)境沒什么差別,第二個(gè)可能會(huì)有多個(gè)結(jié)點(diǎn),現(xiàn)在手頭里四個(gè),但是你可能做一些測(cè)試,其他的工作,可能出來十二個(gè),十六個(gè)甚至更多的結(jié)點(diǎn)。第三個(gè)就是我說到數(shù)據(jù)的分別。第四個(gè)你可能還會(huì)有多個(gè)data note,來滿意你的需要。這種情況下,昨天的Hadoop就不能滿意你的需求了,現(xiàn)在我們引入了這個(gè)node group這一層。現(xiàn)在我們把所有數(shù)據(jù)相關(guān)的部分我們都做了一個(gè)處理,加上了這些我們的,Hadoop還是在物理環(huán)境中狀態(tài)很好,放到云平臺(tái)或者虛擬化平臺(tái)之中就可以做一個(gè)不同的英文。

    做一個(gè)簡(jiǎn)單的介紹,設(shè)備這是在副本的放置策略上,2和3落在統(tǒng)一個(gè)VM上,現(xiàn)在就不會(huì)把兩個(gè)放在同一個(gè)node上。這個(gè)是對(duì)于副本挑選的策略的拓展,他會(huì)去選統(tǒng)一個(gè)英文。

    對(duì)于均衡器而言,希望副本的放置仍舊是牢靠的,依然要知足之前的這些規(guī)矩,還要保證這些副本是完全達(dá)到牢靠性要求的,所以我們也設(shè)計(jì)了很多這方面的邏輯。

    對(duì)于這個(gè)義務(wù)的放置也是同樣的情理,我們抉擇,尤其是對(duì)于數(shù)據(jù)和計(jì)算分離結(jié)點(diǎn)的情況下,這一層顯得更加重要,因?yàn)槿绻谥暗挠脩魜碚f,當(dāng)他發(fā)現(xiàn)這個(gè)結(jié)點(diǎn)沒有被數(shù)據(jù)node看到的時(shí)候,他會(huì)認(rèn)為這個(gè)數(shù)據(jù)是不被認(rèn)識(shí)的,我們的工作讓這個(gè)計(jì)算更加貼近數(shù)據(jù)。讓Hadoop的資源更有彈性,包括對(duì)Hadoop本身,可能會(huì)在今后陸陸續(xù)續(xù)增加到社區(qū)里面。

    下面請(qǐng)我的共事給大家介紹一下Serengeti,這是一個(gè)獨(dú)立的,開源的一個(gè)項(xiàng)目。

    嘉賓我們的Serengeti是一個(gè)完全Opensource的,我們這個(gè)項(xiàng)目每三個(gè)月會(huì)發(fā)布一個(gè)小的結(jié)果。這里可以看到有幾個(gè)特點(diǎn),數(shù)據(jù)存儲(chǔ),很方便去部署,很方便去管理Hadoop Project。

    我們畸形的物理機(jī)上面,直接搬到虛擬機(jī)上去運(yùn)行就好了,沒有什么特殊的地方,所以在虛擬化的平臺(tái)上有一個(gè)特色,就是VM這些東西非常的機(jī)動(dòng)。這是我們大概一個(gè)從Hadoop的運(yùn)行模式上,可能會(huì)做到這么一種模式。

    英文。

    這里面我們提到擴(kuò)展性,比如一個(gè)很簡(jiǎn)單的…,特定的…,我們?cè)谝粋(gè)…里面描寫了我們的…長(zhǎng)什么樣子,我們很輕易去…其中一個(gè)我們稱為…,比如我們…有五個(gè),我們的…有五個(gè),我可以說我們變成十個(gè),另外五個(gè)VMware就是…,然后…到…里面。

    比如我們要運(yùn)行Hadoop我們天然會(huì)想到,我們?cè)趺幢WC關(guān)鍵的應(yīng)用不會(huì)對(duì)集群有影響。在某一個(gè)特定的時(shí)候,可以動(dòng)態(tài)的去英文,做到真正的癥結(jié)的應(yīng)用不會(huì)被Hadoop占用。

    這里其實(shí)更多的就是到了英文,主要從三個(gè)方面來考慮,幫助我們?nèi)ゲ渴餒adoop的時(shí)候,我們要去…變得非常簡(jiǎn)單,包括開始怎么去部署一個(gè)新的集群,在運(yùn)行過程里面怎么…。我們讓Hadoop運(yùn)行在…上的時(shí)候,這邊可以看到確切有很多實(shí)際的利益在里面。我們知道在正常Hadoop集群里面,單點(diǎn)故障,我們可以在Vsphere,一旦有問題可以敏捷在另外一個(gè)。恰是我們從這三個(gè)主要方面能夠來開發(fā)我們的產(chǎn)品,我們會(huì)嚴(yán)密的應(yīng)用Vsphere的功能,我們會(huì)跟它有更嚴(yán)密的聯(lián)合,來幫助在云里面怎么樣去應(yīng)用。

    這是我們HVE的工作,包括Project Serengeti,如果你有Vsphere的環(huán)境,可以直接部署,創(chuàng)建Hadoop的集群,歡迎大家使用。大家如果有針對(duì),針對(duì)HVE,或者針對(duì)Vsphere。

    提問…

    嘉賓這是一個(gè)很好的問題,我們知道其切實(shí)虛擬化環(huán)境里面主要包含兩部分工作,一個(gè)是把node預(yù)備好,另一部分是把Source建起來,在阿帕奇已經(jīng)在做,我們更多重點(diǎn)在我們的Vsphere這個(gè)平臺(tái)上去部署集群。

    提問…

    嘉賓文件以64兆為單位,你有多少個(gè)副本。

    提問其實(shí)我對(duì)開源是剛接觸不是很清晰,然而我不知道剛介紹的時(shí)候你沒有提到保險(xiǎn)性這局部,你是怎么做的?

    嘉賓Hadoop引入了一套保險(xiǎn)人人系統(tǒng),這個(gè)文件系統(tǒng)有不同的用戶,還是有一些其他的問題,比如英文,比較復(fù)雜,尤其是數(shù)據(jù)中央內(nèi)部,可能不會(huì)去開啟所有認(rèn)證的工作。

    提問既然他是一個(gè)開放的東西,是不是表示它里面如果有歹意的軟件,開發(fā)者就可以放一些問題的東西在里頭?

    嘉賓你提交代碼的時(shí)候會(huì)有嚴(yán)厲的審查程序,尤其是對(duì)Hadoop來說,他的數(shù)目是很有限的,我們會(huì)發(fā)現(xiàn)我們中國(guó)現(xiàn)在工作在正八時(shí)區(qū)的還沒有一個(gè),你需要告知所有社區(qū)里很多的人,這個(gè)是創(chuàng)意是友善的,是給人帶來好處的,不是你任意寫代碼就可以提交的。

    提問…

    嘉賓Vsphere上面有這個(gè)動(dòng)作做…,我們會(huì)讓它去…的功能,我們不知道這個(gè)VMware是不是讓它做遷移,剩下的這些資源還是Vsphere起作用的。謝謝大家!

    孫振南我今天帶來的標(biāo)題是CloudStack,今天我?guī)淼氖前⑴疗媪硗庖粋(gè)Opensource IaaS的CloudStack。我是趨勢(shì)科技,同時(shí)也是阿帕奇的,推事也推進(jìn)CloudStack在中國(guó)的發(fā)展。

    今天我主要講兩部分,第一代著大家把CloudStack略微整體說一下,另外我會(huì)介紹一下現(xiàn)在CloudStack在中國(guó)社區(qū)的發(fā)展。

    在開始之前,在講什么是CloudStack之前,首先我認(rèn)為有必要把CloudStack整個(gè)的情況給大家交代一下。

    CloudStack這個(gè)東西是在2008年由VMOPS這家公司開發(fā)的,它就是開發(fā)CloudStack。然后在2010年5月份,VMOPS重新命名CloudStackc769686b2e81f1c70bec1eddef8c,2.0版本也發(fā)布了,緊接著去年7月份,這時(shí)候產(chǎn)生一件事情,就是思杰把CloudStack收購(gòu)了,開發(fā)了3.0版本,思杰一直開發(fā)自己的CloudStack版本,今年4月份,思杰把CloudStack開源募捐給阿帕奇社區(qū)。10月份的時(shí)候有一件值得記憶的事情,CloudStack以社區(qū)的身份發(fā)布了自己的第一個(gè)版本,就是CloudStack4.0。然后在差未幾半個(gè)月前,拉斯維加斯第一次CloudStack大會(huì),在那邊舉行,這是整個(gè)的情況。

    什么是CloudStack,因?yàn)槲覀兘裉爝@個(gè)是云世界大會(huì),今天的主題也是開源云,CloudStack是什么?可以說它就是一個(gè)云平臺(tái)。這邊有一些簡(jiǎn)單CloudStack的特點(diǎn)。他支持多租戶,有平滑的伸縮性,當(dāng)然他也是開源的,現(xiàn)在是阿帕奇的許可CloudStack是低成本資源監(jiān)控的云平臺(tái),這里頭提兩個(gè),一個(gè)是資源,另外一個(gè)是云,對(duì)于云來說,我們都知道現(xiàn)在有公有云,私有云,混合云,還有其他的像社區(qū)云其他的東西。資源無非就是一些物理資源或者是一些虛擬資源,都逃不了CPU、內(nèi)存以及網(wǎng)絡(luò)這些資源。

    大家可以看右邊的這個(gè)圖,CloudStack是把你的物理資源進(jìn)行形象虛擬化,并且去管控,他自己自身提供了一個(gè)綜合管理的引擎。在上面它有完全的API的系統(tǒng),再上面就是對(duì)外提供一些UI,或者你自己整合你的資源。

    我們看一下這三種云,我們平時(shí)都在公有云、私有云、混合云,這三種云自己都有自己明顯的特點(diǎn)。我們先看一下公有云,大家都知道的,就是亞馬遜就是典范的公有云,是很勝利的,我們國(guó)內(nèi)也有一些,但是目前來說都是起步的,作為公有云有一些特點(diǎn)需要滿意,他要支持多租戶,要有自服務(wù),要平行的擴(kuò)展,并且是一種按需付費(fèi),你用多少掏多少錢,絕對(duì)來說成本需要把持到很低。

    我們?cè)倏醋钣疫叺倪@個(gè)是私有云,私有云跟公有云有很明顯的差異,簡(jiǎn)單說私有云普通是在企業(yè)或者是IT自己里面用的,他的資源也是自己專屬的。個(gè)別一個(gè)公司如果自己的IT要上私有云的話,當(dāng)然他會(huì)有自己專屬的資源,有自己專屬的IT部分,完全隔離的網(wǎng)絡(luò),安全性這些都是需要考慮的。

    混合云實(shí)際上介于這兩種云之間,混合云最主要的就是像一些企業(yè),把自己的IT托管出來,托管也有一定的要求,最主要的就是可能需要專屬的為企業(yè)籌備的服務(wù)器,要簽署一定的SOA,到底到達(dá)幾個(gè)9,這個(gè)他會(huì)比較重視,這三種云如果自己要看一個(gè)云的話,哪種云比較適合,你可以參照這個(gè)特色,你自己感到要用哪些方面。這是給大家一個(gè)參照。

    今天CloudStack我或許會(huì)講這些內(nèi)容,首先這是比擬high level的圖。有多少個(gè)數(shù)據(jù)簡(jiǎn)略跟大家交代一下,這個(gè)圖最上面寫了一個(gè)Zone,可以理解成為數(shù)據(jù)中央,當(dāng)然這個(gè)不是完全等同的,下面會(huì)有一層pods可以懂得成機(jī)架這個(gè)概念,最下面是集群,CloudStack對(duì)集群有必定的請(qǐng)求,他請(qǐng)求集群內(nèi)部必需是一致的物理機(jī),便利在集群內(nèi)做一些遷徙,集群這一級(jí)應(yīng)當(dāng)是邏輯構(gòu)造里面比擬主要的一級(jí),然后集群下面就是詳細(xì)的主機(jī)?梢钥吹郊哼@一級(jí),還有就是你的主存儲(chǔ),也是以集群為邊界的,每一個(gè)集群實(shí)際上是需要共用他的主存儲(chǔ),如果已經(jīng)共享存儲(chǔ)的話。Secvondary,在整個(gè)資源域是共享的。

    這幾種資源都是很容易自在去組合,你可以在上面hypervison,VMWARE也可以用Server,或者Opensource,也可以用SUN,也可以用nfs。右邊是二級(jí)存儲(chǔ),目前來說支持兩個(gè),一個(gè)是傳統(tǒng)的nfs,CloudStack是相稱成熟了,它在國(guó)外,很多家公司用他,他有很多非常好的一些功能。

    我們?cè)賮砜匆幌翪loudStack最初的設(shè)計(jì),CloudStack剛開始并不是憑空出來了,他的設(shè)計(jì)起源于事實(shí),我們這邊做一個(gè)簡(jiǎn)單的比較,左邊是一個(gè)數(shù)據(jù)中心的架構(gòu),外面是你的門戶,通過三層核心,連到你的WELL,再下面是機(jī)架的意思,POD,橫向擴(kuò)開展來,這是典范的數(shù)據(jù)中心。我們有一個(gè)運(yùn)營(yíng)門戶,跟這邊OSS實(shí)際上是類比相同的,F(xiàn)在不同的地方在機(jī)架這一層又做了一層邏輯劃分,在機(jī)架下面,一個(gè)機(jī)架可以包含多個(gè)集群,集群下面才是你的主機(jī),這樣劃分出來以后,一個(gè)zone就可以針對(duì)數(shù)據(jù)中心,可以是很大范疇的擴(kuò)展。還有一點(diǎn)不一樣,那邊的Secondary storyge,他要求盤比較大,CloudStack最初的研發(fā)也是認(rèn)識(shí)到這一點(diǎn),把它對(duì)存儲(chǔ)的需求設(shè)計(jì)成主存儲(chǔ)跟二級(jí)存儲(chǔ)。

    這個(gè)就是更貼近事實(shí)的,就是為這個(gè)場(chǎng)景設(shè)計(jì)的,可以在地區(qū)性有很大的跨度,一個(gè)云環(huán)境,可能有些公司好幾個(gè)地方都有辦事地點(diǎn),可以在云環(huán)境下部署。比如我在北京有我的數(shù)據(jù)中心,我會(huì)把一個(gè)資源域放在這,我的Server都在這里放著,我在有兩個(gè)ZONE,在有一個(gè),這是很彈性的地區(qū)擴(kuò)展,CloudStack是完全支持的。

    這邊是一些簡(jiǎn)單的數(shù)據(jù),就是CloudStack目前擴(kuò)展性到底是什么狀況,我剛才提到management Server,一個(gè)管理服務(wù)器結(jié)點(diǎn),目前可以支持到一萬個(gè)左右的資源,當(dāng)然這的資源不光是你的物理主機(jī),也包括其他的主存儲(chǔ),二級(jí)存儲(chǔ),以及你的交流機(jī),這些都是你的資源,它可以一個(gè)管理服務(wù)器結(jié)點(diǎn)可以支持到一萬個(gè),對(duì)于大家部署自己私有云是足夠用的,并且有些公有云差未幾沒達(dá)到這個(gè)規(guī)模。

    它可以很彈性的拓展,它在管理服務(wù)器結(jié)點(diǎn)前面,如果訪問量很大,你可以加多臺(tái)管理服務(wù)器,前面加負(fù)載平衡就可以完全做到。如果大家能關(guān)注一下的話,在阿帕奇CloudStack這邊有一個(gè)測(cè)試,大概用四個(gè)管理服務(wù)器加負(fù)載平衡,可以支持三萬個(gè)物理的資源,三萬個(gè)虛機(jī)的規(guī)模。當(dāng)然因?yàn)檫@是一種模仿。目前這塊還有很大的改進(jìn)空間。比如要完整的scalesout,可能你要解決一些他的POST的機(jī)制,通過Scalesout的計(jì)算一個(gè)管理服務(wù)器可以支持到兩萬個(gè)resources。

    在云的時(shí)代,假設(shè)任何東西都不可靠,CloudStack在這種可靠性方面到底有哪些自己的特點(diǎn)呢?首先就是CloudStack它有很多主動(dòng)或者是被動(dòng)的方式,自動(dòng)的方式就是,比如我做動(dòng)態(tài)的遷徙,比如我把主機(jī)進(jìn)行人為維護(hù),在可預(yù)知的時(shí)候,比如我的硬盤破壞了,我的內(nèi)存需要增長(zhǎng)一些,在這種情況下實(shí)際上是主動(dòng)的行動(dòng),把系統(tǒng)某一個(gè)resources進(jìn)行維護(hù),還有一個(gè)是被動(dòng),這種情況下都是不可預(yù)知的,大多數(shù)都是這種情況,在這種情況下我們需要做哪些事情,就是CloudStack提供了叫HA的機(jī)制,高可靠性的機(jī)制,你只有把虛機(jī)啟動(dòng)之前讓他用這個(gè)服務(wù)把HA給勾上,這個(gè)主機(jī)壞掉了,或者這個(gè)虛機(jī)Server有問題,可以自動(dòng)把它接起來。

    CloudStack4.0宣布當(dāng)前加了一個(gè)新的功效,有一個(gè)主機(jī)專門針對(duì)HA,畸形上面是空的,假如有些虛機(jī)做HA的話,做HA的虛機(jī)都會(huì)移到這個(gè)上面,從自動(dòng)跟被動(dòng)方面都供給了對(duì)HA方面的支撐。

    我們接下來看一下,為了完全性,我會(huì)把所有的技術(shù)都會(huì)提一下。KVM在中國(guó)比較火,固然官方?jīng)]有說要支持12.0,但實(shí)際上也是支持的。

    大家可以看一下他們自己分辨的虛機(jī)格式都不太一樣,對(duì)是否支持超配這種概念可以看一下,像存儲(chǔ)的超配,這并不是說所有的Hypervison對(duì)于所有的存儲(chǔ)都支持的。

    Storage,一個(gè)是主存儲(chǔ),一個(gè)是二級(jí)存儲(chǔ),主存儲(chǔ)對(duì)于他的LPS要求都很高,二級(jí)存儲(chǔ)就是剛才講的,它是一種一次寫屢次讀的存儲(chǔ),對(duì)于這種來說實(shí)際上它的LPS不需要那么高,但是他的存儲(chǔ)容量比較大,模板、SO、快招都需要占用大批的存儲(chǔ),意識(shí)到這個(gè)特點(diǎn),所以CloudStack把存儲(chǔ)分成了這兩種不同的情況,有不同的用處。

    下面簡(jiǎn)單介紹一下Network,我把CloudStack支持的兩種資源域簡(jiǎn)單提一下,第一種就是基本網(wǎng)絡(luò),基本網(wǎng)絡(luò)可以以為在CloudStack的根本資源域,建立一個(gè)基礎(chǔ)資源域的時(shí)候用的這種網(wǎng)絡(luò)。兩種不同色彩是指兩個(gè)不同用戶或者兩個(gè)不同帳戶下面的用戶虛機(jī),他們自己調(diào)配自己的IP,通過網(wǎng)絡(luò)里的三層交流進(jìn)行互聯(lián)互通,或者設(shè)置一些規(guī)矩。前面加一個(gè)防火墻,通過平安組的方式進(jìn)行隔離的,這種是比較簡(jiǎn)單的。

    還有一種是高等資源域里,這就比較復(fù)雜了,這里對(duì)于虛擬路由器,每個(gè)帳戶都有自己?jiǎn)为?dú)虛擬路由器,它負(fù)責(zé)很多的網(wǎng)絡(luò)功能,它的隔離是二層的隔離,也就是基于VLAN進(jìn)行隔離。兩個(gè)不同的客戶,它的虛擬機(jī),他的IP都是可以反復(fù)的,這是它的高等網(wǎng)絡(luò)。這是整個(gè)的,這里面有很多種不同的角色,不同的權(quán)限,最終用戶可能權(quán)限小一點(diǎn),另外也支持EC2的API,在4.0里面,3.0也支持,但4.0里面更進(jìn)一步了。我們跟管理服務(wù)器下面用的是My SQL你可以自己加這個(gè)My SQL的集群,對(duì)于Oracle的話是用…,沒有開源之前,這些客戶都不是開源的,現(xiàn)在這部分客戶都是開源的,并且希望更多的廠家進(jìn)來,把自己支持的設(shè)備增添進(jìn)來。下面就是一些它的系統(tǒng)虛擬機(jī)。

    因?yàn)槲椰F(xiàn)在主要在中國(guó)推進(jìn)CloudStack中國(guó)社區(qū),我下面花點(diǎn)時(shí)間給大家介紹一下阿帕奇CloudStack這個(gè)社區(qū),以及現(xiàn)在在中國(guó)的狀態(tài),跟大家分享一下。

    首先阿帕奇CloudStack,現(xiàn)在仍是一個(gè)孵化器的項(xiàng)目,它不是一個(gè)正式的項(xiàng)目,一旦成為正式項(xiàng)目,一定能成為TOP1。他里頭有四種角色,你怎么參加到這個(gè)阿帕奇CloudStack社區(qū),可以以四種身份加進(jìn)來,可以作為用戶,可以是一個(gè)英文,或者…進(jìn)來,作為用戶的話,你是應(yīng)用可以提一些應(yīng)用倡議,都算是對(duì)社區(qū)做貢獻(xiàn),如果是做一個(gè)開發(fā)者不是狹義的寫代碼,你在上面贊助答復(fù)問題,輔助做一些文檔工作,這些事件都是做奉獻(xiàn)。

    你要是想成為committer首先必須去做貢獻(xiàn),讓大家看到你在這上面有自己的貢獻(xiàn)才行。另外一個(gè)是叫mentor,這個(gè)角色對(duì)阿帕奇整個(gè)流程是非常了解的,可以帶到這個(gè)項(xiàng)目上面,盡快的按照阿帕奇的流程來做事情。如果大家想知道這個(gè)項(xiàng)目,有一些門路,第一個(gè)就是阿帕奇的網(wǎng)站,有一些東西在里面,大家可以看。

    這個(gè)就是阿帕奇的Mailing Lists,這里我想強(qiáng)調(diào)的是這個(gè)郵件組,像CloudStack這邊對(duì)中國(guó)還是蠻器重的,有專門的郵件組在這里,大家可以訂閱一下,現(xiàn)在在里面討論也長(zhǎng)短常熱鬧的。很多人用CloudStack提問題,在上面提的總能很快被解決,郵件組是個(gè)好東西。

    下面看一下CloudStack在中國(guó)社區(qū)的發(fā)展過程,這邊我提的就是我們最近的線下活動(dòng),從今年5月份到現(xiàn)在,包括我們下周要去進(jìn)行一次沙龍活動(dòng),我們規(guī)模每次也不大,5080人,大多數(shù)來的人都是開發(fā)者或者USER。上面是一些資源,下面是我們中國(guó)區(qū)的用戶對(duì)CloudStack做的一些貢獻(xiàn)。首先我們這邊有一些committer在里面,負(fù)責(zé)文檔,會(huì)做committer會(huì)做一些翻譯,翻譯是中國(guó)區(qū)的用戶在做。

    下面有幾頁很快給大家過一下,就是INDEX,這是我們CloudStack網(wǎng)站訪問的情況,我們用谷歌簡(jiǎn)單剖析一下,當(dāng)然我們是以技巧文章為主,然后會(huì)發(fā)一些運(yùn)動(dòng)的信息,技巧文章現(xiàn)在沒有多少,大概四五十篇,現(xiàn)在也帶來了一些正面的反饋,我們可以簡(jiǎn)單看一下,目前集中在北京、等處所拜訪人數(shù)比較集中,我們前面提到,我們做的沙龍運(yùn)動(dòng),目前主要集中在北京、。

    這是我們的考察問卷收集上來的情況,對(duì)于CloudStack來說目前還是屬于比較新的階段,各個(gè)方面大家都想去了解,市場(chǎng)的裝置部署,開發(fā),系統(tǒng)運(yùn)維方面占的比例差不多,大家都想了解。

    這是大家用的虛擬化平臺(tái),或者叫虛擬化軟件的一些狀態(tài),前三甲基本上就是VMware、Server,跟KM,F(xiàn)在材料比較疏散,可能需要更好的唱工作。我們激勵(lì)更多人加入這個(gè)社區(qū),實(shí)現(xiàn)雙贏。我們現(xiàn)在接下來還是會(huì)做CloudStack相干的一些分享,不論是技術(shù)方面,還是安排,錄一些VIDEO都是很歡送的,我們現(xiàn)在著手做一個(gè)演示的工作,大家可以上去玩一下,虛擬桌面,當(dāng)然需要一定的資源和時(shí)間,F(xiàn)在CloudStack也需要更多的VENDOR加入進(jìn)來。

    提問有人說CloudStack適合中小型的部署,而Openstack適合比較大型的部署結(jié)構(gòu),你對(duì)這個(gè)有什么評(píng)估嗎?

    嘉賓舉個(gè)簡(jiǎn)單的例子,Openstack我跟他們有過交換,他們目前最大的部署范圍,應(yīng)該是…有數(shù)千臺(tái)的規(guī)模,但現(xiàn)在CloudStack目前范圍有四萬臺(tái),這個(gè)基本不是問題,CloudStack是合適你做公有云,也合適做私有云,在海內(nèi)可能私有云會(huì)占絕大多數(shù)。CloudStack自己自身它現(xiàn)在成熟度跟它的擴(kuò)展性足以支持現(xiàn)在我們遇到的云平臺(tái)。

    提問CloudStack是用JAVA云開發(fā)的嗎?

    嘉賓對(duì),主要就是JAVA。

    發(fā)問有付費(fèi)版和免費(fèi)版嗎?

    嘉賓你可以完全用阿帕奇CloudStack版本,不用考慮任何付費(fèi),因?yàn)榘⑴疗鍸I…決議了,你不需要出任何用度可以拿下來部署,你碰到問題去反饋只能是通過社區(qū)渠道,但是你可以用其他基于阿帕奇CloudStack,有很多商業(yè)公司有自己的版本,你要是想后續(xù)的支持就要找詳細(xì)的基于CloudStack開發(fā)的商業(yè)版本去做。

    提問它對(duì)Web…支持的配置方面,如果只是修正文件參數(shù)可以實(shí)現(xiàn)嗎?

    嘉賓因?yàn)榻裉鞗]有帶來那個(gè)演示,如果要支持VM集群的,你必須建一個(gè)數(shù)據(jù)中央,下面再有…,這個(gè)數(shù)據(jù)核心的名字,以及你的用戶名密碼組合起來,可以把這些信息提供應(yīng)CloudStack,整個(gè)在CloudStack管理平臺(tái)上面體現(xiàn)出來,很便利的。

    提問CloudStack,實(shí)際上它支持的硬件,還有剛才講的數(shù)據(jù)庫,DATA…有什么制約。

    嘉賓這邊的限度主要體現(xiàn)在hypervison,你想看看這個(gè)硬件是不是支持你就要翻開…Server他們的硬件兼容列表去看一下,hypervison只能在哪幾個(gè)平臺(tái)上做測(cè)試,My SQL也可以用,詳細(xì)怎么用,是數(shù)據(jù)庫方面的事情。

    發(fā)問當(dāng)初好比說Oracle,My SQL可以嗎?

    嘉賓這個(gè)貨色現(xiàn)在需求沒有那么顯明,現(xiàn)在我們只是支持My SQL,由于它就是傳統(tǒng)的是可以實(shí)現(xiàn)的,要支撐其余的數(shù)據(jù)庫也是很輕易的,只是現(xiàn)在My SQL不論從效力以及穩(wěn)固性都足夠,并且My SQL,沒有默認(rèn)在這個(gè)里面,需要本人獨(dú)自去實(shí)現(xiàn)。

    我今天講了這么多,所有的代碼都是在阿帕奇CloudStack容許的情況下。現(xiàn)在VMware不是阿帕奇的許可,如果你這邊要用的話得你自己加進(jìn)去。

    提問有一塊存儲(chǔ)嗎?

    嘉賓他的主存儲(chǔ)或者二級(jí)存儲(chǔ)支持不支持…,他下面用的LVM都是…的支持,實(shí)際上是這個(gè)存儲(chǔ)本身支不支持這種協(xié)定或者怎么樣。

    提問…

    嘉賓你提到的是它里面的幾個(gè)系統(tǒng)虛擬機(jī),幾個(gè)系統(tǒng)虛擬機(jī),目前有一些是有點(diǎn)問題了,比如說它的虛擬路由器,用的過程中,發(fā)明它無奈進(jìn)行關(guān)機(jī)相似的操作,現(xiàn)在社區(qū)里面有一種聲音探討,接下來可能會(huì)考慮centerOS,依附于一個(gè)是OS,另外一個(gè)是安排給你整個(gè)的硬件環(huán)境,實(shí)際上是你的整個(gè)架構(gòu)和網(wǎng)絡(luò)環(huán)境上的問題。

    提問現(xiàn)在比如我的APServer跟我的數(shù)據(jù)中央要離開,有一個(gè)在北京,有一個(gè)在,APServer在北京,數(shù)據(jù)中心在,有這樣的部署嗎?

    嘉賓因?yàn)槟銈円遄?hellip;是不是足夠,個(gè)別情形下,異地的這種情形都是以ZONE為邊界。

    提問中國(guó)現(xiàn)在有哪些支持開源的版本,還有哪些商業(yè)公司支持這種商業(yè)版?

    嘉賓開源的這個(gè)版本大家是都能用,但是商業(yè)版本…,昨天那個(gè)會(huì)也發(fā)布了5.0的版本,解決了穩(wěn)固性。在國(guó)內(nèi)主要虛擬VDI的這個(gè)方案。

    提問CloudStack有什么毛病或者技術(shù)難點(diǎn)?沒有解決的問題能不能說一下。

    嘉賓目前來講CloudStack在幾個(gè)云平臺(tái)上算是比較成熟的,有一些社區(qū)里去看有兩百多個(gè)過錯(cuò)要解決,如果你其他模塊要支持的話,最大問題就是允許的兼容性,有的時(shí)候還不能滿意,這是開發(fā)實(shí)際過程中的一些問題。詳細(xì)你說它目前實(shí)際上使用的過程中,CloudStack也好,可能商用的時(shí)候,直接用CloudStack版本,你得到的技術(shù)支持沒有那么強(qiáng)。但碰到問題你可能很難解決,你可能要追求一些貿(mào)易版本的支持。

    提問各個(gè)模塊有沒有什么缺點(diǎn),比如剛才網(wǎng)絡(luò)模塊,存儲(chǔ)模塊?

    嘉賓現(xiàn)在比較大的問題在4.1里可能會(huì)做,因?yàn)楝F(xiàn)在CloudStack它的模式是一種緊偶合的模式,每一層之間都是緊巧合,對(duì)于已經(jīng)熟習(xí)的人開發(fā)是很容易的,但是對(duì)于新的人進(jìn)來開發(fā)沒有那么容易,4.0已經(jīng)發(fā)布了,4.1的時(shí)候會(huì)做比較大的動(dòng)作,會(huì)把他的緊偶合拆一下,可能各個(gè)模塊之間會(huì)更加的API化,模塊化去操作,很方便,要加一個(gè)模塊會(huì)更加方便。

    提問現(xiàn)在市場(chǎng)上的各種模塊之間是比較緊巧合的。

    嘉賓對(duì),偶合還是比較高的。

    余慶大家下戰(zhàn)書好,大家還保持到現(xiàn)在辛勞了。我來自阿里巴巴,我現(xiàn)在做的工作也是阿帕奇的開源項(xiàng)目,叫xen Server,就是一個(gè)類似于英文,從它的性能上來講,包含價(jià)錢上來講,應(yīng)當(dāng)比S…更進(jìn)步一些,性能這方面會(huì)比S…更好一些。

    今天下晝的主題,主要都是云計(jì)算,和云平臺(tái),接下來我給大家介紹這塊,可以往云存儲(chǔ)這塊去靠,但是其實(shí)我這個(gè)可能沒這么大,和云存儲(chǔ)應(yīng)該沾邊。感謝組委會(huì),感謝陳先生給我這樣一個(gè)機(jī)遇,跟大家一起做交流和分享。

    DFS是我們做的一個(gè)開源的散布式文件系統(tǒng),是業(yè)余時(shí)光做的,其實(shí)這個(gè)開源系統(tǒng),當(dāng)初還不是阿帕奇的開源名目,想爭(zhēng)奪,后面讓它成為一個(gè)阿帕奇的開源名目。簡(jiǎn)略先容一下DFS是什么,它是一款開源的,輕量級(jí)的散布式文件系統(tǒng),其實(shí)這個(gè)文件系統(tǒng)不是特殊精深,不是通用的文件系統(tǒng),是一個(gè)專有的文件系統(tǒng),是相似于谷歌FS的文件系統(tǒng),已經(jīng)提供了C,JAVA和PHPAPI的這些都有。

    說他是類谷歌FS,其實(shí)照搬FS,F(xiàn)S的定位主要仍是針對(duì)分布式盤算來做的,我這個(gè)DFS定位主要是為互聯(lián)網(wǎng)應(yīng)用來定制的。其實(shí)就是大家看到的最后一條,DFS是為互聯(lián)網(wǎng)應(yīng)用量身訂作,重要是解決大容量存儲(chǔ)的問題,尋求高機(jī)能和高擴(kuò)大性。UNIX系統(tǒng)都是支持的。

    DFS不是通用文件系統(tǒng),把它看成是一個(gè)基于文件系統(tǒng)的Key value pair系統(tǒng)更適合,更貼切一些。大家有一個(gè)印象,他是一個(gè)類似于谷歌的DFS系統(tǒng),他提供的API很簡(jiǎn)單就是upload,download,APPENDER文件,還有就是SLAVE文件,一般的文件上傳之后是不能修改的,只能刪除,APP…文件才可以做修改操作。

    SLAVE文件重要是針對(duì)這種應(yīng)用處景,有一個(gè)主文件,有多個(gè)重文件場(chǎng)景的設(shè)計(jì),舉個(gè)例子,比方說像用戶的頭像,上傳的原圖可以叫主文件,互聯(lián)網(wǎng)應(yīng)用里面會(huì)做縮略圖,可能有多個(gè),而后實(shí)在都是從原文上轉(zhuǎn)換過來的,縮略圖就叫重文件,在文件的ID上面有接洽,然后別的就不接洽了。

    最后一個(gè)是文件附加屬性,后面不太提議用了,提一下就好了,文件附加屬性比如像的寬度、高度,有什么作者之類的屬性,DFS是支持的,他把這些文件的屬性再單個(gè)保留的做法,其實(shí)這個(gè)不太推舉用,就存在KV系統(tǒng)里面,甚至存在存儲(chǔ)里面就好了,不用用DFS的特性。

    DFS是從08年開始做的,做這個(gè)項(xiàng)目,當(dāng)時(shí)我還在中國(guó)雅虎,做這個(gè)項(xiàng)目其實(shí)是受公司項(xiàng)目的啟示,做了這個(gè)項(xiàng)目,當(dāng)時(shí)雅虎的相冊(cè),存儲(chǔ)方案是用確當(dāng)時(shí)雅虎有一套系統(tǒng),這個(gè)系統(tǒng)是基于集中式的存儲(chǔ)設(shè)備,當(dāng)時(shí)一臺(tái)設(shè)備差不多二百G的樣子,容量很高,但是相應(yīng)的成本也很高,一個(gè)是成本高,另外一個(gè),擴(kuò)容話就要加200T,這個(gè)平臺(tái)的成本太高了,雅虎自己做一個(gè)分布式文件系統(tǒng)。DFS的架構(gòu)從第一個(gè)版本定下來之后,后面就沒有變過,整體的架構(gòu)都是基于最早的設(shè)計(jì)來做的。

    我們?cè)倏匆幌逻@幾個(gè)大的版本之間,他們的特點(diǎn),V1的版本,其實(shí)就是因?yàn)樽钤缥視?huì)比較傳統(tǒng)的,一個(gè)懇求,一個(gè)線程的服務(wù)模式,支持的并發(fā)銜接是有限的。像這種模型普通能支持的銜接數(shù)是1K左右。

    V2對(duì)V1做了改良,采取libevent庫,磁盤讀寫這塊也是專門的線程,工作模式比V1更進(jìn)步和高效,這個(gè)模型支持連接數(shù)可以達(dá)到10K,很輕松的。

    V3其實(shí)就是一個(gè)特征,能夠把很多小文件合并存儲(chǔ)在一個(gè)大文件里面去,其實(shí)主要就是解決海量小文件的存儲(chǔ)問題,因?yàn)殄e(cuò)誤小文件存儲(chǔ)做優(yōu)化的話,檢索會(huì)非常慢的。

    V410月份發(fā)布,V4的特征并不是太多,他就是很簡(jiǎn)單的一條,支持自定義的storage Server ID。如果你的Server ID地址改了之后,可能會(huì)引起你集群狀況上做一些調(diào)劑之類的,固然以前也做了一些工作,支持你的ID改了之后能夠自動(dòng)調(diào)劑,但是這個(gè)功能不是特別穩(wěn)定,你個(gè)集群里面同時(shí)改ID的時(shí)候,可能會(huì)涌現(xiàn)一些凌亂的情況。

    記下來我們看一下DFS的架構(gòu),實(shí)在DFS只有兩個(gè)角色,大家可以看一下,右邊是存儲(chǔ)服務(wù)器,右上面是核心服務(wù)器,相稱于整個(gè)集群的中心,整個(gè)集群的腦筋。文件存儲(chǔ)是存儲(chǔ)在旁邊這塊的,我是列出來一列一列的,一列是一個(gè)組,文件在一個(gè)組里面是冗余的,完整是RADI1,完整是鏡像的關(guān)聯(lián),然后每個(gè)組的文件不會(huì)重疊的,文件上傳上來只能放在一個(gè)組里面,如果這個(gè)組里面有三個(gè)服務(wù)器,這個(gè)文件就會(huì)被復(fù)制三份。這個(gè)圖大略有是這樣。

    DFS集群里面的所有服務(wù)器都是平等關(guān)系,存儲(chǔ)服務(wù)器是分組的方式,不同組的存儲(chǔ)服務(wù)器之間他們是完全獨(dú)立的,不會(huì)有任何聯(lián)系,不會(huì)有任何的通訊。再看一下這個(gè)圖,剛才講了這個(gè)右上面這個(gè)圖集群的樞紐,他怎么知道這些集群的狀況,是由這個(gè)存儲(chǔ)服務(wù)器主要向它匯報(bào)的。

    接下來我們看一下DFS上傳文件和下載文件是什么樣的流程,其實(shí)懂得了這個(gè)流程可能對(duì)DFS工作機(jī)制可能就明白了一大半。

    我們看一下上傳文件的流程,首先client會(huì)問tracker,我要上傳一個(gè)文件我這個(gè)文件應(yīng)該上傳到哪去。下載這個(gè)文件是client去問tracker,可以下載指定文件的storage,參數(shù)為文件ID。

    接下來我們看一下DFS的特點(diǎn),大家可以看到,DFS是不需要傳統(tǒng)的name Server的,把這個(gè)瓶頸給打消了,因?yàn)樗麤]有這個(gè)角色。另外它的存儲(chǔ)時(shí)候是用分組的方式,這個(gè)方式比較簡(jiǎn)單,也比較機(jī)動(dòng)。比如說要下載文件就以通過火組的方式。存儲(chǔ)服務(wù)器都是對(duì)等結(jié)構(gòu)的,不存在單點(diǎn)的問題。我們下載文件的時(shí)候,可以和目前主流的Web Server聯(lián)合起來用,我們對(duì)阿帕奇提供了拓展模塊,也可以在存儲(chǔ)服務(wù)器上面直接部署阿帕奇或者部署UNIX,再把擴(kuò)展模塊裝上去,可以直接支持下載了。另外對(duì)中小型文件可以支持得很好,大文件也是可以支持的,但對(duì)大文件沒有做特別支持,就是DFS是出于簡(jiǎn)單的考慮,它對(duì)大文件,目前沒有做分塊這種做法,從V3開始,可以對(duì)海量小文件很好的支持,支持多塊磁盤,其實(shí)是倡議,為了使你的系統(tǒng)達(dá)到更好的效率,其實(shí)是推舉你的存儲(chǔ)服務(wù)器直接掛單盤,不要做RADI了,這個(gè)文件系統(tǒng)保證你數(shù)據(jù)的可靠性,其實(shí)你是沒有必要做硬件RADI的,是比較揮霍的。最后一個(gè)特點(diǎn)就是支持雷同文件內(nèi)容只保留一份,節(jié)儉空間。

    方才講到DFS不name Server,不須要存儲(chǔ)文件索引,傳統(tǒng)都是必需要用name Server,為什么DFS不須要這個(gè)索引服務(wù)器,方才我講的進(jìn)程中已經(jīng)說到了,DFS里面的文件ID,是由存儲(chǔ)服務(wù)器天生,并且反饋給client的,client直接存在本人的體系里面就好了。文件ID包括了組名,還包括了文件名,能夠直接依據(jù)該文件名定位到這個(gè)體系里面的文件。

    下面一個(gè)文件ID的示例,最前面是組名,由管理員自己定義的,后面第二部分是磁盤,因?yàn)镈FS支持多磁盤,第二部分就是磁盤的表示,就是M后面帶一個(gè)磁盤的序號(hào),M00就表示第一塊磁盤,M01就表示第二塊磁盤。00和0C就對(duì)應(yīng)文件系統(tǒng)里面的存儲(chǔ)目錄,DFS的文件是直接存在文件系統(tǒng)里面的,然后它在文件系統(tǒng)里面是建了一個(gè)兩級(jí)目錄來存儲(chǔ)的,最多就是250M,其實(shí)這個(gè)目錄數(shù)足夠了。最后一部分就是文件名,大家可以看到,比較長(zhǎng),文件名里面其實(shí)還包含了一些信息,在這里不具體講了。

    再講一下,V3你的小文件是合并存儲(chǔ)的,你怎么定位到這個(gè)小文件,大家可以看一下,我們?cè)诒緛淼腎D基本上又增添了三個(gè)字段,總共16個(gè)字節(jié),每個(gè)字段都是4字節(jié)的,它會(huì)有一個(gè),我這個(gè)文件是存在哪個(gè)窗口文件里的,然后我們的窗口文件以IE號(hào)作為文件名的,它在這個(gè)小文件的ID里面就會(huì)記載我存的這個(gè)trunk file的ID,根據(jù)文件偏移量,直接定位到小文件起始的地位,還有我占用多大空間。

    DFS同步機(jī)制也講一下,DFS是同步,和買裝備的同步其實(shí)有類似的處所,都是采取binlog的做法,就是更新操作,上傳操作,然后同步的時(shí)候直接根據(jù)binlog來做。有一點(diǎn)要注意的,binlog里面只記載這個(gè)文件名和操作的類型,不會(huì)實(shí)際記載文件內(nèi)容,因?yàn)閷?shí)際文件內(nèi)容已經(jīng)存儲(chǔ)到系統(tǒng)里面去了。同步的時(shí)候是用增量的方式,我同步的地位,我會(huì)記載在一個(gè)標(biāo)識(shí)文件里。剛才也說到,我的一個(gè)組里面,存儲(chǔ)服務(wù)器是平等的,然后文件上傳、刪除、下載這些操作可以在這個(gè)組里面任何一臺(tái)服務(wù)器上去做。還有一點(diǎn)就是這個(gè)文件同步,是先上傳到一臺(tái)存儲(chǔ)服務(wù)器上面去,然后再由這臺(tái)服務(wù)器把這個(gè)文件同步到這個(gè)組的其他服務(wù)器上面去,他是先上傳上去,上傳停止了再用IF的方式同步從前。

    文件同步只在本組內(nèi)進(jìn)行,因?yàn)樗亲鍍?nèi)storageServer之間進(jìn)行,然后是push的方式,即源頭服務(wù)器同步給目的服務(wù)器。

    下面就會(huì)引入一個(gè)問題,因?yàn)槲业奈募巧蟼魍曛,我才去做同步的,有一個(gè)問題就是我的同步延遲的問題怎么解決。大家如果做過應(yīng)用開發(fā)的話就會(huì)遇到一個(gè)問題,就是同步延遲的問題,比如你更新一些記錄,或者你查一些記錄之后,你立刻就去訪問這個(gè)記錄,如果你立刻去訪問到storage的話,可能數(shù)據(jù)還沒有同步過來,會(huì)導(dǎo)致記錄取不到,也可能導(dǎo)致收到臟數(shù)據(jù),我們以前解決同步延遲的問題,我們就用了一個(gè)很土,很簡(jiǎn)單的做法,我做完操作之后我加一個(gè)sdf。

    存儲(chǔ)器生成的文件名里面,其實(shí)包含了好幾個(gè)比較重要的字段,其中最重要的兩個(gè)字段一個(gè)就是源storageID地址,或者從V4開始它的ID,還有另外一個(gè)字段就是文件的創(chuàng)建時(shí)間。根據(jù)文件名可以把這這些字段翻譯出來,另外一點(diǎn)存儲(chǔ)服務(wù)器會(huì)定時(shí)向storage Server講演同步的情況,包括向目標(biāo)服務(wù)器同步到文件的時(shí)間戳,tracker收到報(bào)告之后就會(huì)做一個(gè)計(jì)算,因?yàn)槊總(gè)存儲(chǔ)器都向他定時(shí)的呈文,然后他收到這個(gè)呈文之后就會(huì)計(jì)算,這個(gè)組里面每一臺(tái)存儲(chǔ)服務(wù)器被同步時(shí)間戳的最小值。它會(huì)找這個(gè)最小值,把它給記錄下來。

    tracker Server怎么知道我這個(gè)服務(wù)器上面一定能獲得這個(gè)文件,有四個(gè)條件,第一個(gè)條件我們會(huì)設(shè)置一個(gè)同步的延遲閥值,當(dāng)前時(shí)間,文件創(chuàng)立時(shí)間戳,如果大于同步實(shí)現(xiàn)一個(gè)文件所需要的最大時(shí)間的話,表現(xiàn)這個(gè)文件肯定通不外去,這個(gè)文件肯定是延遲的。

    第二個(gè)條件如果文件創(chuàng)立時(shí)間戳,比被同步的時(shí)間戳小的話,是表現(xiàn)這個(gè)文件已經(jīng)同步到當(dāng)前存儲(chǔ)服務(wù)器上去了。

    第三個(gè)前提,單個(gè)文件的同步需要最大時(shí)間是多少,比如5分鐘我就會(huì)比一下這個(gè)時(shí)間戳,是不是已經(jīng)大于同步的最大時(shí)間,如果大于這個(gè)時(shí)間同步不外去了。

    第四個(gè)條件文件上傳到源頭storage,只要知足一條就可以下載到這個(gè)問題的。

    下載文件的時(shí)候,我通過比較兩個(gè)時(shí)間戳,就知道你這個(gè)文件是不是可以下載。

    最后我們看一下DFS使用的現(xiàn)狀。目前已經(jīng)知道在用的公司有二十多家,用的最大的一家是做網(wǎng)站的公司,他們存儲(chǔ)group數(shù)量有四百個(gè),它的存儲(chǔ)的機(jī)器數(shù)已經(jīng)超過800臺(tái)了,存儲(chǔ)容量達(dá)到6PB,存儲(chǔ)文件數(shù)超過1億,它的網(wǎng)站業(yè)務(wù)增加很快,數(shù)目增加也很快。我2010年的PPT里面寫的時(shí)候,group數(shù)和容量還是現(xiàn)在的一半,前幾天問它,它現(xiàn)在已經(jīng)又翻一倍了,也就一年多的時(shí)間。

    我們?cè)倏匆幌翫FS的使用案例,支付寶、飛信、京東、58同城、趕集網(wǎng)之類的,其實(shí)主要還是互聯(lián)網(wǎng)的公司,包括有支付行業(yè)的,有做電子商務(wù)行業(yè)的,也包括搜尋這個(gè)行業(yè)的。我的介紹就到這,下面是一些網(wǎng)址,大家感興趣的話可以去看一下,包括DFS的論壇,上面有一些提問的解答,這是我的微博,大家感興致的話可以關(guān)注一下,另外還有QQ群。也生機(jī)大家能夠參與到這個(gè)項(xiàng)目里面來,不管你是用還是貢獻(xiàn)代碼,反正能介入進(jìn)來就是很開心的一件事情。謝謝大家!

    提問…

    余慶其實(shí)DFS就是一個(gè)分布式的非常成熟的一個(gè)系統(tǒng),然后它的特點(diǎn),其實(shí)前面講到了,第一點(diǎn)就是他只有兩個(gè)角色,沒有傳統(tǒng)的name Server,不需要承當(dāng)文件索引,這是很大的亮點(diǎn)和特點(diǎn)。

    目前DFS的做法比較簡(jiǎn)單,像文件的一致性這塊,做的是弱一致性,不是強(qiáng)一致性,如果要做強(qiáng)一致性的話,你要付出的代價(jià)會(huì)很高。比如你要做強(qiáng)一致性,有一個(gè)做法,我要保障一個(gè)文件起碼存三份,我于是把這個(gè)文件三份都傳上去,這樣應(yīng)用真?zhèn)響應(yīng)時(shí)間會(huì)很長(zhǎng),并且應(yīng)用端會(huì)很難做,萬一我只有兩臺(tái)機(jī)器可以用,那這個(gè)時(shí)候你怎么處理,很麻煩的。如果弱一致性的話就好一些,只有有一臺(tái)機(jī)器是活著的,就可以上傳上去,等別的機(jī)器恢復(fù)之后再同步給它就好了。

    比如我只有兩臺(tái)機(jī)器,上傳了幾個(gè)文件,第一臺(tái)服務(wù)器上去了,還沒有來得及同步到第二臺(tái)服務(wù)器的時(shí)候,這臺(tái)機(jī)器掛了,目前DFS架構(gòu)的特點(diǎn),無奈恢復(fù)的話,這幾個(gè)文件可能就喪失了,強(qiáng)一致性的代價(jià)會(huì)大很多。

    提問…

    余慶這個(gè)tracker Server把兩臺(tái)機(jī)器的IP地址和端口配上去就好了。

    提問…

    余慶比如你要是動(dòng)態(tài)的再加機(jī)器,目前的做法就是你要?jiǎng)討B(tài)加tracker Server,你的存儲(chǔ)服務(wù)器要重啟,以后在線加了之后就能自動(dòng)生效之類的就更好了。tracker Server你要裁減的話,這種情況很少。

    主持人謝謝余慶,我們希望這個(gè)項(xiàng)目成為阿帕奇的項(xiàng)目,因?yàn)闀r(shí)間關(guān)系,晚上還有活動(dòng),所以我們邀請(qǐng)最后一位報(bào)告人。

    孫振南向堅(jiān)持到現(xiàn)在的各位表示感謝,我會(huì)講得非?欤绻蠹矣惺裁磫栴}可以結(jié)束以后再聊。

    今天跟大家介紹一下最近比較火的項(xiàng)目,叫inpala,因?yàn)榻裉焓谴髷?shù)據(jù),云開源,in現(xiàn)在還不是阿帕奇的項(xiàng)目,然而他用的阿帕奇的允許。

    第一個(gè)問題它為什么,它比較適合復(fù)雜的運(yùn)算,但是它在自己?jiǎn)?dòng)的過程當(dāng)中,它都有很多問題,也不是問題,比較慢,不適合在這樣的場(chǎng)景下使用,大家也都習(xí)慣了,也沒有認(rèn)為這樣有什么不好,可是最近一些需求,它的響應(yīng)時(shí)間,針對(duì)海量數(shù)據(jù)慢了一點(diǎn)。還有一個(gè)問題就是它的接口,Hive提供了接口,可以進(jìn)行海量數(shù)據(jù)的查詢。

    今天這個(gè)inpala完全在功能上跟Hive非?拷。講到速度的話,還有一個(gè)為什么不能用HBase,他很快,只是你的數(shù)據(jù)進(jìn)去這個(gè)步驟會(huì)花很長(zhǎng)時(shí)間,我這邊寫的,你有可能有ETL,你有可能沒有ETL,無論怎么你要導(dǎo)數(shù)據(jù)都會(huì)花很長(zhǎng)的時(shí)光。

    我們看一下在大數(shù)據(jù)處理范疇當(dāng)先的人,首先看谷歌,谷歌在實(shí)時(shí)處理海量數(shù)據(jù)上面有一些貢獻(xiàn)。后面是兩個(gè)是技術(shù)上的亮點(diǎn)。他用的列存儲(chǔ),谷歌做得比較厲害的是,基于可現(xiàn)套的數(shù)據(jù)構(gòu)造做的列存儲(chǔ),根據(jù)這樣的數(shù)據(jù)格式做列存儲(chǔ)其實(shí)是有一些技能的,在他的論文里面講得比較清晰,這就是他的技術(shù)背景和他達(dá)到的后果,大家也都很愛慕。

    另外還有一家叫亞馬遜,前兩天拉斯維加斯,他們的會(huì)議上也先容了他們的Redshift,他沒有公然一些細(xì)節(jié),我們曉得就可以了,沒有什么可以學(xué)習(xí)的。他是依照主機(jī)收費(fèi)的,你付費(fèi)就很貴,而且你只能用到你的機(jī)器,不能用多別人的機(jī)器,這個(gè)跟谷歌的服務(wù)理念不一樣,所以我個(gè)人不太看好亞馬遜這個(gè)貨色。

    我們看一下有了這些論文或者一些當(dāng)先者的做法,開源界有了什么東西,第一個(gè)就是阿帕奇Drill,現(xiàn)在有很多自愿者開端討論這個(gè)東西,它沒有任何的本質(zhì)的進(jìn)展,現(xiàn)在我們介紹另外兩個(gè),一個(gè)是Drill,今年大概十月份比較火起來的,但是到十一月份漸漸冷下來了,。還有一個(gè)就是Shark和Spark,它也是這個(gè)范疇的新星。最后一個(gè)就是我們今天要介紹的inpala。

    我們回過火來看,這樣的東西,在整個(gè)大數(shù)據(jù)處理的生態(tài)環(huán)境里面它的定位到底是什么?第一他其實(shí)只是一個(gè)衡量,新的像inpala比較重視義務(wù)反饋的速度,響應(yīng),但它只能做一些簡(jiǎn)單的事情,特定的一些查詢。跟傳統(tǒng)的分布式的MPP的數(shù)據(jù)庫比擬,它也有些長(zhǎng)處,它的做法向與上面用了MPP的思路,一些接口,下面我不再用MPP昂貴存儲(chǔ)硬件,或者網(wǎng)絡(luò)設(shè)備,我就把它換成了鏈家的HDMS,首先他非常的廉價(jià),還有就是他可以提供線性的擴(kuò)展。這是它在整個(gè)大數(shù)據(jù)處理的環(huán)境當(dāng)中的定位,如果你進(jìn)行簡(jiǎn)單查詢的話它可以很大水平上幫到你。

    我們看一下它到底做些什么,它的功能其實(shí)很簡(jiǎn)單,就是跟Hive做的事情瀕臨的,同時(shí)他也有一定水平上的數(shù)據(jù)天生的能力,Hive不僅是數(shù)據(jù)查問,他可以做大數(shù)據(jù)的轉(zhuǎn)換。所有除此之外的東西,它都是沿用了Hive現(xiàn)有的方法,或者沿用了Hive的組件,他沒有用metadata,他是直接到Hive里面把那些表讀出來,就得到這些信息,同時(shí)他需要用Hive的DDL,就是定義語言,同時(shí)他的JDBC和ODBC都完全用Hive的,驅(qū)動(dòng)都不必重裝,他已經(jīng)盡量跟Hive做到了兼容。這邊相稱于以前一個(gè)Hive可能要一跑晚上,第二天才干看到成果的,一個(gè)中午就跑完了,這是最有價(jià)值的一點(diǎn)。

    我們舉一個(gè)簡(jiǎn)單的例子讓大家看一下這個(gè)是怎么用的。首先還是要用一下Hive,可以建一張表,你還是要用Hive把數(shù)據(jù)導(dǎo)進(jìn)去,完了以后你就可以用impala,可以看到你剛剛用Hive建的表,可以做查詢。這是一個(gè)非常簡(jiǎn)單的例子,就像大家說的,怎么把它跑起來。

    這一頁我們看一下整個(gè)inpala的架構(gòu),首先inpala是一個(gè)沒有瑪斯特概念的。inpala必定要數(shù)據(jù)本地化。我用紅線畫的,每一個(gè)inpala都會(huì)被設(shè)計(jì)的動(dòng)作,紅線就是每個(gè)都要做的。

    我們看一下它怎么把這個(gè)速度提上去,這是它比較牛的地方。這邊介紹兩個(gè)概念,一個(gè)SQL其實(shí)可以分解成為很多執(zhí)行的小的單元,大家如果用過一些傳統(tǒng)數(shù)據(jù)庫的東西都知道,都會(huì)給出一個(gè)執(zhí)行的數(shù),其實(shí)就是那個(gè)東西,里面有一個(gè)深度優(yōu)先的數(shù),下面執(zhí)行完了執(zhí)行上一層,每一個(gè)結(jié)點(diǎn)有數(shù)據(jù)讀取、排序等等。

    這一頁包含了若干個(gè)結(jié)點(diǎn)可以獨(dú)自履行最小履行的單元。舉個(gè)例子,我們想查問一下是不是獨(dú)身未婚的男青年比較不愛好用打折券。左邊是商品數(shù)據(jù),右邊是客戶數(shù)據(jù),旁邊是ID連接起來。我們SQL依照城市選出來,包括商品名字,包括標(biāo)價(jià),標(biāo)價(jià)和它的實(shí)際銷售的價(jià)錢,男性,獨(dú)身,東西比較貴,在北上廣。我們看一下剛那個(gè)SQL可以分解成這樣子,最開端還是要去讀數(shù)據(jù),讀完數(shù)據(jù)以后再做Join,這樣子看挺直觀的,數(shù)據(jù)庫也都能做,在我們分布式的環(huán)境下,我們?cè)趺窗阉涌欤趺窗阉兊每梢苑植,把Aggregation分步做。

    fragment需要負(fù)責(zé)讀取一張表,同時(shí)讀取的時(shí)候按照跟這張表相干的前提進(jìn)行篩選,這三個(gè)在這一步是一相關(guān)的,而且數(shù)據(jù)也是分布的,這一步是完全可以分布來做的,下一步我們把數(shù)據(jù)小的表傳給數(shù)據(jù)多的表,比如這個(gè)表的數(shù)據(jù)比較大,我們就應(yīng)該把商品數(shù)據(jù)的找出來的結(jié)果傳給所有有銷售數(shù)據(jù)的結(jié)點(diǎn),傳過來以后就不需要再找一臺(tái)結(jié)點(diǎn)做Join。這個(gè)fragment為什么包含了兩個(gè)Join,起因是因?yàn)槿绻阕鳛閮蓚(gè)fragment的話,在運(yùn)行的時(shí)候,無論是線程也好,還是什么也好,一定還有本機(jī)的數(shù)據(jù)傳輸,這就是最公道的調(diào)配方式,這就是盡量快去執(zhí)行的基本原理。

    這邊比較頭疼的地方,這兩個(gè)的結(jié)果都需要傳遞到這臺(tái)有數(shù)據(jù)的結(jié)點(diǎn)上,對(duì)帶寬要求比較高,所以我用了比較粗的紅線,如果N臺(tái)機(jī)器銷售數(shù)據(jù),M臺(tái)機(jī)器上有商品數(shù)據(jù),這是一個(gè)M×N的關(guān)系。

    除此之外,在性能優(yōu)化上做了很多事情,大概是四個(gè),第一個(gè)完全用C++寫的,fragment在實(shí)際散發(fā)執(zhí)行的時(shí)候會(huì)在本地做編譯。他會(huì)繞過HDFS協(xié)定。

    接下來它有哪些事情要做呢,首先他沒有BDL,他需要完全借助Hive,第二個(gè)他沒有Defined Function,第三個(gè)他沒有FT,如果這個(gè)Join在中間掛掉以后,他提議重跑。然后就是文件類型的支持,Avro,RCFile,LZO等等。inpala和Trevni,性能會(huì)提升很多。如果這兩個(gè)加在一起,性能上比谷歌論文里面那個(gè)不會(huì)差太多,開源輕微走帶谷歌前面一點(diǎn)點(diǎn)。

    他現(xiàn)在的Join,我們講的數(shù)據(jù)傳來傳去,最后做合并的時(shí)候全體在內(nèi)存里面做的,這個(gè)很有問題,數(shù)據(jù)大了,很有可能會(huì)爆掉,正在做改進(jìn)。已經(jīng)可能會(huì)寫進(jìn)磁盤等等。

    我們做了一些測(cè)試,我們測(cè)試用的是速度交易委員會(huì),一些數(shù)據(jù)也很龐雜,這是測(cè)試用的機(jī)器,用來做inpala三臺(tái)機(jī)器,總共只有四塊硬盤。這是我們測(cè)試的成果。

    下面兩頁沒空講了,這是他內(nèi)部的架構(gòu),這邊我只講半分鐘,BE他里面有一些fragment。

    如果有問題的話線下再聊,我新浪微博是這個(gè)。

    主持人非常感激各位今天保持到現(xiàn)在,也非常愉快大家一起來加入這個(gè)阿帕奇亞洲巡講的活動(dòng),晚上我們?cè)趯?duì)面的三樓有活動(dòng),如果有興致大家可以去對(duì)面C座三樓。我們的活動(dòng)到此結(jié)束,謝謝各位!

    標(biāo)簽:

    掃一掃在手機(jī)打開當(dāng)前頁
    無相關(guān)信息
    武漢生活資訊

    武漢圖文信息
    中建科工游湖公交綜合體項(xiàng)目組織開展2024年質(zhì)量月質(zhì)量知識(shí)競(jìng)賽活動(dòng)
    中建科工游湖公交綜合體項(xiàng)目組織開展2024年
    武漢市硚口區(qū)2024年小學(xué)入學(xué)報(bào)名及學(xué)校服務(wù)范圍
    武漢市硚口區(qū)2024年小學(xué)入學(xué)報(bào)名及學(xué)校服務(wù)
    2023年武漢暑期青少年體育夏令營(yíng) 報(bào)名
    2023年武漢暑期青少年體育夏令營(yíng) 報(bào)名
    2023暑假武漢中小學(xué)生免費(fèi)游泳場(chǎng)館!
    2023暑假武漢中小學(xué)生免費(fèi)游泳場(chǎng)館!
    蔡甸區(qū)花博匯景區(qū)
    蔡甸區(qū)花博匯景區(qū)
    武漢駕駛證考試攻略,各個(gè)科目怎么考,要考哪些內(nèi)容
    武漢駕駛證考試攻略,各個(gè)科目怎么考,要考
    如何全額提取公積金(附提取方法)
    如何全額提取公積金(附提取方法)
    武漢市初中招生入學(xué)區(qū)域咨詢電話一覽表
    武漢市初中招生入學(xué)區(qū)域咨詢電話一覽表
    推薦信息

    欄目更新

    幣安app官網(wǎng)下載 虛擬手機(jī)號(hào)碼 高仿手錶 手機(jī)app軟件下載 幣安app官網(wǎng)下載 幣安app官網(wǎng)下載 幣安app官網(wǎng)下載 幣安app官網(wǎng)下載

    關(guān)于我們 | 打賞支持 | 廣告服務(wù) | 聯(lián)系我們 | 網(wǎng)站地圖 | 免責(zé)聲明 | 幫助中心 | 友情鏈接 |

    Copyright © 2022 whw.cc Inc. All Rights Reserved. 武漢網(wǎng) 版權(quán)所有
    鄂ICP備19009404號(hào)-6 公安備 42010502000112