亞馬遜Web服務近年來頻繁變動,從價格削減到緊密整合私有數據中心,再到調整企業市場,而且不斷擴展其原來的開發者和創業公司客戶。
在眾多執行者中一馬當先的就是Matt Wood,他是亞馬遜Web服務(AWS)的數據科學總經理。SearchCloudComputing本周在AWS峰會上和他探討了企業客戶的熱點問題。這里我們將談談云價格、云聯盟、法規以及數據定位。
TechTarget云計算:云價格是當下的熱點話題,谷歌和亞馬遜都在本周大幅降價。在每個人都可以免費得到一切之前價格究竟會有多低?
Matt Wood:我們一直都知道, 和我們的零售業務有一點像,云計算是一種大容量、低利潤的游戲,而且這是一種我們非常適應的業務模式。
如果你回顧過去的八年,我們降價42次,這樣做并沒有任何真正的競爭壓力。降價只是我們所做的一部分,是我們的組織發展的脈搏的而一部分,而且我們處于良性循環中……有越多客戶采納這個平臺的地方,他們就使用得更多,而且因為我們能走出去和我們的廠商進行客制交易,我們走出去,并且利用規模經濟,總體上我們最終是節省了成本。我們還可以從中獲利。這也是一種合情合理的事情。但是我們選擇將這些成本節省回饋給客戶……我們一直在做這些事情,而且未來我們還會這樣做。
TechTarget云計算:你的專長領域是數據科學和大數據分析。在這個領域里你是否看到了一些新的趨勢?
Wood: 最大的趨勢之一就是增益,而非取代,但是傳統商業智能的增益則伴隨更加實時的服務。而且是二者同時變得更加強大。
芬蘭游戲公司Supercell就是個很好的例子……他們運作流行移動游戲,比如部落戰爭(COC),而且他們一天中有八百萬人在ios上玩這個游戲。理想上,如果你是個游戲公司,你希望盡可能地捕捉價值。你想知道人們如何同游戲世界交互。你想知道你的游戲競技表現如何。你想知道誰買了什么,以及誰和誰進行了對話,在什么情況下退出了游戲。你可以利用這些信息改善游戲。
通過收集所有數據有些已經實現了。你收集什么并沒有限制,使用亞馬遜實施管理流服務Kinesis,就是一種實現途徑,你可以將數據丟進去,并且以不同的樣本率連接傳感器,,用同樣的數據流可以做不同的事情。
TechTarget云計算:亞馬遜將自己描述為“客戶導向”。那么哪些特性和服務是客戶目前尋求的呢?
Wood:他們會詢問類似這樣的事情,‘是否易于訪問高價值、公共數據集?’這就要求我們要做很多。因為有很多數據。我們花費大量的時間識別,且同公共的可用數據工作,并且使其易于使用。
Common Crawl就是個很好的例子,它會定期更新,是一個非常大的Web集,Web上的每一頁、下載和預計算,放到一個主頁上,這就讓Hadoop很容易運行。你不必自己來抓取,必須將原素材進行預計算所有的標簽,并且移除HTML和類似的東西,這些都已經做好了。
你所得到的就是格式化的數據,易于用分布式的方式使用。你可以在冷啟動中在不到十分鐘的時間里查詢數十億網頁。我們存儲且托管這個數據是免費的,因為對于整個社區是有益的,然后我們確保其遵循了最佳的簡單對象存儲(S3)訪問實踐,所以這也很容易加速大型Hadoop集群,并且運行查詢。
TechTarget云計算:我們接觸的一些客戶認為云聯盟很有前途,亞馬遜如何看待這個問題呢?
Wood: 我們目前還沒從客戶那里聽到這樣的說法,但是這并不代表未來這不重要。
我們從一些更大企業機構那里聽到就是已經在基礎架構上進行了大量投資。他們已經有了藍圖。我們和這些人談論的時候,我們嘗試引導他們并非一種選擇,可以本地運行或者是在AWS上運行一切。
我們過去的十八個月都在構建集成點,使其更易于讓用戶在有意義的地方運行工作負載。我們在他們的數據中心和我們的數據中心之間構建了直接的鏈接,我們提供私有存儲選擇,我們也有私有計算選擇,我們識別了聯合選擇以及類似于WorkSpaces這樣的事物,這是一種在后端同活動目錄集成的事物。所有的這些集成點都幫助客戶在其工作負載上做出正確的選擇。
TechTarget云計算:一些客戶處于法規遵從原因需要將數據保存在某個特性區域,亞馬遜能夠簽署法定協議,保證客戶的數據不會離開具體的可用區或者具體的區域嗎?
Wood: 實際上,你如果不選擇數據存在哪里是沒辦法使用我們的平臺的。客戶必須做出謹慎的決定,確定其數據將會存在的區域。我們有這樣的特定區域,每一個區域都有多種可用區,而且可用區內部都有數據中心。以S3服務為例,我們通過可用去得到鏡像數據,但是我們不會在區域間做鏡像數據。