최근 구글 e-mail에 부분적인 장애가 발생하였다. 9월 24일 부터 9월 26일간 발생한 이 장애를  Google Apps Status Dashboard를 통해 확인할 수 있었다. Dashboard는 SaaS 어플리케이션 서비스들이 고객이 해당 서비스에 대한 실식산 모니터링을 가능하게 해주는 역할을 한다. 사용자는 Dashboard를 통해 문제 원인과 장애 조치 상황을 알 수 있다.

사용자 삽입 이미지

99.99%의 가동율을 목표로 하는 것이 서비스 운영팀의 목표일 것이다. 이를 위해서는 많은 경험과 시행착오가 필수적일 수 밖에 없다. 결국 , 얼마나 이러한 시행착오를 자산화하면서 대처하는 가가 바로 SaaS 와 Cloud 서비스 회사의 경쟁력일 것이다. 이러한 측면에서 구글은 계속해서 SaaS 서비스로 진화하고 있다.

Cloud Slam 09

클라우드 관련 컨퍼런스가 열렸었습니다. 인터넷상에서 가상으로 열린 Virtual conference 였는데 발표 자료를 공유합니다. 양이 많아서 시간을 두고 봐야 할 것 같습니다. ^-^

APRIL 20, 2009

Ivan Casanova: Cloud Computing for the Corporate DataCenter

PR111: Nati Shalom. Practical Guide for Developing Enterprise Application on the Cloud
PR211: Michael Berman: Hey, You, Get Off Of My Cloud: Security in the Virtual Data Center

PR112: Carter George. The OTHER SaaS: Storage-as-a-Service
PR212: Mark Werrell. Cloud Computing in a down economy- Why On-Demand is changing the game.

Songnian Zhou: Clouds Moving Into the Enterprise

PR113: Rob Gingell: An Infrastructure Platform for Cloud Computing
PR213: Vijay Karamcheti. GreenCloud and the New Data Center Infrastructure for Cloud Services.
Panel Topic: Cloud & Adoption

PR114: Nimish Radia: Business Models and Needed Technologies for Cloud Computing
PR214: Bill Bryce and Ljubomir Buturovic: Case Study Using UniCloud and Amazon's EC2 for Research in the clouds.

PR115: Robert Grossman and Yunhong Gu: Sector: An Open Source Cloud for Data Intensive Computing
PR 215: Dain Ehring: A Financial Services Case Study: Converting to the Cloud One Module at a Time -- Implementing PaaS and SaaS Where Legacy Systems Once Ruled

PR116: Darren Platt. On Demand Identity for The Cloud.
PR216: Bob Quinn: Cloud Computing and On Demand IT: Enabling New Levels of Agility, Flexibility and Scalability

PR117: Francis Carden. Integrating Applications in the Cloud.

PR118: Krishnan Subramanian. The importance of Open Source in a SaaS based world.
PR218: Stephen Foskett. Cloud Storage Moves into the Spotlight


APRIL 21, 2009

PR217: William Fellows. The Sky's the Limit

David Bernstein: Secrets from the Vault – Cloud Building

PR121: Winston Bumpus: Open Standards and Cloud Interoperability.
PR221: Jonathan Bryce: Will Standardizing the Cloud Make it Secure or Stifle Innovation and Openness?

PR122: Janine Bowen, Stephen Sorett and Jason Silverman: Legal Issues in Cloud Computing
PR222: James Broberg: MetaCDN: Enabling High Performance, Low Cost Content Storage and Delivery via the Cloud

Russ Daniels: Understanding the Cloud

PR123: Ben Rushlo: How to deliver high-performing, highly-available Cloud applications
PR223: Peter Vogel: Building a Business in the Cloud.

PR124: Manfred Buchmann: Special Storage Infrastructure Learnings from Building Enterprise Cloud
PR224: Sudhrity Mondal: Automating Dev/Test environments using Internal Clouds and Virtualization – a Case Study

PR125: Steve Lesem:The Most Interesting Sub-plot in Cloud Computing is Cloud Storage.

PR225: Yaniv Romem: Databases in the Cloud
Panel Topic: Cloud Computing & Governance.

PR226: Mark Masterson. Enterprise Cloud Computing

PR227: Daniel Smith. Selling the cloud

PR128: Charles Studt: Voice in the Cloud – Keys to Making Voice and Media Work in the Cloud
PR228: Boris Zuckerman. Scalable storage in the cloud

PR129: Wei-Yu Chen and Jazz Wang. Building a Cloud Computing Analysis System for Intrusion Detection System


APRIL 22, 2009

Mark De Simone: The Dollars and Sense of Cloud Computing

Werner Vogels: Ahead in the Cloud - The Power of Infrastructure as a Service

PR131: Pankaj Malviya: Salvation in the Private Cloud - Platforms at your Service
PR231: Jon Pyke: Process Technology Delivers on Vision for Enterprise Cloud Orchestration Services

PR132:Ivan Casanova: Self Service Application Provisioning – A Developers View into the Cloud
PR232:Adam Swidler: Working In The Cloud: How Cloud Computing is Reshaping Enterprise Technology

Stephen Herrod: The Private Cloud: Enterprise-ready on and off premise.

PR133: Rod Boothby: Development: The Vanishing Enterprise
PR233: Robert Friedman: Jurisdiction
Panel Topic: Cloud & Economics

PR134: Aaron D. Hollobaugh: CloudNine - a cloud hosting platform.

PR135: Dr. Rao Mikkilineni: Cloud Computing through FCAPS Managed Services in a Virtualized Data Center

PR136: Rod Fontecilla and Vicky Chang: Cloud Computing: A Transition Methodology
PR236: Moshe Kaplan and Ayal Baron. The Pareto Illusion - Why we end up paying too much for cloud services and what can we do about it?

PR137: Dennis Moreau. Security, Compliance and Trust in Cloud: Coupling Issues
PR237: Patrick Lightbody: Parallelization and the Coming Testing Revolution

PR138: Fred Zappert. The Resin J2EE Application Server - what works for SalesForce can work for you.


APRIL 23, 2009

Hal Stern: What does cloud computing mean

PR141: Mike Maxey: Real World Cloud Storage Workloads
PR241: Jeff Kaplan: Making the Cloud Mainstream

PR142: Omer Trajman. Cloud Computing Meets Data Warehousing
PR242: Michael Crandell. Taking Advantage of a Multi-Cloud World: Issues, Opportunities, and Practical Advice

Maximilian Ahrens: Keeping an Open Cloud

PR143: John Janakiraman and Ian Knox: Cloud Adoption: Deploying Your Existing Applications to the Cloud
PR243: Stuart Charlton: License Management in the Cloud
Panel Topic: Cloud Computing & Economics.

PR144: Marc-Elian Bégin and Charles Loomis: SlipStream™: a Framework using Cloud Computing to Automate Full-scale System Tests and In-Cloud Deployment
PR244: Margaret Lewis. "The Silver Lining": Getting to the core of cloud computing.

PR145: Deepak Puri: How Virtualization Is Empowering The Next Generation of Cloud Based Offerings
PR245: Dave Malcolm. Private Clouds: Critical Considerations for Building Internal Clouds

PR146: Robert Grossman: Open Cloud Consortium
PR246: Omer Trajman. Securing your Data in the Cloud

PR147: Sam Charrington. Cloud Platforms and the ‘Toughest 80%’: Application Management.
PR247: Jinesh Varia. High Performance Compute Cloud

PR148: Geoffrey Fox. Science Clouds and Campus Clouds.
PR248: Alex Barnett. The Small Business Data Cloud.


APRIL 24, 2009

PR254: Simon Crosby: Bridging the Gap Between Enterprise IT and the Cloud

PR151: Jake Sorofman: Cloud Computing Adoption Model
PR 251: Frank Gillett: Determining the right pricing models for a cloud-based service

PR152: Michael Ryan: Moving Financial Grids into the Clouds?
PR252: Shahzad Pervez: Application-centric management of resources on the cloud

Jayshree Ullal: A Novel Approach to Cloud Networking

PR153: Chander Kant and Paddy Sreenivasan: Backup to Cloud: Our Experiences So Far
PR253: Raimund Genes: How Cloud Computing helps to solve the malware challenge.
Panel Topic: Cloud Computing & Storage

PR154: Jeanne Morain: Universal Clients - enabling cloud computing for the Desktop - virtual evolution
PR254: Michael West: Blue Skies: The Air Clears on Cloud Computing and SaaS

PR155: Philippe Nicolas: Massively Scalable Cloud & File Storage
PR255: Srini Chari. Confronting the Data Center Crisis: A Cost - Benefit Analysis of the IBM Computing on Demand (CoD) Cloud Offering

PR156: Jeff Fisher: Cloud-hosted Desktops: The Smart, Low-Risk Way to Enter the Cloud
PR256: David Bernstein: Cloud Interoperability at Internet Scale

PR157: Neil Cohen. Optimizing the Cloud for Enterprise Class Cloud Computing
PR257:Simon Peel. Getting the Most out of SaaS with Integration as a Service.

PR158: Matt Holleran. Emerging opportunity for investors and entrepreneurs, offered by the platform-as-a-service trend.


Above the Cloud

서버 플랫폼에 기반하여 서비스를 개발하는 입장에서는 인프라 기술이 무척 중요합니다. 특히, 서비스를 수익성이 바로 서버 플랫폼을 얼마나 경제적으로 운영하는 가에 따라 영향을 받기 때문입니다. 실제 서비스 규모가 크면 클수록 서버 플랫폼의 운영 기술은 더욱 중요하다 할 수 있습니다. 특히, 스토리지나 빌링 처럼 서비스 개발에 필요한 인프라나 하드웨어 자체를 서비스로 판매하는 경우에는 플랫폼 구축 및 운영 기술이 사업에 절대적인 영향을 미친다 할 수 있습니다. 이러한 인프라나 하드웨어를 서비스로 구축,판매하는 분야를 Cloud 또는 IAAS(Infrastructrue As A Service) , HAAS(Hardware As A Service) 라 부르는 데 이 분야를 깔끔하게 정리한 자료가 있어 공유합다. 이 자료는 UC 버클리의 RAD(Reliable Adaptive Distributed) System Lab에서 공식적인 프로젝트의 산출물로 나온 것 입니다.

동영상외에 다음의 자료도 참고하면 Cloud Computing 의 현재와 미래를 이해하는 데 많은 도움이 될 것입니다.

화이트 페이퍼 - http://d1smfj0g31qzek.cloudfront.net/above_the_clouds.ppt.pdf
발표 자료 - http://d1smfj0g31qzek.cloudfront.net/above_the_clouds.ppt

최근 들어, 삼성SDS에서 구글 시스템 엔지니어들이 창업한 미국의 클라우데라라는 회사와 제휴를 하여 하돕기반의 클라우드 사업을 본격적으로 한다고 밝혔습니다. 물론, 국내에서 이러한 클라우드 인프라를 구축할 엔지니어와 파트너가 없기에 제휴를 하는 것이겠지만, 장기적인 관점으로 좋은 클라우드 엔지니어들이 양성되었으면 하는 바램입니다. 결코 클라우드 인프라는 단기간에 구축되는 것이 아니기 때문입니다. 또한 국내에도 클라우드에 비전을 갖고 있는 넷스알같은 우수한 인재와 회사가 있습니다. 이들과의  제휴를 통해 기술 저변과 기술의 자주성을 확보하는 것도 중요합니다.

작년 Cloud 기반의 개발 툴 환경을 정리해 본 적이 있다. 당시 구글 어플리케이션 엔진이 관심사 중의 하나였는데 테스트 당시 개발 환경의 조잡합으로 인해 아직까지 갈 길이 멀구나 라는 생각을 지울 수가 없었다. 특히, 당시는 국내에서 생소한 파이썬만을 제공했었다. 올 해 들어서는 현재 자바언어를 지원하고 있으며 개발 환경을 이클립스 플러그인을 지원하여 개발자들에게 지원하는 수준까지는 발전한 것 같다.

구글 어플리케이션 엔진외에 멋진 개발 클라우드 개발 환경이 있어 소개해 본다. Aptana는 클라우드 기반하에 가장 멋진 개발 환경을 제공하는 서비스 회사가 아닌가 싶다. 먼저 구구절절 설명에 앞서 회사에서 제공하는 간단한 소개 자료를 보자.


Aptana는 이클립스 기반의 독립형 개발 툴과 플러그인을 모두 개발자에게 제공한다. 또한 지원되는 개발 환경은 PHP5,Rails,Java,Jaxer 등이다.
사용자 삽입 이미지
뿐만 아니라 플러그인 형태로 아이폰, 노키아 위젯 그리고 어도비 에어 등을 개발할 수 있게 해준다. 특히, 개발관점에거 Aptana는 Ajax를 개발할 때 유용하다. 다양한 Ajax 플랫폼을 플러그인 형태로 추가하여 개발할 수 있으며 FrieFox를 사용하여 디버깅을 손쉽게 할 수 있다. 다음은 지원하는 Ajax 플랫폼이다.

사용자 삽입 이미지

개발에 있어 편리함외에 Aptana는 클라우드를 기반으로 하기 때문에 개발된 프로젝트를 바로 클라우드에 Deploy할 수 있다. 일단 Deploy를 마치고 나면 해당 서비스에 대한 클라우드를 모니터링할 수 있는 Dashboard을 제공한다.

사용자 삽입 이미지

물론 공짜는 아니다. 무료로 제공하는 범위를 벗어나는 스토리지와 메모리 사용 부분에 대해서는 비용을 지불해야 한다.

사용자 삽입 이미지
실제 앞선 비용이면 중.소 규모의 서비스를 개발/운영하는 데 있어서 큰 무리는 없어 보인다. 장비 구매,셋팅, 관리에 고민하는 시간에 개발에 열중하는 게 당연히 생산적이다. 더구나 이클립스에 익숙한 개발자 입장에서는 크게 학습할 필요 없이 몇 번의 시행착오만으로도 개발과 더불어 클라우드상에 소스를 Deploy할 수 있다. 일단 Deploy가 되면 자동으로 소스의 Sync까지 제공해 주니 정말 편리하다. 앗! 개발에 있어 협업 또한 가능하다.

Context Cloud Computing

일반적으로 컨텍스트(Context) 기반의 서비스는 서비스가 단순 명료할 수록 유용하다. 가장 일반적으로 알려진 컨텍스트 기반 서비스중의 하나는 아마존의 추천 서비스일 것이다. 해당 사용자의 구매 패턴과 해당 사용자와 유사한 사용자 군의 패턴을 분석하여 유사한 컨텐트를 추천한다. 가령, 요가를 구매하는 사용자에게 분석된 결과를 바탕으로 골프 요가나 스포츠 댄스 같은 유사한 컨텐트를 추천하는 것이다. 지금에서야 이러한 기능이 쇼핑몰 등에서 일반화되었지만 과거 닷컴 버블 시절 이러한 추천 시스템(recommendation system) 이 수천만 달러에 거래될 정도로 고가였었다. 2000초 당시 주로 사용되었던 기술은 Collaboration Filtering이 주요한 것이었는 데 필자가 운영하된 회사의 주요 개발자를 S모 그룹의 OK모 회사에서 스카웃(?)회사 별도의 회사를 설립해서 수백만불을 들이지 않고도 이러한 기능을 사용하기도 했었다. 대기업이 더 무섭다.^-^

쇼핑몰에서의 추천엔진외에도 다양한 컨텍스트 알고리즘을 사용하여 데이타를 분석하여 활용하는 데 이를 데이타 마이닝이라고도 한다. 이 기술을 사용하여 대용량의 데이타에서 다양한 고객을 분석하고 이에 기반한 서비스를 개발하기도 한다.  이러한 컨텍스트 기술들은 오래전 부터 연구.개발되어 오던 알고리즘들을 조금씩 변형하거나 혼합하여 사용되어져 왔다. 실제 그 기술 자체는 아주 새로운 것은 아니다. 그러나 이러한 기술을 어떤 분야에 어떻게 사용하는 가에 따라 다른 결과를 얻을 수 있기 때문에 그 활용가능성은 아주 무궁무진하다 할 수 있다. 가령, 모바일 디바이스의 사용 패턴을 분석하여 해당 패턴에 기반한 서비스를 추천해 줄 수도 있을 것이다.

그러나 실제 이러한 컨텐트스 기반 서비스는 분석하기 위한 많은 데이타와 분석을 위한 다양한 알고리즘, 컴퓨팅 파워 등을 고려해야 한다. 한마디로 많은 투자비용이 발생한다. 가령, 과거 P모 제철소의 경우 품질관리와 불량율 관리 등을 위해 공정상에 수많은 센서를 두고 실시간에 수집된 데이타를 분석.가공하여 품질을 관리하고 정을 개선하는 등에 사용한다. 엄청난 양의 데이타를 관리해야 만 하는 것이다. 이러한 서비스를 소규모의 기업이나 개인 차원에서 적용하는 것은 어렵다. 만일 이러한 기능을 서비스 차원으로 이용할 수 있다면 아주 효율적일 것이다. 이러한 컨텍스 클라우드 서비스 또한 클라우드 분야에서 각광받을 분야가 아닌가 싶다. 이러한 컨텍스트 클라우드 서비스르 구축하기 위해서는 다음과 같은 요구사항이 해결돼야 한다.

첫째, 컨텍스트 알고리즘과 이를 손쉽게 사용하기 위한 인터페이스와 API를 제공해야 한다.
둘째, 컨텍스트 알고리즘을 수행후 결과를 얻기 위해서는 많은 컴퓨팅 파워와 리소스를 필요로한다. 특히, 이러한 컨텍스트를 서비스로 공유하기 위해서는 이를 위한 스토리지와 대용량 컴퓨팅 파워가 필수적으로 고려돼야 한다.

이러한 부분을 손쉽게(?)  구현할 수 있을까?

사용자 삽입 이미지
먼저 알고리즘을 새로 개발하기 위해서는 많은 노력이 필요하다. 그러나 이미 해당 알고리즘은 오래전부터 발표되고 공유되던 것으로 웹에서 쉽게 확보할 수 있다. 과거에는 학교나 연구 기관 등에서 기본 알고리즘의 구현체를 주로 사용했었다. 그러나 최근에는 오픈소스로된 안정된 알고리즘을 확보할 수 있다. 최근에 아파치 재단의 검색엔진 프로젝트인 루신에서 대용량 기계 학습 알고리즘 구현체인  아파치 마핫 0.1(Apache Mahout 0.1)을 릴리이즈 했다.

아파치 마핫0.1 에는  clustering, classification, collaborative filtering 과 많은 새로운 알고리즘을 제공하고 있다. 다음은 아파치 마핫1.0 에서 제공하는 기능들이다.

- Collaborative Filtering
- Distributed clustering implementations: k-Means, Fuzzy k-Means, Dirchlet, Mean-Shift and Canopy
- Distributed Naive Bayes and Complementary Naive Bayes classification implementations
- Distributed fitness function implementation for the Watchmaker evolutionary programming library

이들 기능에 기반하여 원하는 형태의 API와 인터페이스를 추가적으로 개발하는 것이 필요할 것이다. 컨텍스트 알고리즘을 실제 응용하는 것은 아주 어렵기 때문이다. 과거 필자도 고가의 IBM의 인텔리전트 마이너라는 마이닝 툴을 사용하여 H백화점의 고객 분석 프로젝트를 수행했던 적이 있었다. 실제 그래픽 툴을 사용함에도 불구하고 무척 사용하기가 어렵고 결과를 해석.적용하기가 힘들었다.

일단 이러한 기본 구현 부분을 확보했다면 이들을 실행할 인프라를 갖추어야 한다. 컨텍스트 서비스는  대용량 데이타를 분석하기 위해 다양한 계산 알고리즘과 컴퓨팅 파워를 필요한다. 이러한 기본 클라우드 인프라를 기반으로 할 때 안정적인 서비스가 가능하다. 가령, 현재 아파치 마핫 0.1(Apache Mahout 0.1) 은  아파치 하돕상에 구현되었다. 아파치 하돕은 구글이 사용하고 있는 대용량 분산 파일 시스템이다.

무엇인가를 자동화하기 위해서는 자동화를 위한 기반 정보가 있어야 한다. 이러한 정보를 얻기 위해서는 많은 데이타를 수집하고 이를 분석.가공하는 것이 필수적이라 할 수 있다. 과거 이러한 컨텍스트 기반 기술은 많은 적용 비용과 기술 적용시 전문성을 요한다는 점 등에서 보험, 쇼핑 , 대형 포탈 등에서 만 적용이 되었다. 그러나 현재 앞서 소개한 것처럼 오픈소스 컨텐트 기술을 사용하여 컨텍스트 기술을 직접 적용하거나  컨텍스트 서비스라는 새로운 분야를 만들 수도 있을 것이다. 물론 이 과정에서 사업적으로 가장 중요한 것은 경제성이고 이를 위해서는 저렴한 클라우드 서비스를 구축하는 것이라 할 것이다.  누구간 이 서비스를 할 텐데...누가 먼저 할려나..아무래도 기반 인프라가 잘 갖춰진 아마존이 가장 유력하지 않을까 싶다.

