'Federated learning'에 해당되는 글 1건

  1. 2017.07.25 구글의 인공지능(AI) 파워 분석


구글의 인공지능(AI) 파워 분석



ARK 투자 관리사에서 구글의 AI 파워에 대해 분석한 글이 있어 소개한다. 이 분석 글은 "데이터 - 알고리즘 - 하드웨어 - 클라우드" 등 4가지 측면에서 구글의 AI파워를 분석하였다. 이 분석 글은 2가지 측면에서 큰 의미가 있다. 첫 번째는 AI 성공을 위해서는 분석을 위한 풍부한 데이터가 준비되어 있어야 하고 , 문제 해결을 위한 다양한 알고리즘 개발 및 적용 능력 , 그리고 강력한 컴퓨팅 파워( 하드웨어, 클라우드) 등 AI 파워 기준을 명확히 했다는 것이다. 둘째는 , 이 기준을 통해  현재 나의 AI 파워와 준비 상태를 알 수 있다는 것이다. 


최근 국내에서도 인공지능에 대한 관심이 높아지며 여러 기업들이 관련 인재 확보 등 여러 노력들을 하고 있다. 실질적인 필요에 의해서 인지, 아니면 유행인지는 모르나 , 이러한 노력에 있어 각 기업들의 현재 상황이 AI파워를 낼 수 있는 충분한 준비가 되어 있는지 확인해 볼 필요가 있다. 단순히  AI가 지나가는 유행이 아니라 세상을 이롭게 할 수 있게 되길 간절히 바라며 AI를 적용하려는 기업들의 차분한 역량 준비를 기대해 본다.  




다음은 보고서에서 소개한 주요한 분석 내용이다.  


Google이 AI와 관련된 모든 스택을 갖춰가고 있다. Google은 자사 클라우드에 탑재된 자체 제작 칩을 통해 자사가 개발한 알고리즘을 실행하며, 이 알고리즘 훈련에 직접 수집한 데이터를 이용하고 있는 것이다. Apple이 iPhone용 iOS와 칩 개발에 이르는 전체를 총괄했던 것처럼 Google도 이러한 접근 방법으로 AI 영역에서 혁신을 가속화하고 경쟁업체들에 앞서 AI를 전개해 나가는 모습이다. Google은 이제 AI 기술 스택의 4대 레이어에서 세계 최고 수준에 오르며 뒤따르는 업체들과의 격차를 벌리고 있다. 


Data 


데이터는 AI를 위한 무기라 볼 수 있으며, Google은 전 세계 최대 규모의 데이터셋을 보유하고 있다. 월 10억 명 이상의 이용자들이 Android, Chrome, YouTube, Gmail, GoogleMaps, Google Search 및 Google Play를 이용하고 있으며, Google Translate과 GooglePhotos 역시 각각 5억 이상의 이용자를 보유하고 있다. Google은 이처럼 다양한 서비스에서 수집되는 텍스트, 이미지, 비디오, 지도, 웹 페이지 등 여러 유형의 데이터를 이용해 한 종류의 AI가 아닌 다양한 사용 사례를 개발해낼 수 있는 것이다. 또한 데이터만큼 중요한 것은 앱이며, Google은 다양한 앱을 소유하고 있다. 앱은 알고리즘 전면에서 Google이 추진하는 AI를 광범위하게 전파할 수 있게 해 주는 역할을 한다. 스타트업의 경우 특정 AI 분야에서 획기적인 발전을 이뤄낼 수 있겠지만 수억 명의 이용자들에게 접근하려면 몇 년이 걸릴 것이다. 반면 Google이 이들과 동일한 획기적 발전을 이룰 경우, 바로 수 십억 이용자들에 적용되어 이용자는 즉각적인 혜택을 누릴 수 있게 된다. 



Algorithms 


본질적으로 Google은 알고리즘 업체이다. Google Search의 근간이 되는 알고리즘인 Page Rank를 개발했으며, 딥러닝을 적용한 초창기 업체들 중 하나로 딥러닝 연구 분야의 리더라 할 수 있다. 특히 영국 소재 자회사 DeepMind와 함께 다양한 문제를 해결하는 새로운 차원의 딥러닝 아키텍처를 개발하고 있다.


  • Inception - 이전 모델들보다 2배 이상 정확하고 12배 단순한 나선형 신경망

  • Neural Machine Translation - 정확도가 기존 방법보다 60% 향상된 딥러닝 기반 번역 시스템

  • WaveNet - 실제 사람이 말하는 것처럼 음성 오디오를 생성하는 딥러닝 보이스엔진

  • RankBrain - 현재 Google Search용 랭킹 요소 중 3번째로 중요한 딥러닝을 이용하여 웹 페이지의 순위를 결정하는 시스템

  • Federated  learning - 클라우드에만 의존하지 않고 스마트폰에서 직접 AI 학습을 처리하는 분산형 딥러닝 아키텍처


Facebook, Microsoft와 같은 기업들도 새로운 딥러닝 알고리즘을 개발하고 있지만 업계에서 Google의 광범위한 연구와 이용자 규모에 필적할 만한 업체는 없다. 이러한 결과물들을 공개함으로써 Google은 AI 분야 리더로서 명성을 견고히 다져나가고 있으며, 이는 또다시 Google이  알고리즘 개발에 새로운 인재를 끌어오는 결과로 이어져 이른바 플라이휠(Fly-Wheel) 효과를 내고 있다. 


Google은 지난해 Tensor Processing Unit (TPU)이라는 딥러닝 추론 프로세서 개발 소식을 전한 바 있다. 해당 TPU는 고성능의 딥러닝 추론을 제공하며, 다른 프로세서에 비 해전력 소모는 훨씬 적다. 1세대 TPU는 초당 92 조회의 부동 소수점 연산이 가능하며, 75W의 전력을 소모한다. 즉, 1초에 소비전력 1W당 처리하는 연산은 1.2 조회인 것이다. 반면, NVIDIA의 최신 VoltaGPU는 초당 120 조회의 부동 소수점 연산을 구현하지만, 300W의전력을 소모하기에 1초에 1W당 처리하는 연산은 0.4 조회로, 동일 한성 능일 경우 Google의 TPU가 NVIDIA의 GPU 보다 전력 효율이 200% 더 높다고 볼 수 있다. 


지난 5월 Google은 부동 소수점 연산 성능을 고도화한 2세대 TPU를 발표했으며, 이로써 딥러닝 훈련과 추론을 동시에 처리할 수 있게 되었다. 개발자들은 알고리즘 개발과 실행 모두에 이를 이용할 수 있으며, 이론적으로는 GPU의 필요성이 사라진 것이다. 


이처럼 Google이 내부에서 칩을 설계하기로 결정한 것은 스마트폰 시장에서의 선례와 유사성을 지닌다. 2010년, Apple은 서드파티를 통해설 계하던 iPhone 및 iPad용 SoC를 자사가 직접 설계하는 구조로 전환함으로써 경쟁 업체에 비해 성능과 시장 진입 면에서 상당한 이점을 갖게 되었다. 예를 들어, 2013년에 Apple은 경쟁 업체들보다 한 세대 앞선 64-bit ARM SoC를 설계하고 출하했으며, 다른 스마트폰에 비해 iPhone 5S의성 능을 약 2배 향상하고 Touch ID 같은 새로운 보안 기능을 적용할 수 있었다. 


Google도 이러한 이점을 기대하고 있다. 경쟁사들은 딥러닝에 기성 프로세서를 이용하지만 Google의 TPU는 보다 고성능, 저지 연성을 제공하며, 가장 중요하게는 전력소비를 절감한다. 따라서, Google이 데이터 센터 구축에 가장 많은 자본 지출과 운영비용을 들이고 있다는 점을 감안하면 TPU는 Google의 capex와 opex를 유의미 하계절감 해주는 것이다.  

 

Google은 현재 클라우드 컴퓨팅 비즈니스, 특히 IaaS(Infrastructure-as-a-Service) 영역에서는 Amazon, Microsoft에 이어 3위에 머무르고 있다. 하지만, 그중 인지 API(Application Programming Interfaces) 영역만은 Google이 주도하고 있다. 


인지 API는 이미지 인식, 텍스트 필사 및 번역처럼 특화된 AI 작업 수행에 클라우드의 힘을 이용하는 것이다. 비용 효율면에서 최선의 선택인 상용 하드웨어를 제공하는 IaaS와 달리, 인지 API의 성능은 벤더별로 알고리즘 기능, 훈련 데이터, 기본 하드웨어에 따라 매우 달라진다. ARK의 조사에 따르면, Google은 최상의 알고리즘, 수십억 이용자 플랫폼을 이용한 최대 규모의 데이터셋, 가장 강력하고 효율적인 하드웨어인 TPU를 보유하고 있어 유리한 상황이다. 


예를 들어, Google의 번역 API가 텍스트-음성 번역을 지원하는 언어는 100개 이상으로, 이는 다음으로 많은 언어를 지원하는 AWS의 4배 이상이다. 2016년 9월에는 인기 언어들에 가장 정확한 딥러닝 기반 서비스인 인공 신경망 기계 번역 지원 기능을 추가하기도 했다. 당시 Google은 TPU가 고성능, 비용 절감, 저지 연성을 실현함으로써 해당 시스템 구현에 중요한 역할을 했다고 언급했다. 즉, Google이 “FullStack”으로 갖추고 있는 알고리즘, 데이터, 하드웨어 및 클라우드가 이러한 고성능, 웹 스케일 서비스에서 경쟁 우위를 확보할 수 있도록 결정적인 역할을 하고 있는 것이다. 


하지만 Google은 클라이언트 기기에는 취약하다는 문제가 있다. 소프트웨어와 서비스를 제공하기 때문에 하드웨어 업체와 협력해야 하지만, 이 중 일부 업체들은 Google의 소비자 접근에 적대적인 태도를 취하고 있다. 예를 들어, Apple은 iPhone의 기본 지도 앱으로 Google Maps를 중단했으며, 이로 인해 Google은 상당수의 소중한 소비자들을 잃었다.. 이에 Google은 스마트 스피커인 Google Home, Pixel 스마트폰, Nest연결 장치 등 자체 하드웨어 제품에 적극적으로 투자하며 이러한 약점을 해결해 나가고 있다. 하지만 이 전략이 상당한 수준의 보급률에 도달하며 효과를 내려면 시간이 걸릴 것이다. 


그럼에도 불구하고, AI 분야에 대한 노력에 힘입어 Google은 알고리즘, 데이터, 하드웨어 및 클라우드 서비스를 포괄하는 완전 통합형 기업으로 변모하고 있다. 또한, Google의 소비자 서비스에 적용된 최상의 AI를 기업용 서비스와 Google Cloud의 경쟁력 향상에 활용하고 있다. 자체적으로 칩을 설계하여 성능을 향상하고 지연성을 낮추며 비용을 절감함으로써 Google의 AI 범위를 확장하는 것이다. 여기서 가장 중요한 것은 수직적 통합은 조직의 민첩성 향상으로 이어지며, Google은 이 점을 활용해 신제품이나 서비스 출시를 위해 조직의 모든 부분을 총괄할 수 있다는 것이다. 그 결과 향후 수년간 Google의 AI는 혁신의 최전선에 자리할 전망이다.


Posted by 박재현
,