본문 바로가기

Architecture for Software/Google BigQuery

(3)
구글 빅쿼리(Google BigQuery)의 리소스 모델의 이해 Google Cloud Platform에서 BigQuery를 사용할 때 리소스의 계층 하나의 조직(Organization)은 여러 프로젝트(Project)를 가질 수 있으며, 프로젝트 안에는 여러 데이터세트(Dataset)를 가지고 있습니다. 데이터세트 안에는 테이블(Table)과 ML Model 등이 있으며, Job이 실행되어 데이터 조작(Data Manipulation)을 합니다. 빅쿼리와 RDBMS 데이터 구조 비교 일반적인 RDBMS와 빅쿼리를 비교하면 다음과 같습니다. BigQuery (DW) RDBMS 데이터 모델 열 기반 행 기반 데이터 저장 분산 파일 시스템 페이지 기반 저장 스키마 동적 스키마 정적 스키마 파티셔닝 지원 지원 클러스터링 자동 수동 쿼리 처리 병렬 처리 단일 노드 처리 데이..
구글 빅쿼리(Google BigQuery) 와 OLTP OLTP(Online Transaction Process) 실시간으로 트랜잭션을 처리하는 데이터베이스 시스템 OLTP란 OLTP는 완전무결하게 거래(Transaction)을 처리하기 위해서 사용하는 데이터베이스 시스템입니다. OLTP는 데이터가 무결하며, 데이터의 추가(INSERT)나 변경(UPDATE)가 많이 발생합니다. OLTP(Online Transactional Processing)는 ATM 및 온라인 뱅킹, 금전 등록기, 전자상거래 그리고 우리가 매일 상호작용하는 수많은 기타 서비스를 위한 신속하고 정확한 데이터 처리를 가능하게 합니다. OLTP(Online Transactional Processing)는 일반적으로 인터넷을 통해 많은 사람들이 많은 데이터베이스 트랜잭션을 실시간으로 실행할 수 ..
구글 빅쿼리(Google BigQuery)와 빅쿼리 스튜디오 구글 빅쿼리를 이용한지 벌써 6년이 넘어가고 있지만 제대로 정리한 적이 없어 정리 차원에서 글을 남깁니다. https://cloud.google.com/bigquery/docs/introduction?hl=ko 구글 빅쿼리(Google BigQuery)의 정의 BigQuery는 머신러닝, 지리정보 분석, 비즈니스 인텔리전스와 같은 기본 제공 기능으로 데이터를 관리하고 분석할 수 있게 해주는 완전 관리형 엔터프라이즈 데이터 웨어하우스입니다. BigQuery의 서버리스 아키텍처에서는 SQL 쿼리를 사용하여 제로 인프라 관리에 관한 조직의 가장 큰 질문을 해결할 수 있습니다. BigQuery의 확장 가능한 분산형 분석 엔진을 통해 테라바이트급 쿼리를 초 단위로 수행하고 페타바이트급 쿼리를 분 단위로 쿼리할 수..