본문 바로가기

전체 글

(319)
구글 빅쿼리(Google BigQuery)의 리소스 모델의 이해 Google Cloud Platform에서 BigQuery를 사용할 때 리소스의 계층 하나의 조직(Organization)은 여러 프로젝트(Project)를 가질 수 있으며, 프로젝트 안에는 여러 데이터세트(Dataset)를 가지고 있습니다. 데이터세트 안에는 테이블(Table)과 ML Model 등이 있으며, Job이 실행되어 데이터 조작(Data Manipulation)을 합니다. 빅쿼리와 RDBMS 데이터 구조 비교 일반적인 RDBMS와 빅쿼리를 비교하면 다음과 같습니다. BigQuery (DW) RDBMS 데이터 모델 열 기반 행 기반 데이터 저장 분산 파일 시스템 페이지 기반 저장 스키마 동적 스키마 정적 스키마 파티셔닝 지원 지원 클러스터링 자동 수동 쿼리 처리 병렬 처리 단일 노드 처리 데이..
구글 빅쿼리(Google BigQuery) 와 OLTP OLTP(Online Transaction Process) 실시간으로 트랜잭션을 처리하는 데이터베이스 시스템 OLTP란 OLTP는 완전무결하게 거래(Transaction)을 처리하기 위해서 사용하는 데이터베이스 시스템입니다. OLTP는 데이터가 무결하며, 데이터의 추가(INSERT)나 변경(UPDATE)가 많이 발생합니다. OLTP(Online Transactional Processing)는 ATM 및 온라인 뱅킹, 금전 등록기, 전자상거래 그리고 우리가 매일 상호작용하는 수많은 기타 서비스를 위한 신속하고 정확한 데이터 처리를 가능하게 합니다. OLTP(Online Transactional Processing)는 일반적으로 인터넷을 통해 많은 사람들이 많은 데이터베이스 트랜잭션을 실시간으로 실행할 수 ..
구글 빅쿼리(Google BigQuery)와 빅쿼리 스튜디오 구글 빅쿼리를 이용한지 벌써 6년이 넘어가고 있지만 제대로 정리한 적이 없어 정리 차원에서 글을 남깁니다. https://cloud.google.com/bigquery/docs/introduction?hl=ko 구글 빅쿼리(Google BigQuery)의 정의 BigQuery는 머신러닝, 지리정보 분석, 비즈니스 인텔리전스와 같은 기본 제공 기능으로 데이터를 관리하고 분석할 수 있게 해주는 완전 관리형 엔터프라이즈 데이터 웨어하우스입니다. BigQuery의 서버리스 아키텍처에서는 SQL 쿼리를 사용하여 제로 인프라 관리에 관한 조직의 가장 큰 질문을 해결할 수 있습니다. BigQuery의 확장 가능한 분산형 분석 엔진을 통해 테라바이트급 쿼리를 초 단위로 수행하고 페타바이트급 쿼리를 분 단위로 쿼리할 수..
가장 중요한 기적! 우리 아이를 위한 기적을 만들어 가고 있습니다. 어렵지만 이 기적을 이루기 위하여 노력한지 이제 어느새 1년이 넘어가고 있네요. 작지만 꾸준하게 하나씩 나아가고 발전해가고 있습니다. 그래서 아직 작지만 기적은 이루어지고 있습니다. 그 기적이 이루어 지고 있습니다.
[Lib] 사이킷런(scikit-learn) 사이킷런 (Scikit-Learn) 이란 Python을 대표하는 Open Source 기반의 ML 라이브러리 입니다. 사용법이 쉽고 ML 알고리즘이 효율적으로 구현되어 대표적으로 활용되고 있습니다. https://scikit-learn.org/ scikit-learn: machine learning in Python — scikit-learn 0.16.1 documentation scikit-learn.org
[Python] 아나콘다(Anaconda) 아나콘다(Anaconda)란 ML이나 데이터 분석 등에 사용하는 여러가지 패키지가 기본적으로 포함되어있는 파이썬 무료 배포판 으로 Windows 에서 쉽게 Jupiter Notebook과 같은 파이썬 개발 환경을 구성할 수 있습니다. https://www.anaconda.com/ Unleash AI Innovation and Value | Anaconda Accelerate growth efficiently for everyone with the AI and data science experts. www.anaconda.com 만약 Windows 환경에서 Python 개발을 한다면 pip 사용이 쉽지 않으므로 아나콘다 사용을 강력히 권장합니다. 위의 사이트에서 아나콘다 배포판을 다운로드 받아 설치하시기 ..
핸즈온 머신러닝 - 2판 https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=324278819 핸즈온 머신러닝 - 전2권 ‘실제로 머신러닝을 구현하면서 학습한다’는 목표를 더욱 효과적으로 달성할 수 있도록 복잡한 주제를 구조화하고 난이도에 따라 순차적으로 학습할 수 있게 개선했다. 또한 누구나 쉽게 이 www.aladin.co.kr 그동안 Lisp 시절부터 알고 있던 ML 등에 대한 지식을 정리할 필요성을 느끼고 점 두껍지만 Keras, TensorFlow 까지 정리할 겸 이 책을 읽습니다. 참고로 AI(Artificial Intelligence)라는 용어는 Lisp 이란 프로그래밍 언어의 아버지이자 인공지능에 대하여 연구하였던 존 매카시(John MacCarthy)가 처음 만든 용어입니다..
PM 인터뷰의 모든 것 https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=53127202 PM 인터뷰의 모든 것 어떻게 하면 스타트업이나 대기업에서 제품 관리 역할에 안착할 수 있는지 깊이 있게 설명하며, 모호한 역할인 PM(제품 관리자/프로그램 관리자)이 회사마다 어떻게 다른지, PM이 되기 위해서는 www.aladin.co.kr PM에 대해서 더 정확하게 명확하게 정의하고 싶어서 읽기 시작한 책입니다. 제품 관리자의 역활 PM(제품 관리자, Product Manager)은 자신의 팀이 뛰어난 제품을 출시할 수 있도록 책임지는 사람이다. PM은 비전과 전략을 세워야 한다. 성공을 정의하는 사람이자 동시에 결정을 내리는 사람이 바로 PM이다. PM은 기술, 비즈니스, 디자인이 서로 만나..