블로그

4주차 본문

Computer engineering/확률과 통계

4주차

JuNM0418 2019. 3. 28. 13:35

변수

범주형(Factor) : 연산이 가능X ex) 성별, 생년월일 등등

연속형(Numberic) : 연산이 가능O ex) 성적, 키 등등

 

변수 타입을 사용하는 이유

함수에 따라 적용할 수 있는 변수 타입이 다르기 때문.

 

다양한 변수 타입

Data Type 의미
numberic 실수 1, 12.3
integer 정수 1L, 23L
complex 복소수 3 + 2i
character 문자 "male", "123"
logical 논리 True, FALSE, T, F
factor 범주 1, 2, a, b
Date 날짜 "2010-12-10", "19870204"

 

데이터 타입(Data Type)을 사용하는 이유

컴퓨팅 파워를 효율적으로 쓰기위해서

데이터 연산에서 안정성을 확보하기 위해

 

데이터 구조

데이터 구조 차원 특징
벡터(Vactor) 1차원 한 가지 변수 타입으로 구성
데이터 프레임(Data Frame) 2차원 다양한 변수 타입으로 구성
매트릭스(Matrix) 2차원 한 가지 변수 타입으로 구성
어레이(Arrary) 다차원 2차원 이상의 매트릭스
리스트(List) 다차원 서로 다른 데이터 구조 포함

 

다차원을 잘 사용하지 않는 이유

복잡해서, 다차원을 쓰지 않고 변수를 추가해서 사용할 수 있기 때문에

 

다차원 분석(OLAP, Online Analytical Processing)

의사결정 지원 시스템 가운데 대표적인 예로, 최종 사용자가 다차원 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정을 활용하는 과정.

 

종류

MOLAP(Multimensianl OLAP)

다차원 데이터베이스에 기반한 OLAP 아키텍쳐로 다차원 데이터의 저장과 프로세싱에 MDB가 사용된다. 다른 아키텍처에 비해 네트워크 상의 데이터 이동이 최소화 되었으며, 다차원 데이터의 저장과 프로세싱에 동일한 엔진이 사용됩니다.

 

ROLAP(Relational OLAP)

관계형 데이터베이스에 기반한 OLAP 아키텍쳐로 관계형 데이터와 클라이언트 사이의 연결역할을 수행한다.

 

DOLAP(Desktop OLAP)

다차원 데이터의 저장 및 프로세싱이 모두 클라이언트에서 이루어지는 데이터 베이스로 다른 OLAP제품에 비해 비교적 유지보수가 용이하지만, 필요한 데이터가 모두 클라이언트로 이동해야하므로 데용량 데이터 처리에 한계가 있다.

 

HOLAP(Hybrid OLAP)

다차원 데이터의 저장공간으로 다차원 데이터베이스와 관계형 데이터베스가 함꼐 사용가능한 제품으로 일반적으로 요약된 데이터나 관계식에 읳 새로 계산된 데이터는 다차원 데이터베이스에 저장되며, 상세데이터는 관계형 데이터베이스에 저장한다.

 

비즈니스 인텔리전스(BI, Business Intelligence)

기업에서 데이터를 수집, 정리, 분석하고 활용하여 효율적인 의사결정을 할 수 있는 방법에 대해 연구하는 학문이다.

 

출처

https://iamdaisy.tistory.com/15

https://bcho.tistory.com/tag/MOLAP

가천대학교, 이영호 교수님, 확률과 통계

김영우, 쉽게 배우는 R 데이터 분석, 이지퍼블리싱, 2019

 

'Computer engineering > 확률과 통계' 카테고리의 다른 글

13주차  (0) 2019.05.30
6주차  (0) 2019.04.18
3주차  (0) 2019.03.21
2주차  (0) 2019.03.19
Comments