728x90

ETL 이란?

E : 추출(Extract),

T: 변환(Transform),

L : 적재(Load)

 

▣ E : 추출

추출은, SQL에서 SELECT를 통해 데이터를 뽑아오는 것이라고 생각하면 되는 것이다.

 

ETL의 예시로 내 갤러리에 있는 임의의 사진에 대한 이름을 들어보겠다.

SELECT 2020-02-12-19-23-48-%.jpg FROM MY_GALLAY

위와 같은 쿼리문을 입력하듯 SELECT를 통해 특정 값을 추출하는 것이다.

위 예시는 이해를 위해 가져온 것이므로, 실제로는 엄청나게 많은 데이터를 추출한 것이라고 가정하자

 

▣ T : 변환

변환은, 데이터를 추출한뒤 데이터 분석을 위해 이를 가공하기 위해 데이터포맷 등을 변환한다.

요구하는 데이터포맷이 YYYY-MM-DD이면, 이 형식에 맞게 데이터 값을 변경하면 되는 것이다.

또한, 컬럼 갯수를 변경, 테이블 스키마 변경 등 꼭 직접적인 데이터를 변환 하는 것이 아닐 수도 있다.

 

▣ L : 적재

적재는, 변환까지 마친 데이터들을 새로운 테이블에 적재하는 것이다.

CREATE TABLE Ex_Table (
    컬럼명 데이터타입 조건,
    ...
    컬럼명 데이터타입 조건,
 );
 
 INSERT INTO Ex_Table
 VALUES ('추가할 데이터', ... , '추가할 데이터')

 

이렇듯 매우 간단한 예시들로 알아보았던 ETL 에 대한 설명 이었다.

 

결론적으로 ETL은 DB를 데이터분석 하기에 좋게 데이터들을 가공하는 것이다.

 

728x90
복사했습니다!