728x90
ETL 이란?
E : 추출(Extract),
T: 변환(Transform),
L : 적재(Load)
▣ E : 추출
추출은, SQL에서 SELECT를 통해 데이터를 뽑아오는 것이라고 생각하면 되는 것이다.
ETL의 예시로 내 갤러리에 있는 임의의 사진에 대한 이름을 들어보겠다.
SELECT 2020-02-12-19-23-48-%.jpg FROM MY_GALLAY
위와 같은 쿼리문을 입력하듯 SELECT를 통해 특정 값을 추출하는 것이다.
위 예시는 이해를 위해 가져온 것이므로, 실제로는 엄청나게 많은 데이터를 추출한 것이라고 가정하자
▣ T : 변환
변환은, 데이터를 추출한뒤 데이터 분석을 위해 이를 가공하기 위해 데이터포맷 등을 변환한다.
요구하는 데이터포맷이 YYYY-MM-DD이면, 이 형식에 맞게 데이터 값을 변경하면 되는 것이다.
또한, 컬럼 갯수를 변경, 테이블 스키마 변경 등 꼭 직접적인 데이터를 변환 하는 것이 아닐 수도 있다.
▣ L : 적재
적재는, 변환까지 마친 데이터들을 새로운 테이블에 적재하는 것이다.
CREATE TABLE Ex_Table (
컬럼명 데이터타입 조건,
...
컬럼명 데이터타입 조건,
);
INSERT INTO Ex_Table
VALUES ('추가할 데이터', ... , '추가할 데이터')
이렇듯 매우 간단한 예시들로 알아보았던 ETL 에 대한 설명 이었다.
결론적으로 ETL은 DB를 데이터분석 하기에 좋게 데이터들을 가공하는 것이다.
728x90