본문 바로가기
데이터 시각화/Tableau (인프런 강의 내용)

0 Tableau 설치, 데이터 연결, 준비, 작업하기

by yororing 2024. 3. 27.

00 Tableau 설치

  • Tableau Public 다운로드 받기
  • Tableau Desktop 버전은 유료

01 데이터 연결하기

  • 불러오기 가능한 파일 종류:
    • excel, text, json, pdf, spacia 공간(shape), statistical 통계(r, spss, sass)
  • server에서 불러오기도 가능
    • 일부 서버는 드라이브 설치 필요 -> tableau help의 도움을 받아 설치 후 접속 가능

02 데이터 준비하기

  • 작업하고자 하는 데이터 불러오기 (엑셀)
    • 첫 화면에서 원하는 데이터 형태 (엑셀, 텍스트, json 등등)나 서버 (google 등)를 선택하여 원하는 데이터 불러오기
    • Sheets 아래에 있는 테이블 중 하나를 메인 화면(주황색 박스) 안에 끌어당기기
  • 데이터 확인하기
    • 지금 업데이트 버튼 클릭
    • 미리보기 100(박스 안에 숫자)개의 행(rows)이 보일 것
  • 데이터 추가하기
    • 왼쪽 메뉴바에 있는 Connections 오른쪽에 위치한 Add 누르기
    • 원하는 데이터 형태/서버를 선택하여 원하는 데이터 불러오기
    • Sheets 아래에 있는 테이블 중 하나를 메인 화면(주황색 박스) 안에 끌어당기기
  • 데이터 JOIN
    • JOIN 하고자 하는 테이블을 클릭하여 그 안에 들어간다
    • 그 박스 안에 JOIN 하고자 하는 다른 테이블을 끌어당겨 넣어준다
    • Inner, Left, Right, Full Outer 중 선택 가능
    • Data Source 와 테이블2 아래에 있는 박스를 클릭하여 어느 필드를 기준으로 조인할 것인지 설정 가능 (서로 같은 필드인 것을 선택하면 됨)
    • 하단에 미리보기를 보면 맨 첫번째 테이블과 두번재 테이블의 필드 색이 다른 것을 확인
    • 반복되는 필드는 우클릭하여 숨기기 (Hide) 가능
  • 연결: 라이브 vs. 추출 (Desktop 기능)
    • 목적과 데이터베이스의 종류에 따라 사용하는 연결 종류 선택
    • 라이브
      • 연결을 라이브로 한다는 것은 화면 작업을 할 때 항상 데이터베이스를 향해서 직접적으로 쿼리를 날리겠다는 의미
      • 단점: DB 부하, (상대적으로) 늦은 처리 속도
      • 장점: DB의 신속한 업데이트
    • 추출
      • 추출하여 연결한다는 것은 데이터베이스 현재 상태를 스캔본으로 한 번 떠서 로컬 베이스에 저장하는 것; 태블로 서버를 사용하면 최단 15분 주기로 추출을 계속해서 뜰 수 있다 (-> 이렇게 우리가 보는 화면을 최신화할 수 있음)
      • 장점: 빠른 처리 속도, 모든 종류의 태블로 기능 사용 가능
      • 단점: (상대적으로) 느린 업데이트 주기
  • 필터 Filters
    • 데이터 원본 필터
      • 원하는 데이터만 추출하는 기능 (예를 들면 가장 최근 데이터인 2023년도 데이터만 원할 때, 어느 지역의 데이터만 원할 때)
      • 대용량 데이터 취급 시 적절히 사용할 경우 매우 유용

03 데이터 작업하기

  • 작업 공간 (하단 아이콘들)
    • 시트 Sheet: 하나 하나의 워크 스페이스 (work space)
    • 대시보드 Dashboard: 몇 개의 시트를 조합하여 구성하는 하나의 화면
    • 스토리 Story: 시트와 대시보드가 조합된 스토리 라인 (PPT와 유사)
      • '빈 페이지'를 클릭 새 화면을 추가할 수 있음
  • 시트에서 시작 (데이터: Super Store (tableau 사이트에서 다운로드 - https://public.tableau.com/app/learn/sample-data))
    • Tableau에 데이터를 불러오게 되면 Tableau는 자신의 판단 기준을 가지고 모든 field들을 차원과 측정값으로 나눈다
      • 측정값: 숫자
      • 차원: 관점; 측정값(숫자)를 어떤 관점으로 바라볼 것인지
    • 열 선반 Column Shelf 과 행 선반 Row Shelf
    • 연속형 continuous 데이터 (초록색), 불연속형 discrete 데이터 (파란색)
    • 맨 위 아이콘들
      • '테블로 마크'를 누르면 데이터 연결창으로 바로가기 (시작 페이지 표시) -> 새로운 데이터를 불러올 수 있음; 워크 스페이스로 돌아가기 위해서 ESC 클릭
      • '<-' '->': 실행 취소 undo, 다시 실행 redo
      • 저장
      • '새 데이터 원본': 데이터 연결창으로 가지 않고 새로운 데이터 연결
      • '새 워크 시트': 새로운 워크 시트/스페이스 생성
      • '복제': copy
      • '시트 지우기': 현재 작업하고 있는 워크 스페이스 자체를 삭제 - 잘못 지웠으면 undo 버튼 클릭하여 다시 가져오기 가능
      • '행과 열 바꾸기': 해당 시트에 있는 표의 행과 열을 바꿈
      • '오름차순 정렬', '내림차순 정렬'
      • '마크 레이블 표시/숨기기': 데이터의 레이블을 표시하거나 숨김
      • 박스: 화면 크기 조정 (옵션: 표준, 너비 맞추기, 높이 맞추기, 전체 보기)
      • 프레젠테이션 모드: 다시 편집모드로 돌아가기 위해 ESC 클릭
      • 표현방식: 태블로에서 제공하는 속성으로 차트 그리기 가능
        • 실습:
          • 새 시트에서 하나의 필드를 클릭한 후 (Mac) cmd 또는 (PC) ctrl 누른채로 다른 필드 클릭 (Region, Sales)
            • 두 필드를 사용할 경우 표현될 수 있는 방식들이 활성화되어(색 있게) 나타남; 흐리게 나타나있는 방식들은 두 필드만으로는 표현될 수 없는 방식들임