[AWS] Amazon Kinesis

2025. 8. 21. 20:16·Cloud

Amazon Kinesis

출처: https://stratusgrid.com/blog/aws-kinesis-how-to-overcome-batch-requests-poison-pills

  • Amazon Kinesis는 대규모 스트리밍 데이터를 실시간으로 수집, 처리, 저장하는 서비스다.
  • 스트리밍 데이터는 한마디로 지속적으로 생성되는 데이터를 의미한다. (ex. 주식 거래, 센서 데이터, 로그 등).
  • 실시간 분석, 애플리케이션 등 활용 범위가 넓다.

 

스트리밍 데이터에서 주목할 점

스트리밍 데이터를 다룰 때에는 다음과 같이 주목해야 할 점이 세 가지 존재한다.

  • 데이터 순서: 주식 거래처럼 순서가 중요한 경우, 순서가 어긋나면 혼란이 생기므로 데이터의 순서가 중요하다.
  • 데이터 처리 능력: 대량 데이터를 빠르게 처리해야 하므로 고성능 서버가 필요하다.
  • 확장성(Scalability): 데이터 급증 시 서버가 유연하게 확장 가능해야한다.

 

Amazon Kinesis의 특성

데이터에 iterator(시퀀스 번호)를 붙여서 순서를 관리하고, 높은 확장성을 제공한다. 데이터 처리에 필요한 서버는 AWS가 관리하여, 사용자는 관리 부담이 감소하게 된다. 대표적인 서비스는 다음과 같다.

서비스 설명 주요 활용 예시
Amazon Kinesis Data Streams 스트리밍 데이터를 실시간으로 캡처, 처리, 저장 가능 실시간 로그 수집, IoT 센서 데이터 수집, 주식 거래 데이터 처리
Amazon Kinesis Data Firehose 스트리밍 데이터를 S3 같은 데이터 스토어, Datadog, Splunk 같은 서드파티 분석 도구로 전송 가능 로그 데이터를 S3에 저장 후 Athena 분석, 보안 이벤트 데이터를 SIEM(Datadog, Splunk)으로 전송
Amazon Kinesis Data Analytics - 스트리밍 데이터에 SQL 쿼리 실행하여 실시간 분석 가능
- 데이터 소스는 Kinesis Data Streams 또는 Firehose 중 선택 가능
- 실행 결과는 Data Streams, Firehose, S3 등으로 출력 가능
실시간 IoT 데이터 평균값 계산, 실시간 이상 탐지
(ex. 네트워크 보안 이벤트)
Amazon Kinesis Video Streams AWS SDK(개발 킷)를 사용해 카메라, 스마트폰, 드론, 센서 등 영상 촬영 장비에서 스트리밍 데이터를 캡처, 처리, 저장 가능 감시 카메라 영상 실시간 스트리밍, 드론 촬영 영상 분석, 영상 기반 AI 모델 입력

 

Kinesis Data Firehose

출처: https://dev.classmethod.jp/articles/configure-kinesis-data-firehose-and-test-using-data-generator-kr/

Firehose는 데이터를 대상(S3, Splunk 등)에 전송하는 일종의 급수관이다. Kinesis Data Firehose는 데이터 전송을 위해 전송 스트림(Delivery Stream)을 따로 생성해야 한다.

Kinesis Data Firehose의 구성요소는 다음과 같다.

 

  • 소스(Source): Kinesis Data Streams, Amazon MSK, Direct PUT, Fluentd, CloudWatch Logs 등.
  • 대상(Destination): S3, Redshift, Elasticsearch, Splunk 등.
  • IAM 역할: 권한 제어.
  • Lambda 변환 옵션: 데이터 형식 변환, 암호화가 가능하다.

Kinesis Data Firehose 이용 요금

 Kinesis Data Firehose의 요금은 수집한 데이터양(월 단위 GB)에 따라 과금된다.

1) 데이터 소스가 Vended Logs인 경우

수집 데이터양(월) 요금
처음 500TB 0.16 USD/GB
500TB~2.0PB 0.14 USD/GB
2.0~5.0PB 0.11 USD/GB
5PB 이상 별도 문의

2) 데이터 소스가 Direct PUT / Kinesis Data Streams인 경우

수집 데이터양(월) 요금
처음 500TB 0.036 USD/GB
500TB~2.0PB 0.031 USD/GB
2.0~5.0PB 0.025 USD/GB
5PB 이상 별도 문의

3) 데이터 소스가 MSK(Kafka 기반)인 경우

수집 데이터양(월) 요금
처음 500TB 0.068 USD/GB
500TB~2.0PB 0.058 USD/GB
2.0~5.0PB 0.05 USD/GB
5PB 이상 별도 문의

 

Kinesis Data Firehose 사용료 예시

(1) Vended Logs 소스

  • 레코드 크기: 0.5KB
  • 전송량: 100 레코드/초
  • 한 달 데이터양: 약 129.6GB
  • 비용: 약 19.77 USD/월

(2) Direct PUT 소스

  • 레코드 크기: 3KB → 과금은 최소 5KB 단위로 반올림 처리
  • 전송량: 100 레코드/초
  • 한 달 데이터양: 약 1.296TB
  • 비용: 약 44.49 USD/월

 

'Cloud' 카테고리의 다른 글
  • [AWS] 모니터링 기초
  • [AWS] Amazon Athena
  • [AWS] Amazon CloudWatch
  • [AWS] AWS 로그 운영
SummerToday
SummerToday
summertoday 님의 블로그 입니다.
  • SummerToday
    SummerToday
    SummerToday
  • 전체
    오늘
    어제
  • 인기 글

  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
    • 글쓰기
    • 관리자
    • 분류 전체보기 (62)
      • OS & Network (4)
      • Cloud (11)
      • Container & DevOps (41)
      • Database (4)
      • Develop (0)
      • IaC (2)
  • 태그

    점프 계정
    argocd
    container
    CloudWatch
    EIP
    cloud
    K8S
    s2s vpn
    aws
    MariaDB
    gitops
    CI/CD
    Kubernetes
    계정 관리
    tailscale
    Galera Cluster
    Grafana
    AmazonSNS
    openebs
    Eni
  • hELLO· Designed By정상우.v4.10.3
SummerToday
[AWS] Amazon Kinesis
상단으로

티스토리툴바