遅咲きさんのゆるりAWS認定試験、Amazon Athenaとは?

分析

2025年7月11日

ど~も。うさノリブログです。
今回はAWSでのデータ分析サービス

Amazon Athenaについて
ゆるりお話ししていきましょう♪

「S3に保存した大量のデータを簡単に分析したい」
「インフラを用意せずにSQLでデータを検索したい」

そんなニーズに応えるサービスが、Amazon Athena(アテナ) です。

本記事では、Athenaの基本から使い方、活用シーン、
料金体系まで、初心者にもわかりやすく解説します。


Amazon Athenaとは?

Amazon Athena とは、Amazonが提供する
サーバーレスのインタラクティブクエリサービス です。

S3に保存された構造化・半構造化データ(CSV, JSON, Parquet など)
に対して、標準的なSQLで直接クエリを実行できます。

一言でいうと

Athenaは「S3にあるデータにSQLで直接アクセスできるデータ分析ツール」です。


特徴とメリット

特徴説明
サーバーレスサーバー構築・管理は
一切不要。即利用可能
SQLで操作可能標準的なANSI SQLに対応
S3と連携S3に保存されたデータを
直接クエリ可能
高速でスケーラブルクエリごとに最適な
リソースが割り当てられる
他サービスと連携Glue, QuickSight,
Lambdaなどと統合可能

よくあるユースケース

ユースケース内容
ログ分析CloudFrontELBVPC
などのアクセスログを集計
データレイク構築S3に保存されたデータを
Athenaで抽出・分析
IoTデータの集計時系列データを分析して
可視化
BI連携QuickSightなどのBIツール
と接続してレポート化

Athenaの基本構成

  1. S3バケット:データの保存場所
  2. Glue Data Catalog:メタデータ(スキーマ)
    を定義する
  3. クエリエンジン:SQLクエリを実行する部分

データフロー例

S3に保存されたCSV → Glueでスキーマ登録 → AthenaでSQL実行

Athenaの使い方(基本ステップ)

1. データの準備

S3にCSVやJSON形式でデータをアップロード
しておきます。

2. Glue Data Catalogでテーブル作成

Athenaはデータ構造(カラム名、型など)を
理解するため、Glueを使ってスキーマを登録します。

CREATE EXTERNAL TABLE IF NOT EXISTS logs (
  timestamp string,
  ip string,
  status int
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
WITH SERDEPROPERTIES (
  'serialization.format' = ','
)
LOCATION 's3://my-logs-bucket/logs/';

3. SQLクエリの実行

SELECT status, COUNT(*) 
FROM logs
GROUP BY status;

4. 結果の確認と保存

Athenaのコンソール上で結果が表示され、
CSVなどでエクスポート可能です。


対応フォーマット

Athenaはさまざまなデータ形式に対応しています。

  • CSV
  • TSV
  • JSON
  • Parquet
  • ORC
  • Avro

ParquetやORCなどの列指向フォーマットを使うと、
クエリ速度が向上し、料金も節約できます。


Athenaと他AWSサービスとの連携

サービス連携内容
AWS Glueデータカタログでテーブル
の定義
Amazon QuickSightBIダッシュボードを作成
して可視化
Amazon S3データの保存先
AWS Lambda自動的にAthenaクエリを
実行するワークフロー
Amazon CloudWatchクエリログの監視や
通知設定

料金体系

Athenaはクエリごとにスキャンしたデータ量に応じて
課金されます。

  • 料金:$5/TB(スキャンしたデータ量)
  • ParquetやORCなどを使うことで、スキャン量を
    減らしコスト削減が可能
  • クエリ結果は自動でS3に保存
    (ストレージ料金も発生)

コスト節約のポイント

  • 列指向フォーマット(Parquetなど)の利用
  • データ圧縮(Gzipなど)
  • クエリで不要なカラムを指定しない

セキュリティとアクセス制御

  • IAMポリシー
    Athenaの利用者に必要な権限を付与
  • S3バケットポリシー:読み書きできる範囲を制限
  • 暗号化
    S3上のデータはKMSを用いて暗号化が可能
  • ログ監視CloudTrailでAthenaの操作履歴を記録

よくあるエラーと対処法

エラー対処法
HIVE_UNKNOWN_ERRORスキーマ定義やデータ形式
が正しいか確認
ACCESS_DENIEDIAMロールS3バケット
ポリシーを確認
TABLE NOT FOUNDGlueのテーブル名とDB名
が正しいか確認

まとめ

Amazon Athenaは、サーバーレスで手軽に使える
データ分析ツールです。
S3に保存したデータにSQLでアクセスでき、
インフラ管理不要・高スケーラビリティという
メリットがあります。

「ビッグデータを気軽に分析したい」
「SQLに慣れているからGUIより効率的に処理したい」
そんな方にとって、Athenaは非常に有効な選択肢と
なるでしょう。

まずは無料枠を活用して、Athenaでの分析体験を
始めてみてください!

以上!今回はここまで!

コメント

Translate »
タイトルとURLをコピーしました