
2025年7月11日
ど~も。うさノリブログです。
今回はAWSでのデータ分析サービス
Amazon Athenaについて
ゆるりお話ししていきましょう♪
「S3に保存した大量のデータを簡単に分析したい」
「インフラを用意せずにSQLでデータを検索したい」
そんなニーズに応えるサービスが、Amazon Athena(アテナ) です。
本記事では、Athenaの基本から使い方、活用シーン、
料金体系まで、初心者にもわかりやすく解説します。
Amazon Athenaとは?
Amazon Athena とは、Amazonが提供する
サーバーレスのインタラクティブクエリサービス です。
S3に保存された構造化・半構造化データ(CSV, JSON, Parquet など)
に対して、標準的なSQLで直接クエリを実行できます。
一言でいうと
Athenaは「S3にあるデータにSQLで直接アクセスできるデータ分析ツール」です。
特徴とメリット

特徴 | 説明 |
---|---|
サーバーレス | サーバー構築・管理は 一切不要。即利用可能 |
SQLで操作可能 | 標準的なANSI SQLに対応 |
S3と連携 | S3に保存されたデータを 直接クエリ可能 |
高速でスケーラブル | クエリごとに最適な リソースが割り当てられる |
他サービスと連携 | Glue, QuickSight, Lambdaなどと統合可能 |
よくあるユースケース
ユースケース | 内容 |
ログ分析 | CloudFrontやELB、VPC などのアクセスログを集計 |
データレイク構築 | S3に保存されたデータを Athenaで抽出・分析 |
IoTデータの集計 | 時系列データを分析して 可視化 |
BI連携 | QuickSightなどのBIツール と接続してレポート化 |
Athenaの基本構成
- S3バケット:データの保存場所
- Glue Data Catalog:メタデータ(スキーマ)
を定義する - クエリエンジン:SQLクエリを実行する部分
データフロー例
S3に保存されたCSV → Glueでスキーマ登録 → AthenaでSQL実行
Athenaの使い方(基本ステップ)
1. データの準備
S3にCSVやJSON形式でデータをアップロード
しておきます。
2. Glue Data Catalogでテーブル作成
Athenaはデータ構造(カラム名、型など)を
理解するため、Glueを使ってスキーマを登録します。
CREATE EXTERNAL TABLE IF NOT EXISTS logs (
timestamp string,
ip string,
status int
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
WITH SERDEPROPERTIES (
'serialization.format' = ','
)
LOCATION 's3://my-logs-bucket/logs/';
3. SQLクエリの実行
SELECT status, COUNT(*)
FROM logs
GROUP BY status;
4. 結果の確認と保存
Athenaのコンソール上で結果が表示され、
CSVなどでエクスポート可能です。
対応フォーマット
Athenaはさまざまなデータ形式に対応しています。
- CSV
- TSV
- JSON
- Parquet
- ORC
- Avro
ParquetやORCなどの列指向フォーマットを使うと、
クエリ速度が向上し、料金も節約できます。
Athenaと他AWSサービスとの連携
サービス | 連携内容 |
AWS Glue | データカタログでテーブル の定義 |
Amazon QuickSight | BIダッシュボードを作成 して可視化 |
Amazon S3 | データの保存先 |
AWS Lambda | 自動的にAthenaクエリを 実行するワークフロー |
Amazon CloudWatch | クエリログの監視や 通知設定 |
料金体系
Athenaはクエリごとにスキャンしたデータ量に応じて
課金されます。
- 料金:$5/TB(スキャンしたデータ量)
- ParquetやORCなどを使うことで、スキャン量を
減らしコスト削減が可能 - クエリ結果は自動でS3に保存
(ストレージ料金も発生)
コスト節約のポイント
- 列指向フォーマット(Parquetなど)の利用
- データ圧縮(Gzipなど)
- クエリで不要なカラムを指定しない
セキュリティとアクセス制御
- IAMポリシー:
Athenaの利用者に必要な権限を付与 - S3バケットポリシー:読み書きできる範囲を制限
- 暗号化:
S3上のデータはKMSを用いて暗号化が可能 - ログ監視:CloudTrailでAthenaの操作履歴を記録
よくあるエラーと対処法
エラー | 対処法 |
HIVE_UNKNOWN_ERROR | スキーマ定義やデータ形式 が正しいか確認 |
ACCESS_DENIED | IAMロールやS3バケット ポリシーを確認 |
TABLE NOT FOUND | Glueのテーブル名とDB名 が正しいか確認 |
まとめ
Amazon Athenaは、サーバーレスで手軽に使える
データ分析ツールです。
S3に保存したデータにSQLでアクセスでき、
インフラ管理不要・高スケーラビリティという
メリットがあります。
「ビッグデータを気軽に分析したい」
「SQLに慣れているからGUIより効率的に処理したい」
そんな方にとって、Athenaは非常に有効な選択肢と
なるでしょう。
まずは無料枠を活用して、Athenaでの分析体験を
始めてみてください!
以上!今回はここまで!
コメント