はじめに
「機械学習やAIを自社サービスに取り入れたいが、どこから始めればいいかわからない」と感じている企業の担当者は少なくありません。AIモデルの開発には、データの準備・前処理から始まり、モデルの設計・学習・評価、本番環境へのデプロイと運用まで多くの工程が必要です。それぞれの工程で専用インフラの整備や専門知識が求められるため、社内リソースだけでは対応しきれないケースも多いのが実情です。
そうした課題を解決するのがAmazon SageMakerです。機械学習のライフサイクル全体をクラウド上でカバーするフルマネージドサービスであり、データサイエンティストから機械学習エンジニア、ビジネスアナリストまで幅広いユーザーが活用できます。
2024年12月には「AWS re:Invent 2024」で次世代プラットフォームとして大幅刷新され、従来のAI・ML開発機能にデータ分析・BI・データレイクハウスまでを統合した包括的なプラットフォームへと進化しました。本記事では、その基本概念・機能・料金・Bedrockとの違い・活用事例までを公式情報をもとに解説します。
Amazon SageMakerとは
Amazon SageMakerとは、Amazon Web Services(AWS)が提供するフルマネージド型のデータ・分析・機械学習・生成AI開発プラットフォームです。2017年のサービス開始以来、世界中の企業でAI・ML開発の基盤として採用されてきました。
AWSの公式説明によれば、「広く採用されているAWSの機械学習(ML)と分析機能をまとめた次世代のAmazon SageMakerは、すべてのデータに対する統合アクセスとともに、分析とAIのための統合エクスペリエンスを提供する」とされています。機械学習モデルの構築・学習・デプロイというML開発のコア機能を中核に持ちながら、データ準備・ETL・SQL分析・BI・生成AIアプリ開発まで一気通貫でカバーする「AI・データ活用のオールインワンプラットフォーム」です。
2024年12月の大型アップデート
2024年12月に開催された「AWS re:Invent 2024」で、Amazon SageMakerとは次世代プラットフォームとして大幅に刷新されました。主なポイントは以下の3点です。
① 従来のSageMakerが「SageMaker AI」に改称 機械学習モデルの構築・学習・デプロイを担う、いわゆるML開発のコア機能が「Amazon SageMaker AI」として再定義されました。従来の主要機能はそのまま継承されています。
② SageMakerがデータ・AI統合プラットフォームに進化 刷新後の「Amazon SageMaker」は、SageMaker AIに加え、統合開発環境の「SageMaker Unified Studio」、データレイクハウスの「SageMaker Lakehouse」、ノーコードMLツールの「SageMaker Canvas」などを内包する上位の次世代プラットフォームになりました。これまでバラバラのサービスで行っていたデータの準備(ETL)・機械学習モデルの開発・SQL分析・BIダッシュボードの構築を、一つの統合開発環境でシームレスに行えます。
③ SageMaker HyperPodにフレキシブルトレーニングプランが追加 タイムラインと予算内で生成AIモデルをトレーニングできる新機能が追加され、モデルトレーニングの費用・期間の予測精度が向上しました。
刷新後の5つのコンポーネント
| コンポーネント | 役割 |
|---|---|
| SageMaker AI | MLモデルの構築・学習・デプロイを担うコア機能(従来のSageMakerを継承) |
| SageMaker Unified Studio | データ処理・SQL分析・ML開発・生成AI構築を一つの画面で行える統合IDE |
| SageMaker Lakehouse | S3・Redshift・サードパーティデータを統合するデータレイクハウス |
| SageMaker Canvas | ノーコードでMLモデルを構築できるビジュアルツール(ビジネスアナリスト向け) |
| SageMaker HyperPod | LLM・基盤モデルの大規模分散トレーニングに特化したクラスター管理サービス |
Amazon SageMakerでできること
ここからは、Amazon SageMakerでできることを解説します。
データの準備・前処理
機械学習の品質はデータの質に大きく左右されます。SageMaker Data Wranglerを使えば、300以上のデータ変換機能をGUI上で操作でき、コードを書くことなくデータのクレンジング・変換・可視化・品質検証ができます。S3・Redshift・Athena・外部SaaSなど多様なデータソースへの接続も可能です。
MLモデルの構築・実験・自動化
SageMaker StudioはJupyterLabベースの統合開発環境(IDE)です。TensorFlow・PyTorch・scikit-learnなど主要なMLフレームワークを使って自由にモデルを開発できます。またSageMaker Canvasに統合されたAutoML機能を使えば、データを入力するだけでアルゴリズム選定・ハイパーパラメータ調整・モデル評価までを自動化でき、機械学習の専門知識がなくても高精度なモデルを構築できます。
大規模モデルのトレーニング
SageMaker Trainingは、1台から数千台のGPUまでインフラを自動スケールし、大規模なモデルのトレーニングをフルマネージドで実行します。トレーニング完了後はインスタンスが自動解放されるため、GPUの停止し忘れによるコスト超過が構造的に防止されます。大規模言語モデル(LLM)や基盤モデル(FM)のトレーニングにはSageMaker HyperPodが特に有効で、GPU障害を自動検知・修復し、数週間〜数ヶ月にわたるトレーニングを中断なく継続できます。
モデルのデプロイと推論
学習済みモデルをREST APIとして本番環境に展開する機能も充実しています。リアルタイム推論・サーバーレス推論・バッチ推論・非同期推論の4つのデプロイ方式から、ユースケースに応じて最適なものを選択できます。特にサーバーレス推論はトラフィックが断続的なケースでコストを大幅に削減できます。
ノーコードMLと生成AI活用
SageMaker Canvasは、プログラミングなしでMLモデルを構築できるノーコードツールです。ビジネスアナリストや現場担当者でも機械学習を活用できる「AIの民主化」を実現します。SageMaker JumpStartにはLlama・Mistral・Stable Diffusionなど人気の基盤モデルのカタログが用意されており、ワンクリックでデプロイ・ファインチューニングが可能です。
MLOps・監視・ガバナンス
SageMaker PipelinesでML開発のCI/CDパイプラインを自動化し、SageMaker Model Monitorでデプロイ後のモデルの精度劣化(データドリフト)をリアルタイム検知できます。SageMaker Clarifyはバイアス検出や予測根拠の可視化(SHAP値)に対応し、責任あるAI開発をサポートします。
Amazon SageMakerのサービス一覧
| カテゴリ | サービス名 | 概要 |
|---|---|---|
| データ準備・管理 | SageMaker Data Wrangler | GUIベースのデータ変換・クレンジング・可視化 |
| データ準備・管理 | SageMaker Feature Store | 学習・推論で共通利用できる特徴量の管理・再利用基盤 |
| データ準備・管理 | SageMaker Lakehouse | S3・Redshift・外部データを統合するデータレイクハウス |
| 開発環境 | SageMaker Unified Studio | データ処理・ML・SQL・BIを一画面で行える統合IDE |
| 開発環境 | SageMaker Studio | JupyterLabベースのML開発統合環境 |
| 開発環境 | SageMaker Canvas | ノーコードでMLモデルを構築できるビジュアルツール |
| モデル学習 | SageMaker Training | フルマネージドな大規模MLモデルのトレーニング |
| モデル学習 | SageMaker HyperPod | LLM・基盤モデルの大規模分散トレーニング向けクラスター管理 |
| モデル学習 | SageMaker JumpStart | 事前学習済みモデルのカタログ(ワンクリックデプロイ対応) |
| モデル学習 | SageMaker Ground Truth | 機械学習向け教師データ作成・アノテーション管理 |
| デプロイ・推論 | SageMaker Real-Time Inference | 低レイテンシーのリアルタイム推論エンドポイント |
| デプロイ・推論 | SageMaker Serverless Inference | トラフィックが不規則なユースケース向けサーバーレス推論 |
| デプロイ・推論 | SageMaker Batch Transform | 大量データの一括バッチ推論 |
| MLOps・監視 | SageMaker Pipelines | MLワークフローのCI/CD自動化パイプライン |
| MLOps・監視 | SageMaker Model Monitor | 本番モデルのデータドリフト・精度劣化のリアルタイム監視 |
| MLOps・監視 | SageMaker Clarify | バイアス検出・説明性分析・責任あるAI支援 |
Amazon SageMakerの料金体系
Amazon SageMaker AIでは、使用した分についての料金のみをお支払いいただきます。最低料金や前払いの義務はなく、オンデマンド料金と、一定使用量の確約と引き換えに割引が受けられるSavings Plansの2つの支払い方式があります。
無料枠(AWS Free Tier)
申し込み後最初の2ヶ月間は無料枠でSageMakerを試せます。主な無料枠の内容は以下の通りです。
- SageMaker Studio Notebook(ml.t3.medium):月250時間
- SageMakerトレーニング(ml.m5.xlarge):月50時間
- SageMakerデプロイ・ホスティング(ml.m5.xlarge):月125時間
- SageMaker Data Wrangler(ml.m5.4xlarge):月25時間
PoCや初期検証であれば、ほぼコストをかけずに進められます。
コスト削減の主要オプション
① SageMaker Savings Plans(最大64%削減) 1年または3年の期間で一定の使用量(USD/時間)を確約する代わりに、オンデマンド料金から最大64%割引が受けられる柔軟な料金モデルです。Studio Notebook・Training・Real-Time Inferenceなど対象サービスに自動適用されます。インスタンスのリージョンやタイプをまたいで柔軟に使えるため、ワークロード構成が変わっても割引が継続します。
② スポットインスタンス活用(最大90%削減) SageMaker TrainingはEC2のスポットインスタンスを使った「Managed Spot Training」に対応しており、オンデマンド価格から最大90%の割引が可能です。スポットインスタンスが中断された場合も、チェックポイントから自動再開する仕組みが備わっています。
③ サーバーレス推論の活用 トラフィックが断続的なユースケースでは、常時起動のエンドポイントではなくSageMaker Serverless Inferenceを活用することでコストを削減できます。アイドル時は課金されず、リクエストが来たときだけコンピューティングが起動します。
なお料金はリージョンによって異なります。東京リージョンはUS East(バージニア北部)と比較して10〜30%程度高い場合があります。最新・正確な料金はAWS公式料金ページで必ずご確認ください。
参考:Amazon SageMaker AI の料金(AWS公式)
Amazon SageMakerとAmazon Bedrockの違い
AWSのAIサービスを検討する際、「SageMakerとBedrockの違いは何か、どちらを使うべきか」という疑問はよく挙がります。AWS公式ドキュメントでは、両者はAWSのAIスタックにおいて異なる層に位置すると整理されています。
AWSのAI階層構造における位置付け
AWSのAIスタックは3層で構成されます。最下層が「AIモデルを構築・トレーニングするためのインフラ層」、中間が「生成AIアプリを構築するためのモデル・ツール層」、最上層が「LLMなどを活用して生産性を向上するアプリケーション層」です。Amazon SageMaker AIはインフラ層(モデルを作る・鍛える)、Amazon Bedrockはモデル・ツール層(モデルを使う・組み込む)に位置します。
※ 関連記事: Amazon Bedrockとは?特徴・基盤モデル・料金・活用事例3選までわかりやすく解説
SageMaker AIとAmazon Bedrockの比較表
| 比較項目 | Amazon SageMaker AI | Amazon Bedrock |
|---|---|---|
| 主な用途 | カスタムMLモデルの構築・学習・デプロイ | 基盤モデルをAPIで呼び出して生成AIアプリを開発 |
| 主な対象ユーザー | データサイエンティスト・MLエンジニア | アプリ開発者・ビジネスユーザー |
| 必要な専門知識 | 機械学習の深い知識が必要 | MLの深い知識がなくても利用可能 |
| モデルの柔軟性 | カスタムモデルをゼロから構築・ファインチューニング | Claude・Llama等の既成基盤モデルをAPI利用 |
| インフラ管理 | インスタンス選定・管理が必要 | インフラ管理不要(フルマネージド) |
| コスト構造 | インスタンス使用時間で課金 | APIトークン数で課金 |
| AWSスタックの位置 | インフラ層(モデルを作る・鍛える) | モデル・ツール層(モデルを使う・組み込む) |
どちらを選ぶべきか
Amazon Bedrockが向いているケースは、既製の基盤モデルをすぐにアプリに組み込みたい場合、テキスト生成・要約・Q&AなどのユースケースをRAGシステムやAIエージェントとして短期間で実装したい場合、MLの専門エンジニアがいない・インフラを触りたくない場合です。
Amazon SageMakerが向いているケースは、独自データを使ってカスタムモデルをゼロから構築・学習させたい場合、自社データでファインチューニングして特化モデルを作りたい場合、ML開発からデプロイ・監視までMLOps全体を自社で管理したい場合、データ準備・ETL・分析・ML開発を統合した基盤を構築したい場合です。
なお両者は排他的ではなく、「SageMaker AIでカスタムモデルを学習し、BedrockのRAGと組み合わせてアプリを開発する」といった組み合わせ活用も一般的です。
Amazon SageMakerの活用事例3選
ここでは、Amazon SageMakerの活用事例を3選紹介します。
リコー:SageMakerでLLMを活用した独自AIモデルを3ヶ月で開発

背景と課題
株式会社リコーは、複合機・プリンターをはじめとするオフィス機器からデジタルサービスまで幅広い事業を展開するグローバル企業です。業務効率化や新サービス創出を加速するため、独自の大規模言語モデル(LLM)を活用したAIモデルの内製開発に取り組みました。
SageMaker活用のポイントと効果
AWS公式の導入事例によると、リコーはAmazon SageMakerを利用し、大規模言語モデル(LLM)を活用した独自のAIモデルをわずか3ヶ月で開発しました。SageMaker AIのフルマネージドなトレーニング環境とJumpStartの事前学習済みモデルを組み合わせることで、GPUクラスターの管理・構築の工数を大幅に削減。MLエンジニアがモデル設計とデータ品質向上に集中できる環境が短期開発を実現した鍵となっています。
- 独自LLMを活用したAIモデルを3ヶ月で開発・リリース
- 社内業務に特化した高精度なAIモデルを実現
- インフラ自動管理により、MLエンジニアがモデル開発に専念できる体制を構築
JFEスチール:SageMaker AIを中核とした製鉄プロセスのCPS開発基盤を構築

背景と課題
JFEスチール株式会社は、日本有数の総合鉄鋼メーカーです。研究開発部門では製鉄プロセスの最適化・品質予測・設備保全にAIを活用するCPS(サイバーフィジカルシステム)の開発に取り組んでいましたが、共有環境でのライブラリ競合や環境構築の煩雑さ、実験の再現性不足が課題でした。
SageMaker活用のポイントと効果
JFEシステムズとAWSの3社協業で進められたこのプロジェクトでは、SageMaker AIを中核に以下の課題を解決しました。研究者ごとの個別インスタンスでライブラリ競合を解消し、GPUドライバやフレームワークの手動セットアップを不要にし、SageMaker Trainingがハイパーパラメータやモデルの格納場所を自動記録することで実験の再現性を向上させました。今後はAWS IoT Greengrassとの統合により、開発したモデルを製鉄所のエッジサーバーへ配信してリアルタイム推論を行う計画も進んでいます。
- 研究者ごとの独立した開発環境を実現し、ライブラリ競合問題を解消
- GPU環境のセットアップ時間を大幅短縮
- 実験の自動記録により再現性が高いAI開発体制を構築
- エッジへのモデル配信を含む、製造業向けCPSの先進モデルを実現
Perplexity:SageMaker HyperPodでLLMトレーニングを40%高速化

背景と課題
Perplexity AIは、引用付きで情報を回答するAI検索エンジンを提供する米国のスタートアップです。急成長するサービスを支えるLLMの高速・高精度なトレーニングが事業の鍵を握っており、スケーラブルで障害に強いMLインフラが必要でした。
SageMaker活用のポイントと効果
AWS公式のカスタマーボイスによると、Perplexityは高性能LLMを構築するために適切なMLインフラを探していました。いくつかの実験を成功させた後、SageMaker HyperPodを使用するために他のクラウドプロバイダーからAWSに切り替えました。SageMaker HyperPodはクラスターの状態を自動的に監視してGPU障害を修正するため、開発者はインフラの管理・最適化に時間を費やすことなくモデル構築に集中できます。組み込みのデータおよびモデル並列ライブラリがトレーニングスループットを倍増させ、トレーニング実験を2倍速く実行できるようになりました。
- 他クラウドプロバイダーからAWSへ移行し、LLMトレーニング速度を40%向上
- GPU障害の自動修復により、長期トレーニングを中断なく継続
- トレーニングサイクルが2倍速くなり、モデル品質の改善スピードが大幅向上
- インフラ管理の負担が減り、開発チームがモデル設計・データ改善に専注
参考:Amazon SageMaker AIのお客様:Perplexity(AWS公式)
Amazon SageMaker導入・AI開発を支援するHBLABのサービス
Amazon SageMakerは機能が非常に多岐にわたるため、「どこから手をつければいいかわからない」「社内にMLエンジニアがいない」「PoCをスピーディに進めたい」という企業様も多くいらっしゃいます。
HBLABは、ベトナムに開発拠点を持つITソリューションカンパニーとして、AWS上でのAI・機械学習開発支援に豊富な実績を持ちます。Amazon SageMakerを使ったMLモデルの構築・トレーニング・デプロイから、MLOpsパイプラインの整備、データ基盤(Lakehouse)の設計、生成AIアプリの開発まで、プロジェクトのフェーズや規模に応じてワンストップでサポートします。「まずPoC検証から始めたい」「LLMのファインチューニングで社内特化モデルを作りたい」「AI内製化を進めたいがノウハウが足りない」といったご相談まで幅広く対応しています。初回のご相談は無料ですので、お気軽にお問い合わせください。
まとめ
本記事では、Amazon SageMakerについて基本概念から最新情報まで体系的に解説しました。要点を改めて整理します。
Amazon SageMakerとは、MLモデルの構築・学習・デプロイを中核に、データ準備・ETL・分析・生成AI開発まで一気通貫でカバーするAWSのフルマネージドプラットフォームです。2024年12月の次世代化により、SageMaker AI・Unified Studio・Lakehouse・Canvas・HyperPodの5コンポーネントで構成されるようになりました。
AI・ML活用を本格化させたい企業にとって、Amazon SageMakerは非常に強力な選択肢です。まずは無料枠を活用したPoC検証から始め、成果が見えたら本格導入へとステップアップするアプローチをお勧めします。導入の進め方や設計方針でお悩みの際は、ぜひHBLABへお気軽にご相談ください。







