ablog

不器用で落着きのない技術者のメモ

AWS認定 Machine Learning Engineer - Associate (MLA-C01)勉強メモ

機械学習
  • ラベルの比率の差 (DPL: Difference in Proportions of Labels)

ラベルの比率の差 (DPL) は、トレーニングデータセット内のファセット d の正のラベルを持つ観測結果の比率と、ファセット a の正のラベルを持つ観測結果の比率を比較します。例えば、これを使用して、金融ローンの承認を得た中高年者 (ファセット a) と他の年齢層 (ファセット d) の比率を比較できます。機械学習モデルは、トレーニングデータの決定をできるだけ忠実に模倣しようとします。そのため、DPL が高いデータセットでトレーニングされた機械学習モデルは、将来の予測で同じ不均衡を反映する可能性があります。

ラベルの比率の差 (DPL) - Amazon SageMaker AI
Glue Data Brew

AWS Glue DataBrew では、一連のデータ変換ステップをレシピといいます。AWS Glue DataBrew レシピには読み取り済みデータの変換方法は規定されていますが、データを読み取る場所と方法、およびデータを書き込む場所と方法は記載されていません。これは、AWS Glue Studio のソースノードとターゲットノードで設定します。

AWS Glue Studio で AWS Glue DataBrew レシピをインポートする - AWS Glue
SageMaker
  • Amazon SageMaker Experiments

Amazon SageMaker Experiments」はざっくり言うと「実験結果の管理をサポートする」機能です。
機械学習のモデルを開発している時は色々な実験をして結果を比較して、といった工程が発生するのでこの管理が簡単にできると嬉しいですよね。

Amazon SageMaker Experimentsを試してみた #reinvent | DevelopersIO
  • Amazon SageMaker Model Cards

Amazon SageMaker Model Cards を使用して、機械学習 (ML) モデルに関する重要な詳細を 1 か所に文書化して、ガバナンスとレポート作成を合理化します。モデルカードは、モデルのライフサイクル全体を通じてモデルに関する重要な情報をキャプチャし、責任ある AI プラクティスを実装するのに役立ちます。

モデルの使用目的とリスク評価、トレーニングの詳細とメトリクス、評価結果と所見、考慮事項、推奨事項、カスタム情報といったその他の注意事項などの詳細情報をカタログ化します。モデルカードを作成すると、次のことが可能になります。

  • モデルの使用方法に関するガイダンスを提供します。
  • モデルのトレーニングとパフォーマンスの詳細な説明を提供して、監査活動をサポートします。
  • モデルがビジネス目標をどのようにサポートするのかを伝えます。

モデルカードは、文書化する情報についての基準となる指針を提供し、ユーザー設定情報のフィールドを含めます。モデルカードを作成したら、PDF にエクスポートしたり、ダウンロードして関係者と共有したりできます。モデルカードに対して承認ステータスの更新以外の編集を行うと、モデル変更の記録を残すためにモデルカードのバージョンが追加されます。

Connect to SageMaker AI through a VPC interface endpoint
The SageMaker API and SageMaker AI Runtime support Amazon Virtual Private Cloud (Amazon VPC) interface endpoints that are powered by AWS PrivateLink. Each VPC endpoint is represented by one or more Elastic Network Interfaces with private IP addresses in your VPC subnets. For example, an application inside your VPC uses AWS PrivateLink to communicate with SageMaker AI Runtime. SageMaker AI Runtime in turn communicates with the SageMaker AI endpoint. Using AWS PrivateLink allows you to invoke your SageMaker AI endpoint from within your VPC, as shown in the following diagram.

AWS Code シリーズ
  • AWS CodeBuild

AWS CodeBuild は、 クラウドでのフルマネージドビルドサービスです。CodeBuild はソースコードコンパイルし、単体テストを実行して、すぐにデプロイできるアーティファクトを生成します。CodeBuild では自分のビルドサーバーをプロビジョニング、管理、スケールする必要がありません。Apache Maven、Gradle などの一般的なプログラミング言語とビルドツール用のパッケージ済みのビルド環境を提供します。ビルド環境をカスタマイズして、CodeBuild で独自のビルドツールを使用することもできます。CodeBuild はピーク時のビルドリクエストに合わせて自動的にスケーリングします。
CodeBuild には、以下のような利点があります。

  • 完全マネージド型 – CodeBuild では、お客様独自のビルドサーバーをセットアップ、パッチ適用、更新、管理する必要がありません。
  • オンデマンド – CodeBuild はビルドのニーズに合わせてオンデマンドでスケールされます。料金は、使用したビルド分数に対してのみ発生します。
  • すぐに利用可能 – CodeBuild は、最も一般的なプログラミング言語用に事前設定されたビルド環境を提供します。最初のビルドを開始するには、ビルドスクリプトを指すだけです。
とは AWS CodeBuild - AWS CodeBuild