第8章. AI/ML
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
8.0 はじめに
マシンラーニング(ML)と人工知能(AI)は、現在最もホットな話題の2つだ。クラウド・コンピューティングが提供するスケールとアルゴリズムの改善により、コンピューターが人間のように考える(別名「推論を提供する」)能力が急速に進歩した。人間の介入が必要だった多くのありふれた退屈な作業も、AIのおかげで自動化できるようになった。
AIとMLはあっという間に複雑になる。それぞれについて膨大な量の文章が書かれている。この章のレシピでは、AWSが提供する実装が簡単なAIサービスのいくつかを調べ、独自のモデルの構築を始めることができる。レシピを通して作業している間、これらのテクノロジーがうまく機能する可能性のある、社会における他の問題領域について考えてみてほしい。サプライチェーンの予知保全から歌の提案まで、チャンスは無限にある。
我々はこのトピックについて100ページ書くことができたが、これらのレシピは始めるには最適であり、そこから反復することができる。より深く掘り下げたいのであれば、Chris FreglyとAntje Barth著『Data Science on AWS』(O'Reilly、2021年)をチェックすることをお勧めする。
ワークステーションの構成
CLIレシピのための一般的なワークステーションのセットアップ手順」に従って、設定を確認し、必要な環境変数をセットアップする。それから、章コード・リポジトリをクローンする:
git clone https://github.com/AWSCookbook/ArtificialIntelligence
8.1 ポッドキャストを書き起こす
問題
ポッドキャストなどのMP3ベースの音声をテキストテープ起こしを作成するには、 が必要だ。
解決策
Amazon Transcribeを使って英語の書き起こしを作成し、結果をS3バケットに保存する(図8-1参照)。
図8-1. Amazon TranscribeをMP3ファイルで使用する。
前提条件
-
S3バケット
-
jqCLI JSON プロセッサー
準備
章コードリポジトリのこのレシピのフォルダにあるステップに従う。
ステップ
-
ポッドキャストをMP3形式でダウンロードし、S3バケットにアップロードする:
curl https://d1le29qyzha1u4.cloudfront.net/AWS_Podcast_Episode_453.mp3 \ -o podcast.mp3以下のような出力が表示されるはずだ:
% Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 100 29.8M 100 29.8M 0 0 4613k 0 0:00:06 0:00:06 --:--:-- 5003k注
Amazon Transcribeでサポートされているファイル形式のリストはドキュメントで発見できる。