Amazon Pollyとは?


Amazon PollyはAmazon Web Services(AWS)上で実行されるテキストを音声データに変換するサービスです。Amazon Pollyは、文字認識テクノロジー(文字を音声に変換するテクノロジー)を使ってテキストをスピーチに変換し、驚くほどうまくテキストを聞こえるようにします。

Amazon Pollyを用いることで、フレーズから小説の朗読までの様々な用途に使うことができます。また、AWS SDKを使用してAmazon Pollyを簡単にインテグレートできるので、どんなサービスにも簡単に統合することができます。

Amazon Pollyを使った開発例


Amazon Pollyを使用して開発するために最初に必要なのは、Amazon Pollyがサポートする言語でテキストを書くことです。Amazon Pollyは英語、スペイン語、フランス語、ドイツ語、イタリア語、そしてポルトガル語をサポートしています。

次に、AWS SDKとAWS CLIを使ってAmazon Pollyにテキストを渡して、音声データを受け取ります。以下のサンプルソースコードを用いて、Amazon Pollyにテキストを渡す方法を実現していきましょう。

# 指定したテキストを渡して、Amazon Pollyから音声データを取得する
response = polly.synthesize_speech(Text='Hello World!', OutputFormat='mp3', VoiceId='Joanna')

# レスポンスを音声ファイルに書き込む
with open('hello_world.mp3', 'wb') as f:
f.write(response['AudioStream'].read())
f.close()


Amazon Pollyを使えば


Amazon Pollyを使えば、テキストを音声に変換してアプリなどのサービスに統合することができます。 例えば、翻訳サービスを開発するのに役立つAmazon Translateがありますが、Amazon Pollyを使って多言語音声を作成して、この翻訳サービスのフロントエンド体験を改善することができます。

また、モバイルゲームなどを開発する場合は、Amazon PollyとAmazon API Gatewayを使うことで、リアルタイムでリクエストを処理してサービスを改善することも可能です。

まとめ


Amazon Pollyはいくつかのサービスを使って、テキストをすぐに音声に変換することができる AWS 上のサービスです。仕組みを理解すると、リアルタイムで音声を生成してアプリなどの体験を改善するための用途や、マーケティングプロモーションや教育などの用途など、柔軟に使うことが可能です。

投稿者: systemreach_engineer