Amazon Comprehendとは?


Amazon Comprehendは、AmazonのAIベースの機械学習サービスです。テキストから重要な文章を特定したり、意味解析をすることなどが可能です。これを使えば、様々なデータを分析するための膨大なラベル作業、単語の抽出作業などを省略して、ターゲットとなるデータを分類したり解析できます。



Amazon Comprehendの活用例


Amazon Comprehendを活用することで、自然言語のテキストを理解して人間と同じように用いることが可能になります。主に以下のような目的に使われます。

  • テキストから情報を抽出する

  • テキストを分類する

  • 関係性を分析する

  • 言語解析(パターン検出、予測、文書生成など)を行う





Amazon Comprehendを用いた開発例


Amazon Comprehendを使うと、テキストを分析して태깅(Tagging)を行い、テキストから強調された情報として取り出すことができます。具体的には、入力テキストを「InputString」として以下のようなsample codeを用います。
import os, boto3

comprehend = boto3.client(service_name='comprehend', region_name='us-east-1')
text = "InputString"

print('Calling DetectSyntax')
print(comprehend.detect_syntax(Text=text, LanguageCode='en'))

今回、InputStringに「John is the CEO of a company」と入力した場合、次のようなタグ付け結果(Part of Speech)が得られます。

  • John: PROPN

  • is : VERB

  • the : DET

  • CEO : NOUN

  • of : ADP

  • a : DET

  • company : NOUN





まとめ


本記事では、Amazon Comprehendを用いた開発について説明しました。Amazon Comprehendはテキストの解析・分類・関係性の分析などを行うことが可能なサービスで、特定の文章を抽出したり、タブの抽出や特別な情報の抽出を行うことが可能になります。更に、Amazon Comprehendを用いて入力テキストからPart of Speech毎にタグ付けし文章の分析を行うことが可能です。

投稿者: systemreach_engineer