近年、AI技術の進化が業務の効率化やデータ分析に大きな変革をもたらしています。その中でも、OpenAI Assistantsは特に注目されています。この対話型AIモデルは、ユーザーとの対話を通じて、情報の提供や質問への回答、タスクのサポートなどを行う能力を持っています。自然言語処理技術を駆使し、企業のニーズに合わせたカスタマイズが可能なため、様々な業務シーンで活用されています。
この記事では、OpenAI Assistantsが提供する機能やその具体的な利用方法について詳しく解説します。ドキュメント検索やデータ抽出、可視化など、実際にどのようなサポートができるのかを具体的なユースケースと共に紹介し、どのように業務改善に役立つのかを探ります。興味がある方や、自社での活用を検討している方にとって、役立つ情報が見つかると思いますので、ぜひご覧ください。
ブログ作成者紹介
Vareal株式会社
名前:W.H
部署名:データサイエンス部
役職 (ポジション):データサイエンティスト
業務内容:生成AI(Chatbot)ソリューション開発、AI・データサイエンスを活用したビジネス課題の解決支援・提案など
趣味:読書、散歩
目次
- Assistantsとは?
- どんなことができるの?
- 具体的には?
- ユースケース1:社内ドキュメントの参照
- ユースケース2:社内情報への問合せ
- ユースケース3:Webテキストマイニング
- ユースケース4:合致するデータの抽出
- ユースケース5:データの可視化
- Assistantsの利用料
- トークンってなに?
- おわりに
Assistatsとは?
OpenAI Assistantsは、OpenAIが開発した対話型AIモデルのことを指します。これらのアシスタントは、自然言語処理技術を使用して、ユーザーと対話し、質問に答えたり、情報を提供したり、タスクをサポートしたりします。
たとえば、ChatGPTもその一部。ユーザーの質問に答えたり、助言を提供したり、様々なトピックについて会話をすることができます。OpenAI Assistantsは、特定のタスクや目的に合わせて調整されることが多く、企業や開発者が自分たちのニーズに合わせてカスタマイズして利用することができます。
どんな事ができるの?
Assistantsには、質問回答や文章作成、会話をサポートするカスタマイズ機能として、File searchやCode interpreterがあります。
たとえば、File searchはアップロードしたドキュメント内の情報を検索&抽出する事ができ、Code interpreterはアップロードしたテーブルデータ(CSV)から特定の数値を抽出したり、数値データを集計して二次元マップで可視化することができます。
具体的には?
Assistantsでどのような事ができるのか?今回は、具体的な5つのユースケースをご紹介します。
ユースケース1:社内ドキュメントの参照
アップロードファイル(ex. 設計仕様書など)を参照して、ユーザーからの質問にChatbotが回答するケース。以下の例では、自動車のフロントガラスに運転情報(速度やナビゲーション指示など)を投影するHUD(ヘッドアップディスプレイ)のドキュメントを参照して、製品概要と設計仕様を回答しています。
ユースケース2:社内情報への問合せ
エージェント(Chatbot)にインプットした社内情報を抽出するケース。以下の例では、「社内体制を教えて」という大まかな質問に対して、各部門の担当者と役割、連絡先(内線番号)を回答しています。
ユースケース3:Webテキストマイニング
エージェントがウェブサイトのテキストデータから有用な情報を抽出し、回答を生成するケース。以下の例では、企業HPのテキストデータを抽出し、事業内容の要約とリンクの回答を生成しています。
ユースケース4:合致するデータの抽出
CSV形式のアップロードファイル(ex. 製品寸法や物性値など)から、特定条件に合致するデータを抽出するケース。以下の例では、部品データの表から150℃以上の高耐熱性があるものを抽出しています。
ユースケース5:データの可視化
特定条件に合致する数値データを集計したり、その結果をグラフやチャートで可視化するケース。以下の例では、エンジンの回転数と速度の関係をチャート(二次元マップ)で生成しています。(ダウンロードも可能)
Assistantsの利用料
今回ご紹介させて頂いた「OpenAI Assistants」は、100万トークン単位での利用料が発生します。言語モデル(LLM)は複数ありますが、現時点では「GPT-4o mini」が最もコスト効率の高い小型モデル(安価で高性能)になっています。(2024年8月現在)
さらに、ツール(Code Interpreter, File search)の使用には、以下の料金がかかります。
引用: Pricing | OpenAI (OpenAIの価格サイト)
トークンってなに?
「トークン」とは、自然言語処理で使われる基本的な単位で、APIがテキストを処理する際の計算単位です。トークンは単語や文字の一部に分割されることがあり、必ずしも単語の境界で切られるわけではありません。一般的には、記号や印、チケット、認証コードなど、特定の目的のために発行された物を指します。コンピュータサイエンスでは、プログラミングやデータ処理で情報の単位や部分を示し、セキュリティでは認証や認可のためのデジタルトークンが使用されます。
余談ですが、海外の一部の都市では公共交通機関に「トークン」が使われており、かつてニューヨーク市の地下鉄では乗車に「1トークン」が必要でした。
引用: What are tokens and how to count them? | OpenAI Help Center (OpenAIのQ&Aサイト)
おわりに
色々と説明してきましたが、OpenAI Assistantsでどのような事ができるのかがなんとなくイメージできたでしょうか?現在、弊社ではこのようなドキュメント検索や、テーブルデータからの数値抽出, 二次元マップでの可視化(グラフ化)などを行って回答を生成してくれる様なChatbotの開発に取り組んでいます。
この記事を読んで、このような機能を活用して業務を改善したい!特定の要件に合わせたソリューションが可能かどうか気になる!と思った方は、弊社でサンプルデータを使った技術検証(POC)を実施できますので、ぜひお問い合わせください。