
こんにちは!AIサービス開発室の鈴木生雄です。ここ数日の間にLLM(大規模言語モデル)に関する興味深いニュースが続きましたね。
ChatGPT Canvas の機能アップデート(1/25)
Open AI が昨年12/5~20にかけて、「12 Days of OpenAI」というイベントで発表したとおりに、Canvasの新機能や新モデルをリリースするのより少し早く、DeepSeekがR1をリリースしてくるあたりがLLMの開発競争が熾烈であることを物語っていると思いました。こうしたハイパースケーラーたちによる競争が激化することで、LLMの精度が上がり、利用料金が安くなるとそれを活用したいろんなサービスが出てきます。まさに今はそのような時期に差し掛かっているのではないかと思います。そのため、雨後の筍のようにいろんなサービスが登場していて、私を含めて何を使ってよいのかわからない人がたくさんいるのではないでしょうか。
しかし、今後、AIの活用を前提としたビジネスモデルが次々に登場してくるはずですので、今のうちからAIをビジネスにどう活かすか考えたり、試したりすることは全てのビジネスパーソンがやっておいた方が良いことだと思います。要は、よくわからないからといって手をこまねいているのではなく、とにかく手を動かしてみましょうってことです。
作りたいものの概要とモチベーション
というわけで、私はAIを活用したツールを作ることにしました。作りたいものは「私的気になるAIニュース解説podcast生成ツール」です。(ネーミングがいまいちですが、よいのが思いつきませんでした…。)日頃、私はAI関連のニュースを主にX、ChatGPT Tasks、週刊 Life is beautiful(中島聡さんのメルマガ) から収集しています。私はこのニュースを読んで未来を想像するのが楽しいなと感激することが多いので、他の人にも同じ感激を味わってもらいたいと考えました。しかし、ニュースによってはコンピューター科学や深層学習の知識がないと理解するのが難しいものもあります。そこで、特に私が気になったニュースについてそうした知識がない人にもわかるように易しく解説するPodcastを作りたいと考えました。
余談ですが、ChatGPT Tasks は指定した時間にChatGPTがタスクを実行してくれる機能です。私は以下のプロンプトを登録して毎日ChatGPTに生成AIに関するニュースを通知してもらっています。ちなみに、通知はメールとアプリで受け取れます。
毎日、日本時間のAM9時に前日または当日の生成AIに関するニュースを検索して箇条書きで知らせてください。
実現のイメージ
下図の流れで、ニュースに関する情報を入力するとそれをわかりやすく解説する音声ファイルを出力するプログラムを作成します。自動的にPodcast配信プラットフォームにアップロードすることも考えましたが、音声ファイルの内容を確認して修正したい場合があると思ったのでとりあえず今回のスコープからは外すことにしました。登場人物は利用者(=私)、AIエージェント(=作成するプログラム)、LLM、テキスト音声変換ツールの四者です。
ポイントは以下の二つを満たすプロンプトをAIエージェントで組み立てられるようにすることです。
- 利用者の入力を最小限で済ませられるようにする(例えば、ニュース記事のURLと簡単な追加指示くらい。)
- 台本が音声テキスト変換ツールの入力に適した形で出力されるようにする
なお、今のところ利用技術としては、プログラミング言語はTypeScript、AI AgentフレームワークはGraphAI 、LLMはChatGPT o3-mini、音声テキスト変換ツールはVOICEPEAK を採用しようと思っています。個人的にGraphAIは使ったことがないので挑戦してみたいと思いました。(正直言って、使わなくてもよさそうなのですが…。)そして、GraphAIがTypeScriptで実装されているため、プログラミング言語も同じく使ったことがないTypeScriptに自動的に決まりました。あと、Podcastの配信プラットフォームはSpotifyにしようかなと思っていますが、この辺りも含めて、進めていくうちに変わるかもしれません。
しばらくプログラミングはしていないので、だいぶなまっていると思いますが、半年くらい時間をかけて勘を取り戻しつつ作っていこうと思います。制作過程はブログに投稿していこうと思いますので、温かく見守ってくれるとうれしいです。
Enjoy programming !