私たちの生活やビジネス、あるいは業務のあり方を大きく変えようとしている生成AI。今後、生成 AI は、私たちの「相棒的な存在」や「日常生活の必需品」になる可能性を秘めています。
「教えて!あなたの生成 AI 活用術」シリーズは、生成AIを業務やプライベートで利用している日立の従業員が、創造力と技術力を生かし、おすすめの活用方法やアイデア、今後の可能性について、具体的なユースケースやエピソードとともに紹介する連載企画です。
今回は、テレビCM「日立の人」データサイエンティスト編 に出演している諸橋 政幸さんの活用術を紹介します。日立で唯一のシニアデータデザインエキスパート(データサイエンティストの技術専門職)として業務での活用に加えて、データ分析の世界的な競技コンペで数々の実績を残している Kaggle マスターならではの活用術を分かりやすく教えていただきました。
(本記事は、2023/9/29に寄稿された内容です)
諸橋 政幸(Masayuki Morohashi)
株式会社 日立製作所
Lumada Data Science Lab.
シニアデータデザインエキスパート
<Profile>
1999年入社。2012年に新設されたデータ分析で顧客課題を解決する部署に異動し、データサイエンティスト業務に従事。分析経験ゼロからスタートし、約10年間の実務経験を経て、今に至る。分析コンペ歴は約7年。Kaggle称号はMaster。Kaggle Days Championship 第3位、SIGNATE創薬コンペ優勝、Nishikaレコメンドコンペ2位入賞。著書に『Kaggleで磨く機械学習の実践力 実務×コンペが鍛えたプロの手順』。
生成AIを使い始めたきっかけと時期、また利用頻度はどのくらいですか?
2022年12月頃に、Twitter (現在のX)で話題になっていたのをきっかけに利用しはじめました。当時は「自然な会話文はまだAIでは作れない」と思っていたので、最初触ったときはものすごい衝撃でしたね。世界を巻き込んだ壮大なドッキリで、実は裏に1,000人くらいのおじさんが居て、世界から来るチャットの回答を人手で捌いているのではないか、、、そう思っていたくらい信じられなかったし、ビックリしました。
利用頻度については、本業で使っているので、使う日はめちゃくちゃ使います。ただ、チャットUIを使うことは比較的少なく、PythonコードからAPIを叩いてChatGPTを呼び出す、という使い方が主になります。
生成AIをどのような用途で活用していますか?
仕事:主に2つの用途で Azure OpenAI Service を使用
1. お客さま向けの分析サービス
日立では「データ・アナリティクス・マイスターサービス」というサービスを提供していて、お客さまの課題をデータ・分析技術を使って解決しています。これまでは統計学・機械学習・ディープラーニングといった技術を使っていましたが、これらに加えて最近は「生成AI(ChatGPT)」も活用しています。また、最近流行りの拡張機能である RAG(Retrieval Augmented Generation)を活用したPoCなどでも活用しています。
2. 自身の業務内での利用
ちょっとした調べものや、アイデア出しで利用してます。分析技術に関する論文の要約とか、コード生成にも活用しています。こちらは皆さんの使い方と同じなのではないかと思います。
プライベート:趣味で取り組む「分析コンペティション」に活用
分析コンペの有名なプラットフォームとして「Kaggle」があり、世界中のデータサイエンティストが参加し、日々モデルの精度を競い合っています。
具体的な使い方としては、コンペの問題に対して、どうやってアプローチするか、どうデータを加工するか、どんなモデルを学習させるか、といったアイデア出しに利用しています。色んな分析技術に加え、過去に行なわれたコンペの解法もChatGPTの学習データに含まれているのか、割とまともな回答が返ってくるため、相談相手として役立ちます。
また、有償版のChatGPT Plusには「Code Interpreter」という機能があります。
通常のChatGPTでは、「コード生成」はしてくれるけど、「コード実行」は行われません。このため、動かないコードが生成されることが多々あります。また、コードを実行するには、データをテキスト化してプロンプトに貼り付ける必要があります。面倒ですし、表形式のデータが崩れますし、トークン数の制約があるためあまり大きなデータは入れられません。
これに対して、「Code Interpreter」では、ChatGPT上への「データのアップロード」と「コードの実行」が出来ます。これによって、ChatGPTだけでデータ加工・集計/機械学習モデルの学習が可能になります。
さらに、この機能のすごいところは、「動かないコードが生成された場合はエラーメッセージをChatGPT自身が確認して勝手に修正する」ということ。。。。未来がやってきましたね。
この機能がどれだけすごいのかを確認するために、過去に行なわれたコンペの問題を解かせてみました。
ざっくりとした流れと結果だけを簡単に説明します。最初はデータをアップロードして、「予測してください」と伝えたところ、全然ダメなモデルが作られました。スコアも低く、「やっぱりこの程度か」と思いました。ところが、「このデータはxxxとして捉えることが出来るので、それを踏まえてモデルを作って」とか、アイデアを抽象的なレベルで伝えたところ、それを具体化してモデルを自動チューニングし、かなり高いスコアを出すことが出来ました。
正直ここまで出来るのかと驚きました。とはいえ、現状では、素のままではまだまだで、人のアイデアを加えることでやっと標準レベルに近づける程度かなと。
しかし、これだけ日々進歩しているので、近い将来、人を越していく未来が垣間見えてワクワクします。本業での分析業務でも当たり前のように使っていく未来が来るなと思いました。
生成AI を活用するメリットをどのように感じていますか?
現時点だと、「膨大な知識量」と「調査能力」がすごいなと思ってます。
ChatGPT自体は学習時点までの情報しか持たないのですが、インターネット検索機能と連携させると、必要に応じてウェブから必要な情報を自動で集めてきて回答してくれます。しかも、指示すればその結果を箇条書きしたり、表でまとめることも簡単にできます。
連携には、エージェントやプラグインを利用するのですが、まだ使ったことがない方は是非使ってみてください。きっと、最初にChatGPTを触ったときと同じくらいの衝撃を受けることができますよ。
今後、どのように生成AI を活用していきたいですか?
「Code Interpreter」の機能は今後もっと高度化していくと思っています。データサイエンティストとしては、この機能に注目せざるをえません。とてつもない速度で進化しているので、キャッチアップしつつ、うまく活用していく道を模索したいです。
関連リンク
日立の人:データ分析の世界大会で3位 生涯現役めざすデータサイエンティスト:社会イノベーション:日立 (social-innovation.hitachi)
生成AI|Lumada:日立 (hitachi.co.jp)
ChatGPTで話題の「生成AI」とは? 働き方を変える最新技術:社会イノベーション:日立 (social-innovation.hitachi)
※「ChatGPT」はOpenAI OpCo, LLCの登録商標です。
その他記載の会社名、製品名は、それぞれの会社の商標または登録商標です。